QualiGéoEnvi

Faciliter l’identification de la répartition et des lacunes spatio-temporelles et détecter les incohérences de localisation d’un jeu de données

Enjeux

De nombreuses bases de données environnementales contiennent des informations temporelles et géographiques (adresse, code postal, coordonnées), mais il est fréquent d’avoir des valeurs erronées ou un manque de cohérence entre ces différentes variables géographiques. L’exploitation de ces bases à des fins de croisement requiert une exploration préalable.

Sans être expert de la donnée, comment évaluer la complétude, l’homogénéité de la répartition de données spatiales et temporelles et détecter automatiquement les incohérences de localisation sur un volume potentiellement important et dans un temps de traitement court ?

Cible et solution

Besoin

Pour les ré utilisateurs des bases de données environnementales avec informations géographiques (notamment chercheurs et experts), rendre plus accessible et plus rapide le prétraitement de la donnée : rendre accessible et simplifier la réalisation d’explorations/de vérifications à effectuer sur des jeux de données à dimension géographique (cohérence des informations géographiques, de leur répartition) et la réalisation de traitements récurrents (transformation de système de coordonnées pour des croisements).

Solution

Un script/logiciel permettant de systématiser des procédures d’exploration et de montée en qualité des données géographiques dans des bases de données environnementales. Il s’agira d’élaborer 3 outils visant à évaluer la représentativité des données sur des axes géographiques et/ou temporels :
diagnostic spatio-temporel à l’aide d’un bilan de la répartition spatiale et temporelle pour évaluer la complétude des données et l’homogénéité de leur répartition
détection automatique d’incohérences de localisation en comparant les différentes informations géographiques disponibles (coordonnées, adresse, SIRET, etc.)
transformation d’un système de coordonnées pour faciliter le croisement de données

Envie de vous engager sur ce défi ?

Profils recherchés

  • data scientist
  • data analyst
  • data engineer
  • développeur fullstack
  • géomaticien
  • chef de projet / animateur

Pourquoi s’engager sur ce défi ?

Contribuer à la fiabilisation des données d’entrée de projets de recherche environnementale, et faire bénéficier les chercheurs non techniques d’un outil simple, rapide, quel que soit le volume de données.

Quel impact aura ce défi ?

Livrable(s) attendu(s)

Un script ou logiciel facilitant la mise en qualité de données géographiques dans des bases de données environnementales.

Résultat

Avant, les utilisateurs de BDD devaient vérifier de leur côté la cohérence des informations géographiques, leur répartition et réaliser si besoin une transformation de système de coordonnées pour les croiser, ce qui nécessite une maîtrise des outils de Système d’Information Géographique (SIG).
Après, l’outil permet de réaliser ces tâches de façon simple et améliore ainsi la qualité des données et des études réalisées sur ces données.

Transférabilité et pérennisation du défi

Contribuer à la fiabilisation des données d’entrée de projets de recherche environnementale.
Faire bénéficier les chercheurs non techniques d’un outil simple, rapide, quel que soit le volume de données.
Cet outil a vocation à être utilisé dans d’autres contextes, et le code source sera mis à disposition pour faciliter sa maintenance et son évolution.

1 « J'aime »