Mieux mobiliser l’historique des données de qualité de l’eau pour la recherche en épidémiologie
Enjeux
Dans le cadre d’un projet de recherche adossé à la cohorte Constances, il est prévu d’assigner aux participants de la cohorte les valeurs de divers paramètres de qualité d’eau à leur adresse résidentielle depuis l’an 2000. Le tracé vectorisé des unités de distribution de l’eau (UDI) n’étant pas millésimé et remontant au maximum à 2018, il n’est pas possible de savoir par quelles UDI sont desservis les domiciles des participants. Une autre méthode, reposant sur une liaison au point de prélèvement le plus proche, a par conséquent été mise en place.
Dans quelle mesure et comment peut-on approcher la qualité de l’eau pour les données historiques de la base SISE-Eaux ?
Cible et solution
Cible
Ce défi vise à élaborer une méthodologie d’appariement des UDI à des coordonnées géographiques, en limitant le périmètre à 3 régions (Paris, Rennes et une zone en ruralité).
Besoin
Etudes pour les chercheurs en épidémiologie : l’absence de l’historique des tracés d’UDI empêche de relier la qualité de l’eau associée aux domiciles des participants de manière historique. L’enjeu pour les chercheurs est d’évaluer la fiabilité d’une méthode alternative reposant sur l’assignation des valeurs de qualité d’eau au point de prélèvement le plus proche.
Solution
Un script (code R) permettant d’apparier les géocodes aux UDI ou aux points de prélèvement les plus proches.
Les données de comparaison, ainsi que des graphiques et indicateurs.
Il s’agira de comparer les résultats donnés par les 2 méthodologies appliqués à un ensemble de géocodes aléatoirement distribués sur le territoire français métropolitain (notamment avec des graphiques et analyses corrélationnelles).
Méthodologie dans Constances | Méthodologie de référence |
---|---|
Relier chaque géocode au point de prélèvement le plus proche, pour la bonne année selon la méthode précédente en fonction de la région, puis aux paramètres de qualité de l’eau disponibles correspondant au point de prélèvement à la bonne année | Relier chaque géocode au bon UDI dans le fichier de forme des UDI qui correspondent à des années différentes en fonction des régions (2018-2021), puis aux paramètres de qualité de l’eau de cette UDI disponibles en open access à la bonne année en fonction de la région |
Envie de vous engager sur ce défi ?
Profils recherchés
- data scientist
- data analyst
- géomaticien
- expert en réseau et qualité de l’eau
- chef de projet / animateur
Pourquoi s’engager sur ce défi ?
Aider à la diffusion et l’utilisation des données de consommation d’eau pour mener des projets de recherche en santé publique.
Quel impact aura ce défi ?
Livrable(s) attendu(s)
Script permettant de relier les deux méthodologies d’association de données de qualité de l’eau à une localisation.
Résultat
Avant, le chercheur faisait face à un problème : tablé sur les UDI, pas pu les utiliser ont utilisé une autre méthode sans connaître leur fiabilité.
Après, données fiables sur 2020 et indice de fiabilité sur leur méthode qui sera la seule à pouvoir être appliquée.
Transférabilité et pérennisation du défi
Permettre de mobiliser les données de qualité de l’eau sur une base historique.