ThinkBio

Croiser des données sur les pratiques agricoles et l’environnement pour accélérer la recherche sur l’impact de l’exposition des résidents ruraux aux produits phytosanitaires, notamment en éducation et santé

Enjeux

De nombreuses données environnementales existent dans des mailles temporelles et spatiales spécifiques. Ce défi vise à systématiser l’appariement entre bases de données à un niveau cohérent, de manière documentée et en facilitant l’expansion de ce travail d’appariement vers de nouvelles sources de données.

La finalité du projet est de permettre des analyses d’impact de l’utilisation de produits phytosanitaires sur des variables d’éducation et de santé.

Comment apparier ces données entre elles pour effectuer des comparaisons avec des données liées à la cognition (ex: résultats du brevet des collèges) ?

Cible et solution

Cible

Faciliter le croisement des différentes bases de données décrivant les pratiques agricoles en les harmonisant à une même maille géographique : celle de la commune.
L’harmonisation des données à une même maille géographique permettrait de faciliter la collaboration et le partage des données entre les différents acteurs impliqués dans la gestion des risques liés aux pratiques agricoles, notamment les professionnels de la santé, les agriculteurs, les décideurs politiques et les scientifiques. Cette collaboration est essentielle pour élaborer des stratégies efficaces de prévention et de gestion des risques pour la santé publique.
Les données concernées incluent la base de données des ventes de produits phytosanitaires, des données sur l’utilisation des sols, les pratiques agricoles, les productivités potentielles, des bio-indicateurs, des données météorologiques et hydrologiques.

Solution

Script permettant de relier entre elles les différentes bases de données liées à l’exposition aux pesticides.

Envie de vous engager sur ce défi ?

Profils recherchés

  • data scientist
  • data analyst
  • chef de projet / animateur

Pourquoi s’engager sur ce défi ?

Aider des chercheurs et experts à croiser des données sociales et environnementales à celles des produits phyto-pharmaceutiques, pour contribuer à des projets de recherche et améliorer la connaissance sur ce sujet.

Quel impact aura ce défi ?

Livrable(s) attendu(s)

Script permettant la mise à l’échelle communale de jeux de données pré-sélectionnés.

Résultat

Avant, un chercheur pouvait difficilement lier ces données pour réaliser des études.
Après, l’appariement entre ces données permet la réalisation d’études variées sur le lien entre exposition aux pesticides et proximité de l’habitat.

Transférabilité et pérennisation du défi

Ce défi peut favoriser un ensemble de travaux de recherche sur cette thématique, construction d’une brique open.

1 « J'aime »

Bonjour,

Je n’aurais malheureusement pas la possibilité de participer à l’événement de lancement qui aura lieu en fin de journée mais je souhaite tout de même prendre un moment pour réaliser une petite présentation.

Après une première expérience en tant que consultant en marketing au sein d’une agence, j’ai décidé de me reconvertir dans la data il y a maintenant deux ans. J’ai par la suite rejoint une nouvelle agence marketing mais cette fois-ci pour travailler sur des projets concernant la partie technique.

Lors de cette expériene, j’ai pu découvrir de nombreux outils, aussi bien sur la partie data analyse (Tableau, Metabase, Plotly, Seaborn, Kibana, …) que, data science (scikit-learn, nltk, beautifulsoup, …) et data engineering (Airflow, Spark, …). Dans le cadre du projet ThinkBio, j’interviendrais en tant que data analyst.

J’ai vraiment hâte que l’événement commence, de m’investir sur le projet et d’en apprendre plus sur vous. Je reste bien sûr disponible pour répondre aux éventuelles demandes.

A très vite.

Bonjour,

Merci SprinTech pour ta présentation.

Pour ma part, j’ai travaillé pendant quasiment 7 ans dans une CRO pour tester des molècules pharma après un doctorat et un post-doctorat en Neurosciences. L’année dernière, j’ai décidé de me reconvertir dans la data. J’ai terminé ma formation de data scientist en janvier. Je suis donc junior dans le domaine avec une forte envie d’apprendre et de progresser.
J’ai des compétences techniques en data analyse (pandas, seaborn, streamlit…) et en data science (scikit-learn, tensorflow, nltk…). Dans le cadre du projet ThinkBio, un rôle de data analyst m’a été attribué.

Une réunion est prévue le 13 avril à 12h00…

Hâte d’entrer dans le vif du sujet
A très vite

1 « J'aime »

Bonjour Virginie et SprinTech,

Dans le cadre de ce projet on m’a assigné le rôle de Data Engineer.
Après plusieurs années en tant qu’ingénieur système dans l’industrie aéronautique j’ai décidé de me reconvertir vers du Data Engineering. J’ai terminé ma formation en janvier également avec cette envie de mettre en pratique les outils et méthodes acquis.
J’ai donc des compétences en récupération, processing et stockage de données avec quelques connaissances en Machine Learning. Je peux également conteneuriser un projet avec Docker, mettre en place une pipeline CI/CD ou encore développer une API.

Je n’ai pas eu connaissance de réunion pour travailler sur le sujet ou comment le projet est organisé.

A bientôt !

1 « J'aime »

Bonjour Jean-Baptiste,
Je viens de t’ajouter au Slack de l’équipe ThinkBio qu’ils viennent de créer.
Bienvenue dans leur équipe !