API2Build'

Lier données de qualité d’air extérieur (QAE) et intérieur (QAI) pour étudier les liens entre concentrations de polluants

Enjeux

La qualité de l’air a un impact sur la santé. Les données de qualité de l’air intérieur (QAI) et de l’air extérieur (QAE) sont produites par des acteurs différents, sur différentes échelles géographiques et temporelles, et ne sont donc pas mises en lien, limitant ainsi les interprétations qui peuvent êre faites des mesures de QAI.

Comment récupérer les données de QAE pour un appariement spatial et temporel avec les données de QAI ? Quels sont les liens entre les concentrations de polluants de la QAI et de la QAE ?

Cible et solution

Cible

L’objectif est de récupérer ces données (QAE : Géod’Air et AAQSA, trafic routier, météo, Corine Land Cover, registre parcellaire graphique…) de façon automatique et les rattacher aux bâtiments d’intérêt pour le CSTB. Les participants au défi devront proposer des méthodes de récupération automatisées des données ouvertes (algorithme, API), une vérification de la fiabilité (nettoyage, traitement des données manquantes), puis un algorithme pour rattacher ces données sur une période donnée à un échantillon de bâtiments.

Besoins

Etudes pour les chercheurs et les acteurs publics : enrichir les études sur la qualité de l’air en prenant en compte les relations entre QAE et QAI.

Solution

Un algorithme (script d’appariement) avec en format de sortie un tableur.

Etapes de mise en œuvre :

  • Développement de méthodes de récupération automatique des données (QAE : Géod’Air et AAQSA, trafic routier, météo, Corine Land Cover, registre parcellaire graphique…) via des algorithmes, API.
  • Vérification de la fiabilité et montée en qualité (nettoyage, traitement des données manquantes).
  • Rattachement de ces données à un échantillon de bâtiments proposé par le CSTB.

Envie de vous engager sur ce défi ?

Profils recherchés

  • data scientist
  • data analyst
  • data engineer
  • développeur fullstack
  • expert métier : QAE / trafic routier
  • chef de projet / animateur

Pourquoi s’engager sur ce défi ?

Pour participer à la création d’une connaissance des sources de pollution pour mener ensuite des actions de prévention.
Pour donner un score sur la qualité de l’air intérieur en fonction des facteurs polluants extérieurs.

Quel impact aura ce défi ?

Livrable(s) attendu(s)

Algorithme (script d’appariement) avec en format de sortie un tableur. Idéalement, une interface graphique permettrait de paramétrer la requête et le script.

Résultat

Avant, il était compliqué d’obtenir des informations de QAE pour un emplacement donné, comme un bâtiment.
Après, des projets de recherche sur le lien QAE/QAI sont menés facilement.

Transférabilité et pérennisation du défi

Ce défi permettra d’enrichir les études et de mener d’autres projets en lien avec les collectivités territoriales (ex : recherche des déterminants du benzène, du N02, etc…).

1 « J'aime »

Bonjour à tous !
Je ne pourrai malheureusement pas être présente demain à l’événement de lancement, c’est pourquoi je me permets de me présenter ici. Je m’appelle Chloé et je suis actuellement en reconversion pour devenir Data Analyste. J’ai une formation de base en physique fondamentale avec un doctorat en physique des particules. L’analyse de données était déjà présente dans ma thèse et aujourd’hui, je souhaite continuer à développer mes compétences dans ce domaine afin de participer à des projets tels que celui-ci, où les données permettent de comprendre et d’agir pour rendre le monde un peu plus agréable à vivre pour le plus grand nombre de personnes.
A bientôt !

4 « J'aime »

Bonjour,

Je ne pourrai malheureusement pas être présent non plus à l’événement de lancement, mais j’ai hâte de commencer à participer à ce défi!
Je m’appelle Louis, et après 10 ans en gestion des risques, opérations et analyse, j’ai repris mes études pour effectuer une reconversion partielle en Data Science, dans le but d’œuvrer pour des projets ESG, et des entreprises souhaitant chiffrer et réduire leur impact environnemental à l’aide de la Data. C’est donc avec hâte que je souhaite commencer à participer à ce défi avec vous en tant que data scientist !

À très bientôt !

Louis

5 « J'aime »

Hello !

Pour ma part c’est Etienne, je suis data scientist freelance. J’aime bien l’idée de ce challenge, et ce projet-là en particulier me paraissait plutôt cool, et aussi intéressant techniquement :slight_smile:

J’étais au kickoff ce soir, tout le monde n’a pas pu venir mais on s’organise une réunion bientôt !

7 « J'aime »

Hello !
Au plaisir de discuter et de travailler ensemble :slight_smile:
Comment voulez vous vous organiser ?

3 « J'aime »

Bonjour à tous,

Je n’ai malheureusement pas pu suivre l’évènement de lancement non plus, mais je suis ravie de participer au projet.

Je m’appelle Astrid, je viens de finir mes études de mathématiques appliquées. J’ai fait un M2 orienté statistiques et data science. Les sujets des projets proposés m’intéressent et j’aimerais développer d’avantage mes connaissances en code et en construction de projet.

A bientôt pour une réunion !

4 « J'aime »

Bonjour à tous,

Je suis Sutha et je suis Data Scientist au CSTB. Nous sommes porteurs du projet API2Build. Je vais vous proposer un doodle pour programmer un échange avec tous les participants.

A bientôt,
Sutha

1 « J'aime »

Je remets ici le lien doodle pour planifier notre premier point d’échange : Doodle.

Et voici le lien Miro : Miro | Online Whiteboard for Visual Collaboration, où vous trouverez des fiches de présentation et un planning à compléter, ainsi que les ressources du projet (cahier des charges, données, etc.).

J’aimerais également connaître vos disponibilités pour le point de fin de pré-sprint. Vous trouverez les créneaux proposés sur le dernier lien du mail de Clément Feyt. Nous devons choisir un créneau par équipe, sur une heure du 20 au 24 avril. Avez-vous des préférences ?

1 « J'aime »

Hello !

J’ai répondu au Doodle. Et pour le point de pré-sprint, j’ai une préférence pour les 3 créneaux 13h-14h.

Bon week-end !

1 « J'aime »

Merci Etienne. Les créneaux de 13h à 14h n’étaient plus disponibles. Si besoin, je recontacterai Clément pour caler la réunion sur un créneau qui réunira un maximum de gens.
Bonne journée!
Sutha

1 « J'aime »

Bonjour,
J’étais indisponible la semaine dernière, veuillez m’en excuser ! Je viens de répondre au Doodle.
Bonne soirée !
Louis

1 « J'aime »

Bonjour Louis,
La réunion aura lieu demain à 12h, je vous ai envoyé le lien de la réunion par email.
Bonne journée,
Sutha

1 « J'aime »

Bonjour, Je viens de faire un meeting, avec Clément qui me propose de rejoindre l’équipe pour aider à l’animation, je reste à disposition :slight_smile: D’avance merci.

2 « J'aime »

Bonjour, je suis Wafa Bouzouita. Je suis Data Scientist Junior. J’ai fait aujourd’hui un meeting avec Clément, qui m’a invité à rejoindre l’équipe. J’aime bien l’idée du challenge et j’aime y contribuer. Je reste à votre disposition :slight_smile:

1 « J'aime »