Want to make creations as awesome as this one?

More creations to inspire you

Transcript

- Majeur Numérique - Projet Machine Learning

LECENE CharlyneEMBS--SCHNEIDER AdrienHUSBAND GeorgeLEROUX Adrien

13/10/2023

Introduction

- Déréglement climatique- Activités humaines- Pollution de l'environnement

2

"Dans quelle mesure pouvons nous prédire la qualité de l'air dans notre environnement ?"

Problématique

3

Qualité de l'air - AQI

- Les particules en suspension (PM2.5) : Constructions, tabagisme, démolition et risques naturels (0 à 500 ug/m3)- L'Ozone (O3) : Industries, émissions automobiles, produits chimiques et appareils électroniques (0 à 748 ug/m3)- Le dioxyde d’azote (NO2) :Production d’électricité, combustion de combustibles fossiles et industries (0 à 400 ug/m3)

Paramètres de l'AQI :

4

Source du dataset

Caractéristique du dataset

Modèle d'apprentissage

Visualisation via API

Machine Learning : étapes de taitements

5

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Source du dataset :

- Information sur la qualité de l'air dans le monde

6

Source du dataset :

- Information sur la qualité de l'air dans le monde

- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10

O3

PM2.5

CO2

6

Source du dataset :

- Information sur la qualité de l'air dans le monde

- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10

- Enregistré en temps réel par Elichens

O3

PM2.5

CO2

6

Source du dataset :

- Information sur la qualité de l'air dans le monde

- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10

- Enregistré en temps réel par Elichens

O3

PM2.5

CO2

- Web scraping vers Kaggle : Données de 2022 en CSV

"global air pollution dataset.csv"

6

Source du dataset

Caractéristique du dataset

Modèle d'apprentissage

Visualisation via API

Machine Learning : étapes de taitements

7

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

- Dataset.head :

Caractéristique du dataset :

- Dataset.shape : 23 463 lignes / 12 colonnes

8

- Dataset.describe :

Caractéristique du dataset :

9

- Graphique de l'AQI Value fonction des 3 polluants retenus :

Caractéristique du dataset :

10

Code :

- Matrice de corrélation :

Caractéristique du dataset :

11

Code :

- Graphique en boite des différentes catégories d'AQI pour les 3 polluants retenus :

Caractéristique du dataset :

12

Code :

- Graphique en boite avec et sans outliers pour l'Ozone - O3 :

Caractéristique du dataset :

13

Code :

- Old data :with outliers : 23463 - New data :without outliers : 21950 outliers : 1513

Source du dataset

Caractéristique du dataset

Modèle d'apprentissage

Visualisation via API

Machine Learning : étapes de taitements

14

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

K-nearest neighbors (KNN) :

Modèle d'apprentissage :

15

- Création et entrainement :

Modèle d'apprentissage :

16

K-nearest neighbors (KNN) :

- Test du modèle :

- Matrice de confusion - Classification report - Accuracy test

2 sets de données

3 test

6 test au total

Modèle d'apprentissage :

17

K-nearest neighbors (KNN) :

- Données test :

- Données entrainement :

Matrice de confusion

Modèle d'apprentissage :

18

K-nearest neighbors (KNN) :

- Données test :

- Données entrainement :

Classification report

Modèle d'apprentissage :

19

K-nearest neighbors (KNN) :

- Données test :

- Données entrainement :

Accuracy test

- Données sans outliers :

Modèle d'apprentissage :

20

K-nearest neighbors (KNN) :

- Etude des effets de la variation du nombre de voisins utilisé par le modèle sur la précision- Ici le test se fait uniquement sur les données test

Delta K

Code :

Modèle d'apprentissage :

21

K-nearest neighbors (KNN) :

- Score parfait pour les données d'entrainement - Score imparfait mais tout de même très bonnes sur les données test - Un k faible semble donner des meilleurs résultats

Conclusion sur le modèle

Test utilisateur :

Source du dataset

Caractéristique du dataset

Modèle d'apprentissage

Visualisation via API

Machine Learning : étapes de taitements

22

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Visualisation via API

23

Collecte de donnée : OpenAQ - API

- Choix des données en France- Concentrations en CO2, NO2, O3, NO, PM1 / PM2.5 / PM10- Temps réel et géolocalisées- Selection du PM2.5, NO2 et O3

Code :

Visualisation via API

23

Collecte de donnée : OpenAQ - API

- Choix des données en France- Concentrations en CO2, NO2, O3, NO, PM1 / PM2.5 / PM10- Temps réel et géolocalisées- Selection du PM2.5, NO2 et O3

Code :

- Ajout des prédictions

Visualisation via API

24

Collecte de donnée : OpenAQ - API

Code :

- Geometries des points de mesures

Notebook :

- Affichage sur une carte des prédictions

Conclusion

25

Merci !

Avez-vous des questions ?

Source :

Elichens : https://www.elichens.com/global-air-quality-mapkaggle : https://www.kaggle.com/datasets/hasibalmuzdadid/global-air-pollution-datasetOpenAQ - API : https://explore.openaq.org

Qualité de l'air

Machine Learning

Source du dataset

Caractéristique du dataset

O3

Modèle d'apprentissage

Visualisation via API

PM2.5

CO2

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Schéma explicatif du Nearest-Neighbor (Akka Zemmari, 2019-2020)