Projet ML Maj Num
Adrien Leroux
Created on October 11, 2023
More creations to inspire you
Transcript
- Majeur Numérique - Projet Machine Learning
LECENE CharlyneEMBS--SCHNEIDER AdrienHUSBAND GeorgeLEROUX Adrien
13/10/2023
Introduction
- Déréglement climatique- Activités humaines- Pollution de l'environnement
2
"Dans quelle mesure pouvons nous prédire la qualité de l'air dans notre environnement ?"
Problématique
3
Qualité de l'air - AQI
- Les particules en suspension (PM2.5) : Constructions, tabagisme, démolition et risques naturels (0 à 500 ug/m3)- L'Ozone (O3) : Industries, émissions automobiles, produits chimiques et appareils électroniques (0 à 748 ug/m3)- Le dioxyde d’azote (NO2) :Production d’électricité, combustion de combustibles fossiles et industries (0 à 400 ug/m3)
Paramètres de l'AQI :
4
Source du dataset
Caractéristique du dataset
Modèle d'apprentissage
Visualisation via API
Machine Learning : étapes de taitements
5
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Source du dataset :
- Information sur la qualité de l'air dans le monde
6
Source du dataset :
- Information sur la qualité de l'air dans le monde
- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10
O3
PM2.5
CO2
6
Source du dataset :
- Information sur la qualité de l'air dans le monde
- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10
- Enregistré en temps réel par Elichens
O3
PM2.5
CO2
6
Source du dataset :
- Information sur la qualité de l'air dans le monde
- Mesures des concentrations des éléments polluants CO2, NO2, O3, PM1 / PM2.5 / PM10
- Enregistré en temps réel par Elichens
O3
PM2.5
CO2
- Web scraping vers Kaggle : Données de 2022 en CSV
"global air pollution dataset.csv"
6
Source du dataset
Caractéristique du dataset
Modèle d'apprentissage
Visualisation via API
Machine Learning : étapes de taitements
7
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
- Dataset.head :
Caractéristique du dataset :
- Dataset.shape : 23 463 lignes / 12 colonnes
8
- Dataset.describe :
Caractéristique du dataset :
9
- Graphique de l'AQI Value fonction des 3 polluants retenus :
Caractéristique du dataset :
10
Code :
- Matrice de corrélation :
Caractéristique du dataset :
11
Code :
- Graphique en boite des différentes catégories d'AQI pour les 3 polluants retenus :
Caractéristique du dataset :
12
Code :
- Graphique en boite avec et sans outliers pour l'Ozone - O3 :
Caractéristique du dataset :
13
Code :
- Old data :with outliers : 23463 - New data :without outliers : 21950 outliers : 1513
Source du dataset
Caractéristique du dataset
Modèle d'apprentissage
Visualisation via API
Machine Learning : étapes de taitements
14
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
K-nearest neighbors (KNN) :
Modèle d'apprentissage :
15
- Création et entrainement :
Modèle d'apprentissage :
16
K-nearest neighbors (KNN) :
- Test du modèle :
- Matrice de confusion - Classification report - Accuracy test
2 sets de données
3 test
6 test au total
Modèle d'apprentissage :
17
K-nearest neighbors (KNN) :
- Données test :
- Données entrainement :
Matrice de confusion
Modèle d'apprentissage :
18
K-nearest neighbors (KNN) :
- Données test :
- Données entrainement :
Classification report
Modèle d'apprentissage :
19
K-nearest neighbors (KNN) :
- Données test :
- Données entrainement :
Accuracy test
- Données sans outliers :
Modèle d'apprentissage :
20
K-nearest neighbors (KNN) :
- Etude des effets de la variation du nombre de voisins utilisé par le modèle sur la précision- Ici le test se fait uniquement sur les données test
Delta K
Code :
Modèle d'apprentissage :
21
K-nearest neighbors (KNN) :
- Score parfait pour les données d'entrainement - Score imparfait mais tout de même très bonnes sur les données test - Un k faible semble donner des meilleurs résultats
Conclusion sur le modèle
Test utilisateur :
Source du dataset
Caractéristique du dataset
Modèle d'apprentissage
Visualisation via API
Machine Learning : étapes de taitements
22
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Visualisation via API
23
Collecte de donnée : OpenAQ - API
- Choix des données en France- Concentrations en CO2, NO2, O3, NO, PM1 / PM2.5 / PM10- Temps réel et géolocalisées- Selection du PM2.5, NO2 et O3
Code :
Visualisation via API
23
Collecte de donnée : OpenAQ - API
- Choix des données en France- Concentrations en CO2, NO2, O3, NO, PM1 / PM2.5 / PM10- Temps réel et géolocalisées- Selection du PM2.5, NO2 et O3
Code :
- Ajout des prédictions
Visualisation via API
24
Collecte de donnée : OpenAQ - API
Code :
- Geometries des points de mesures
Notebook :
- Affichage sur une carte des prédictions
Conclusion
25
Merci !
Avez-vous des questions ?
Source :
Elichens : https://www.elichens.com/global-air-quality-mapkaggle : https://www.kaggle.com/datasets/hasibalmuzdadid/global-air-pollution-datasetOpenAQ - API : https://explore.openaq.org
Qualité de l'air
Machine Learning
Source du dataset
Caractéristique du dataset
O3
Modèle d'apprentissage
Visualisation via API
PM2.5
CO2
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
Schéma explicatif du Nearest-Neighbor (Akka Zemmari, 2019-2020)