[go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
60 vues8 pages

Data Engeneering - Python Post 2

Transféré par

Johanne Teteck
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
60 vues8 pages

Data Engeneering - Python Post 2

Transféré par

Johanne Teteck
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 8

Marie Floriane CHOUMPEAU

Data Engineer

Thème 2 : PYTHON

Post 2/4 :
Visualisation de
Données et
Automatisation

Semaine 5 de ma série sur les


thématiques importantes à maîtriser
en tant que data engineer junior
Slide 01
Objectifs

Apprendre à Visualiser des Données avec


Matplotlib et Seaborn

Manipuler et Analyser les Données avec


Pandas

Automatiser les Analyses et Générer des


Rapports
Slide 02
Introduction à Matplotlib

Matplotlib = bibliothèque de visualisation de données


puissante et flexible en Python.

Usage principal :
Créer des graphiques variés, des plus simples aux
plus complexes.

Exemple de Code :
Slide 03
Introduction à Seaborn

Seaborn = bibliothèque basée sur Matplotlib, conçue pour


des visualisations statistiques plus avancées et esthétiques.

Usage principal :
explorer les relations entre variables.

Exemple de Code :
Slide 04
Introduction à Pandas

Pandas = bibliothèque essentielle pour la manipulation et


l'analyse de données.

Usage princiapal :
travail efficace avec des structures de données complexes.

Exemple de Code :
Slide 05
Automatisation des
Rapports

Apprenons à automatiser la génération de rapports


de données avec Pandas.

But princiapal :
simplifie et accélère le processus d'analyse répétitive.

Exemple de Code :
Slide 06
Projet 1 : Analyse
des Données
Météorologiques
Objectif : comprendre les tendances climatiques et de développer
un modèle prédictif pour estimer les températures futures.

Origine des données : meteo.data.gouv

Etapes du projet : Préparation des


Données

Analyse
Exploratoire des
Données (EDA)
Voir le lien du
projet sur github Modélisation
dans la
description du
post
Prédiction

Résultats obtenus :
RMSE* : 8.358149640383994e-14

Scores de validation croisée (calculé car RMSE extrêmement bas) : [2.01264151e-


12, 2.49099479e-13, 2.21331366e-13, 2.08240526e-12, 3.92456706e-13]

Score moyen de RMSE : 9.915868637068212e-13

*: Root Mean Squared Error


Marie Floriane CHOUMPEAU
Data Engineer

A la semaine
prochaine
pour la suite
de la série
Python.

N’hésitez pas à me faire vos


retours en commentaires !!!

Vous aimerez peut-être aussi