Formation Python : Analyse de Données
1890€ HT / personne |
3 jours (21 heures) |
Présentation
Python est l’un des langages le plus flexibles et polyvalents. Utilisés dans énormément de domaines, Python est le langage de l’année 2022 selon l’index TIOBE. La simplicité de sa syntaxe simplifie son apprentissage, il s’agit du langage de programmation le plus utilisé en Big Data.
Avec la montée en popularité du Big Data ces dernières années, Python est devenu un langage incontournable. Son écosystème d’API lui permet de traiter des données de différents types (SQL et NoSQL) et de piloter des outils de traitement avancé.
Notre formation Python : analyse de données vous enseignera la résolution de problèmes grâce à l’analyse de données. Vous apprendrez les principes de la modélisation statistique et des outils de traitement. Vous verrez également comment extraire les données d’un fichier et mettre en place un modèle d’apprentissage simple.
À l’issue de cette formation, vous serez capable de manipuler des données statistiques grâce au langage Python. Nous vous présenterons la dernière version du langage Python 3.13.
Objectifs
- Appréhender le principe de la modélisation statistique
- Maîtriser les outils de traitement et d‘analyse de données pour Python
- Savoir extraire des données d’un fichier
- Appliquer les meilleures pratiques en matière de nettoyage et de préparation des données
- Savoir mettre en place un modèle d’apprentissage simple
- Choisir la classification et la régression en fonction du type de données
- Optimiser les performances prédictives d’un algorithme
- Créer des classements et des sélections dans de grands volumes de données
Public visé
- Développeurs en Python
- Responsables Infocentre
- Développeurs de logiciels
- Programmeurs
- Data Analysts
- Data Scientists
Pré-requis
- Connaissances de base sur Python
- Connaissances de base en statistiques
Pré-requis logiciel
Les dernières versions d’Anaconda et Python installés.
Programme de notre formation Big Data : Python pour l’Analyse de Données
Présentation des librairies
- Pandas
- NumPy et SciPy
- Matplotlib
- Scikit-Learn
- Utiliser des fonctions de librairies
- Gérer les modules et librairies
Préparation des données
- L’importance d’avoir des données intègres et préparées
- Lire et écrire des fichiers CSV
- Importer des ensembles de données
- Nettoyer et préparer les données
- Formatage des données
- Construire des pipelines de données
Modéliser ses données avec Pandas
- Manipuler ses données
- Créer des colonnes
- Transformer ses colonnes
- Interrogation, triage et filtrage
- Regroupement et agrégation pour la synthèse des données
- Fusionner et joindre des données provenant de plusieurs sources
- La concaténation
- Sélectionner des éléments
- Remplacer des valeurs
Visualisation des données avec Pandas
- Effectuer des comparaisons
- Créer des graphiques :
- Histogramme
- Pie chart
- Graphique de densité Kernel
- Graphique hexagonal
- Scatter chart
- Line chart
- Boxplot
- TP : Trouver des insights à partir de ses visualisations
Calcul numérique avec NumPY
- Passer des listes Python aux tableaux NumPy
- Travailler avec des tableaux multidimensionnels
- Opérations sur les arrays, découpage et diffusion
- Les fonctions d’algèbre linéaire et matricielle
- Les principales fonctions mathématiques
Analyse statistique avec SciPy
- Les bonnes pratiques pour une analyse de données réussie
- Les 3 classes statistiques de SciPy
- Utiliser les fonctions de statistiques descriptives
- Calculer le z-score et le t-score
- TP : Analyse de plusieurs dataframes différents
Développement des modèles de machine learning
- Les points forts et les limites du machine learning
- Choisir ses modèles à l’aide de la visualisation
- Les fonctions d’optimisation et le preprocessing avec SciPy
- Les différents modèles d’apprentissage avec SciKit-Learn
Régression avec Scikit-learn
- Régression linéaire simple
- Régression linéaire multiple
- La régression logistique
- La régression polynomiale
- R-carré et EQM pour évaluer son modèle
- Prédiction et prise de décision
Classification avec Scikit-learn
- SVM
- Nearest neighbors
- Random forest
- K-Means
Algorithmes Data
- Découvrir des algorithmes destinés à l’analyse de données
- Mettre en œuvre des algorithmes d’analyse de données
- Évaluer les performances prédictives
Pour aller plus loin
Formation Python : Programmation Objet
Formation Python Machine Learning avec Scikit.Learn
Formation TensorFlow
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
Les + : Préparation des supports de cours.
Qualité du formateur.
Afficher tous les témoignages
Les + : Préparation des supports de cours.
Qualité du formateur.
Les + : Mise en pratique
Les – : Beaucoup de choses en peu de temps
Je recommande la formation
Les + : Bonne présentation, rapport théorie/pratique.
Pédagogie de la formatrice.
Les – : Un peu courte, il y a beaucoup d’informations à assimiler en peu de temps
En synthèse : Très sympa les sucreries.
Les + : Pédagogie de la formateure, cours, algorithme et exemples, corrections
Les – : Trop court (manque 1 jours de plus)
Je souhaite suivre : –
Les + : – Disponibilité de la formatrice
– Écoute de la formatrice
– Le fait que cela soit très technique et pas que théorique
– Très accessible
–> Génial correspond parfaitement à ce que nous attendions :p
Les – : Tout est ok
Je souhaite suivre : Airflow
En synthèse : Je recommande, c’était vraiment parfait ! je n’hésiterais pas à approfondir pour un niveau deux dans quelque temps
Les + : Dynamique avec la pratique et les exercices
Les + : Le côté pratique, la participation
Formation très dynamique
En synthèse : Merci pour la formation
Les + : Formatrice au top ! Je recommande à 1000%
Les – : Aucun
Je recommande la formation
Je recommande la formation
Noter la formation
1890€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS