Formation Python pour les Scientifiques avec Scikit-Learn
1490€ HT / personne |
2 jours (14 heures) |
Présentation
Scikit-learn (ou Sklearn) est une bibliothèque libre Python dédiée à l’apprentissage automatique. Elle est développée par de nombreux contributeurs notamment par des instituts français d’enseignement supérieur et de recherche comme Inria et Télécom ParisTech.
Elle comprend notamment des fonctions pour estimer des forêts aléatoires, des régressions logistiques, des algorithmes de classification, et les machines à vecteurs de support. Elle est conçue pour s’harmoniser avec d’ autres bibliothèques libres Python, notamment NumPy et SciPy.
Cette formation Python pour les scientifiques vous permettra d’acquérir les connaissances nécessaires pour interagir avec Sklearn. Elle abordera sa syntaxe, les outils ainsi que les bonnes pratiques de développement, afin de bénéficier de tous les atouts de cette bibliothèque. Nous présenterons les algorithmes, les méthodes supervisées et non supervisées, les fonctionnalités de classification, régression et le clustering.
Comme toutes nos formations, celle-ci vous présentera la dernière version stable en date et ses nouveautés (Scikit-learn 1.5 sortie en Juin 2023 à la date de l’article, et Python 3.12).
Objectifs
- Mettre en œuvre des algorithmes d’apprentissage machine en Python avec Scikit-Learn
- Pouvoir choisir une stratégie de montée en charge pour Scikit-Learn
- Utiliser Scikit-Learn en conjonction avec d’autres toolkit de l’univers Python (par ex. Skimage ou OpenCV)
- Être en mesure de citer les différents composants de Scikit-Learn, leur usage, trouver rapidement leur documentation
Public visé
- Data analysts
- Data Miners
- Statisticiens
- Scientifiques
Pré-requis
- Savoir programmer en Python 2 ou 3
- De bonnes connaissances en traitement et en manipulation de données
- De bonnes connaissances en algèbre linéaire
Programme de la formation Python Scientifique avec Scikit.Learn
Introduction
- Qu’est-ce que le Machine Learning ?
- Apprentissage Machine Learning ?
- Installation scikit-learn
- Clean Data
- Sur-ajustement et la généralisation
- Validation croisée
- Bias-Variance Trade-Off
- Vérification et mise à jour de l’installation de scikit-learn
- Solutions et Avantages : L’état des arts
- Tensorflow et Keras
- Scikit‐learn
- Deeplearning for Java
- pytorch et fastai
Concepts de bases de SCIKIT
- Algorithmes, vocabulaire
- Panorama de scikit-learn
- Démarche d’apprentissage
- Périmètre du toolkit, domaine d’application
- Structure
- Représentation des données et principes de l’API
- La documentation
MÉTHODES DE MACHINE LEARNING
- Les méthodes supervisées
- KNN
- SVM
- Réseaux de neurones
- Réseau bayésien naif
- Régression pénalisée
- Boosting
- Random forest
- Les méthodes non supervisées
- Clustering
- Règles d’associations et de séquences
- Traitement du texte (text mining)
Catégories de problèmes et mise en oeuvre
- Classification
- Définition des arbres de décision
- Arbres de décision
- Modèles d’ensemble
- Classificateur de Random Forest
- Régression
- Arbres de décision
- Modèles de régression
- Définition d’un hyperplan
- Anatomie d’un estimateur
- Régression linéaire simple
- La fonction COST
- Qu’est-ce que R-Squared ?
- Évaluation du modèle
- Régularisation
- Régression linéaire à plusieurs variables
- Régression linéaire appliquée
- Visualisation de notre DataSet
- Clustering
- Animation du Cluster K-Means
- L’algorithme K-Means
- Application du Clustering K-Means
- Autres algorithmes disponibles
Les modèles
- Validation des modèles
- Préparation des modèles
- Cas des images
- Cas des textes
- Réduction des dimensions
- Autres préparations
Optimisation
- Comment régler son algo de ML ?
- HPO = Hyper Parameter Optimization
- AutoML
- Présentation d’un kaggle master
- Utilisation d’optimisation bayésienne
Utilisation des paramètres de gestion SCIKIT
- Choisir le bon estimateur et les bons paramètres
- Interopérabilité avec écosystème python scientifique
- Performance et montées en charge
- Stratégie
- Outils
Pour aller plus loin
Formation Python Analyse de données
Formation Python : Programmation Objet
Formation TensorFlow
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1490€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS