Sélectionner une page
Formations Data Analyse de données Formation Python pour les Scientifiques avec Scikit-Learn

Formation Python pour les Scientifiques avec Scikit-Learn

Logo Formation Scikit-learn - Python Machine Learning
Prix 1490€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

Présentation

Scikit-learn (ou Sklearn) est une bibliothèque libre Python dédiée à l’apprentissage automatique. Elle est développée par de nombreux contributeurs notamment par des instituts français d’enseignement supérieur et de recherche comme Inria et Télécom ParisTech.

Elle comprend notamment des fonctions pour estimer des forêts aléatoires, des régressions logistiques, des algorithmes de classification, et les machines à vecteurs de support. Elle est conçue pour s’harmoniser avec d’ autres bibliothèques libres Python, notamment NumPy et SciPy.

Cette formation Python pour les scientifiques vous permettra d’acquérir les connaissances nécessaires pour interagir avec Sklearn. Elle abordera sa syntaxe, les outils ainsi que les bonnes pratiques de développement, afin de bénéficier de tous les atouts de cette bibliothèque. Nous présenterons les algorithmes, les méthodes supervisées et non supervisées, les fonctionnalités de classification, régression et le clustering.

Comme toutes nos formations, celle-ci vous présentera la dernière version stable en date et ses nouveautés (Scikit-learn 1.5 sortie en Juin 2023 à la date de l’article, et Python 3.12).

 

Objectifs

  • Mettre en œuvre des algorithmes d’apprentissage machine en Python avec Scikit-Learn
  • Pouvoir choisir une stratégie de montée en charge pour Scikit-Learn
  • Utiliser Scikit-Learn en conjonction avec d’autres toolkit de l’univers Python (par ex. Skimage ou OpenCV)
  • Être en mesure de citer les différents composants de Scikit-Learn, leur usage, trouver rapidement leur documentation

 

Public visé

  • Data analysts
  • Data Miners
  • Statisticiens
  • Scientifiques

 

Pré-requis

  • Savoir programmer en Python 2 ou 3
  • De bonnes connaissances en traitement et en manipulation de données
  • De bonnes connaissances en algèbre linéaire

Programme de la formation Python Scientifique avec Scikit.Learn

 

Introduction

  • Qu’est-ce que le Machine Learning ?
  • Apprentissage Machine Learning ?
  • Installation scikit-learn
  • Clean Data
  • Sur-ajustement et la généralisation
  • Validation croisée
  • Bias-Variance Trade-Off
  • Vérification et mise à jour de l’installation de scikit-learn
  • Solutions et Avantages : L’état des arts
    • Tensorflow et Keras
    • Scikit‐learn
    • Deeplearning for Java
    • pytorch et fastai

 

Concepts de bases de SCIKIT

  • Algorithmes, vocabulaire
  • Panorama de scikit-learn
  • Démarche d’apprentissage
  • Périmètre du toolkit, domaine d’application
  • Structure
  • Représentation des données et principes de l’API
  • La documentation

 

MÉTHODES DE MACHINE LEARNING

  • Les méthodes supervisées
    • KNN
    • SVM
    • Réseaux de neurones
    • Réseau bayésien naif
    • Régression pénalisée
    • Boosting
    • Random forest
  • Les méthodes non supervisées
    • Clustering
    • Règles d’associations et de séquences
    • Traitement du texte (text mining)

 

Catégories de problèmes et mise en oeuvre

  • Classification
    • Définition des arbres de décision
    • Arbres de décision
    • Modèles d’ensemble
    • Classificateur de Random Forest
  • Régression
    • Arbres de décision
    • Modèles de régression
    • Définition d’un hyperplan
    • Anatomie d’un estimateur
    • Régression linéaire simple
    • La fonction COST
    • Qu’est-ce que R-Squared ?
    • Évaluation du modèle
    • Régularisation
    • Régression linéaire à plusieurs variables
    • Régression linéaire appliquée
    • Visualisation de notre DataSet
  • Clustering
    • Animation du Cluster K-Means
    • L’algorithme K-Means
    • Application du Clustering K-Means
  • Autres algorithmes disponibles

 

Les modèles

  • Validation des modèles
  • Préparation des modèles
    • Cas des images
    • Cas des textes
    • Réduction des dimensions
    • Autres préparations

 

Optimisation

  • Comment régler son algo de ML ?
  • HPO = Hyper Parameter Optimization
  • AutoML
  • Présentation d’un kaggle master

 

Utilisation des paramètres de gestion SCIKIT

  • Choisir le bon estimateur et les bons paramètres
  • Interopérabilité avec écosystème python scientifique
  • Performance et montées en charge
    • Stratégie
    • Outils

Pour aller plus loin

Formation Python Analyse de données

Formation Python : Programmation Objet

Formation TensorFlow

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 1490€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp