Formation PyTorch Fast.Ai : Deep Learning
1995€ HT / personne |
3 jours (21 heures) |
Présentation
PyTorch et la librairie Fastai respectivement soutenus par Facebook Research (FAIR) et une communauté de développeurs autour de Jeremy Howard (co-fondateur de Kaggle) constituent un duo de choc pour découvrir de manière rapide la puissance des algorithmes de Deep Learning.
La release 1 de PyTorch sortie en décembre 2018 et la version 2 de Fastai sont disponibles de manière transparente sur l’environnement kernel de Kaggle ou colab de Google.
Après un rappel succinct du paradigme du Machine Learning, et des différentes taches où le Deep Learning surpasse les méthodes traditionnelles, nous implémenterons les taches classiques comme la classification d’images, de textes, les vecteurs de mots, les auto-encoders. Au travers de l’environnement Anaconda, nous utiliserons CUDA proposé par NVIDIA pour accélérer nos traitements.
Suivant le déroulement du cours et TP, une participation à un ou plusieurs challenges data sur Kaggle (ou autre) sera organisée. La comparaison avec le framework concurrent, TensorFlow de Google avec la libraire Keras (maintenant intégrée avec TF v2.0), sera abordée durant le cours.
À la fin du cours, les participants auront une compréhension approfondie des caractéristiques et des capacités de PyTorch, ainsi que de son rôle et de sa contribution dans l’IA par rapport à d’autres frameworks et bibliothèques. Les participants auront également reçu la pratique nécessaire pour mettre en œuvre PyTorch dans leurs propres projets.
Comme toutes nos formations, celle-ci vous présentera la dernière version stable en date et ses nouveautés : PyTorch 2.4 et Fastai 2.7.
Objectifs
- Comprendre le concept de Deep Learning et être capable de l’utiliser avec pyTorch avec ou sans fast.ai
- Savoir exploiter les ressources web ( github, arxiv) pour se constituer une bibliothèque de cas d’usages prête à l’emploi
- Être capable d’installer et d’utiliser Pytorch/ Fastai de manière autonome
- Comprendre le concept de Machine Learning et être capable de l’utiliser dans PyTorch
Public visé
- Développeurs
- Architectes
- Big Data Data analyst
- Data scientist
Pré-requis
- Connaissance de Python
- Connaissance de numpy sera en plus
Pré-requis techniques
- Avoir Anaconda installé ou un accès à Google Collab
Pour aller plus loin
- Nous vous proposons en introduction un séminaire sur l’Intelligence Artificielle
- En complément la technologie TensorFlow de Google
Programme de la formation PyTorch
Jour 1 – matin : Deep Learning : La révolution de l’Intelligence Artificielle
- Définition du machine learning comme problème d’optimisation
- Les typologies d’algorithmes de machine learning : supervisé (classification, régression), non-supervisé, semi-supervisé, autosupervisé, apprentissage par renforcement
- Sous-apprentissage, surapprentissage, généralisation (courbe d’apprentissage), métrique et évaluation
- Les Mathématiques derrière le Machine Learning : algèbre linéaire, statistiques/probabilités, descente de gradient appliqué à la régression linéaire
- Les avantages et limites du Machine Learning expliqués sur la régression logistique et le SVM
- Avantages du Deep Learning face au Machine learning expliqués sur le MLP et les CNN
- Les raisons de passer au Deep Learning
- Exemples de la vie réelle et scénarios applicables
- Présentation de Pytorch
- Présentation des surcouches fastai et pytorch ligthning
Jour 1 – après-midi : Installation et prise en main de Pytorch : manipulation de vecteurs et tenseurs avec Pytorch
- Installation : installation de Pytorch, anaconda, drivers ; Google Collab
- Utiliser Pytorch comme Numpy : tenseurs, opérations et variables
- Cas d’usages
- Création d’un module réseau de neurones
- Chargement d’un dataset et découpage en dataset de train et de test avec Pytorch et Sklearn
- Utilisation de métriques Sklearn puis de Tensorboard pour la visualisation des résultats
- Optimisation des hyperparamètres et principe du AutoML
- Sauvegarder et restaurer un modèle
- Utiliser les callbacks
Jour 2 – matin : Introduction aux CNN et application au traitement d’images
- Mise en application et architecture d’un CNN (convolution, pooling, data augmentation)
- Comprendre et visualiser un CNN et le produit de convolution
- Couches de convolution et de mise en commun (classification) dans une CNN
- Transfert d’apprentissage et mise au point des réseaux de neurones convolutionnels
- Explication de la backpropagation sur un exemple et implémentation en Pytorch
- Classification d’images de bout en bout : téléchargement d’une base d’apprentissage,(chien/chat, ours : teddy,grizzly,black bear), utilisation d’une architecture à l’état de l’art (ResNet) par transfer learning
- Comparaison de la création d’un CNN avec Pytorch et FastAI
Jour 2 – après-midi : Multi Layer Perceptron (MLP) sur des données tabulaires
- Explication du concept d’embedding et son importance pour la réduction de dimension sémantique
- Chargement de données csv avec la librairie Pandas
- Création de variables quantitatives à partir de variables qualitatives/catégorielles, traitement des données manquantes (nan values), normalisation avec Pandas puis FastAI
- Création d’un auto-encodeur
- Application à la visualisation (PCA, T-SNE, UMAP) et clustering d’embeddings (application à la recommandation d’items)
Jour 3 – matin : Traitement du texte
- Explication des words embeddings
- Utilisation avec la librairie Spacy (word2vec, CBOW, Glove, TF-IDF)
- Explication des sentences embeddings
- Utilisation avec la librairie Universal Sentence Encoder
- Utilisation des librairies Flair et HuggingFace pour des tâches classiques de NLP (sentiment analysis français et anglais, prédiction, …)
Jour 3 – après-midi : Introduction aux LSTMs et application à l’analyse et prédiction de séries temporelles
- Mise en application et architecture d’un LSTM (séquence à séquence, prédiction/many-to-one, …)
- RNN vs LSTM vs GRU
- Explication du mécanisme d’attention (vs Transformer)
- Création d’un LSTM
- Application pour de la prédiction de séries temporelles (cours boursiers ou ventes)
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Nos Formateurs Référents
Benjamin
Entrepreneur et formateur en Data Science et Big Data (No-SQL, MongoDB, Spark/Hadoop) depuis près de 5 années, j’ai un parcours académique d’expertise en recherche et développement en Deep Learning. Avec plusieurs projets autour du multimédia et de la multimodalité en vision et traitement d’images, du son et Natural Language Processing.
Témoignages
Les + : Adaptabilité aux questions et aux besoins
Les – : Manques de supports/notes réutilisable après.
vAfficher tous les témoignages
Les + : Adaptabilité aux questions et aux besoins
Les – : Manques de supports/notes réutilisable après.
Les – : On aurait peut-être pu passer plus de temps sur la préparation des données (gestion des labels, valeurs manquantes, etc.). Cela aurait pu servir de cas pratique pour la toute première partie
Je recommande la formation
Les + : Partie théorique très bien détaillée avec un formateur qui connait bien son sujet.
Notebook avec des exercices pratiques et corrections disponibles
Ouverture et discussions possibles avec le formateur
Les – : Temps de formation trop limité par rapport au programme dispensé pour faire les exercices pratique en séance.
On en ressort avec une assez bonne connaissance théorique du sujet mais un manque de pratique qui ne nous permet pas d’être vraiment autonome.
Par ailleurs, le processus de certification n’inclut pas d’accompagnement tutoré, ce qui nous laisse seul devant le projet que nous souhaitons développer. Pas évident…
Les + : La partie théorique, le catalogue de docs (notebooks, githubs, hugging face, et autres liens développés en live), la dispo et les connaissances du formateur
Les – : certains temps morts / indisponibilité des GPU sur google colab / à distance, on ne voit que les partages d’écrans ou le formateur à son bureau mais pas quand il est au tableau
Les + : Très bon prof
Les + : Orientation pratique de la formation
Les – : Peut-être prévoir aux candidats de venir avec un petit jeu de données caractéristique de leur besoin pour une demi-journée cas d’usage personnels.
Un peu rapide beaucoup d’informations.
Je recommande la formation
Bon panorama des différents outils et librairie de l’écosystème.
Manque de TP, il eu été interessant de passer du temps à implémenter quelque chose d’un peu gros.
Je recommande la formation
pragmatisme
Navigation Site Reviews
Noter la formation
1995€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS