Formation Apprentissage par Renforcement
1530€ HT / personne |
2 jours (14 heures) |
Présentation
Venez apprendre à transformer vos données en actions concrètes grâce au « Reinforcement Learning ». L’apprentissage par renforcement est une méthode de Machine Learning qui permet de résoudre différents problèmes tels que le contrôle robotique, la pendule inversée, les télécommunications, le backgammon, etc.
Cette formation vous enseignera des fondamentaux d’un environnement de renforcement. Vous allez découvrir des fonctionnalités telles que le Markov Decision Process (MDP), les équations Bellman, le champ d’actions et d’observations.
Nous vous montrerons également le fonctionnement des algorithmes et de l’environnement de renforcement avec le framework Ray Rllib.
Notre formation Apprentissage par Renforcement contient des cas pratiques d’implémentation d’un robot de Trading. À l’issue de cette formation, vous maîtriserez le principe de fonctionnement de l’apprentissage par renforcement. Vous saurez créer un environnement de renforcement dans le framework Ray Rllib.
Objectifs
- Connaitre le principe de fonctionnement de l’apprentissage par renforcement
- Savoir créer un environnement de renforcement avec le framework Ray Rllib
- Optimiser un processus d’apprentissage par renforcement
Public visé
- Développeurs
- Architectes
- Big Data analyst
- Data scientist & Engineer
Pré-requis
Connaissance en Python
Pré-requis techniques
- Avoir un compte Google pour avoir accès à Colab
Organisation de la formation
- Équipe pédagogique
- Moyens pédagogiques et techniques
- Accueil des stagiaires dans une salle dédiée à la formation
- Documents supports de formation projetés
- Exposés théoriques
- Étude de cas concrets
- Quiz en salle
- Mise à disposition en ligne de documents supports à la suite de la formation
Dispositif de suivi de l’exécution de l’évaluation des résultats de la formation
- Feuilles de présence
- Questions orales ou écrites (QCM)
- Mises en situation
- Formulaires d’évaluation de la formation
Programme de notre formation Apprentissage par Renforcement
Introduction
- IA / ML / DL
- Apprentissage supervisé, non-supervisé, par renforcement
- Exemples et applications
BANDIT MANCHOT
- Principe
- Exploration / exploitation
- Stratégies simples
- UCB
- Applications
- TP : Système de recommandation
NOTIONS DE BASE ET FORMALISME
- Agent / Environnement
- États / Actions / Récompenses
- MDP
- Valeurs des états / couples (état, action)
- Politique / politique optimale
- TP : labyrinthe
RÉSOUDRE UN MDP
- Équations de Bellman
- Programmation dynamique
- Monte-Carlo
- TD-Learning
- Algorithmes on-policy vs. off-policy
- TP : labyrinthe
INTRODUCTION À RAY RLLIB
- Environnement Gym
- Créer un agent
- Entraînement
- Utilisation et observation de la politique
- Configuration, sauvegarde et chargement d’un algorithme
- TP : labyrinthe
CRÉER SON PROPRE ENVIRONNEMENT
- Composantes d’un environnement
- Environnement aléatoire
- État vs. observation
- Reward shaping
- TP : robot de trading
POUR ALLER PLUS LOIN
- Optimisation d’hyperparamètres
- Apprendre de données off-line
- Approche multi-agent
- TP : robot de trading
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Nos Formateurs Référents
David
Datascientist et Ingénieur Aéronautique, j’accompagne les entreprises sur la mise en œuvre de l’IA dans leurs métiers. Je suis passionné par l’IA et son potentiel d’application dans de nombreux domaines. À présent je souhaite partager mes compétences afin de démultiplier leur impact auprès de nombreux salariés. Au plaisir d’échanger avec vous !
Témoignages
Les + : Très bon formateur, prend bien le temps d’expliquer et connait très bien le sujet
Les – : La densité de ce qu’il faut retenir 🙂
Afficher tous les témoignages
Les + : Très bon formateur, prend bien le temps d’expliquer et connait très bien le sujet Les – : La densité de ce qu’il faut retenir 🙂 Je recommande la formation Les + : Le sujet Les – : Trop condensée. En synthèse : RAS
Noter la formation
1530€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS