Sélectionner une page
Formations Data IA Formation Apprentissage par Renforcement

Formation Apprentissage par Renforcement

Logo Formation Apprentissage par Renforcement
Prix 1530€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Venez apprendre à transformer vos données en actions concrètes grâce au « Reinforcement Learning ». L’apprentissage par renforcement est une méthode de Machine Learning qui permet de résoudre différents problèmes tels que le contrôle robotique, la pendule inversée, les télécommunications, le backgammon, etc.

Cette formation vous enseignera des fondamentaux d’un environnement de renforcement. Vous allez découvrir des fonctionnalités telles que le Markov Decision Process (MDP), les équations Bellman, le champ d’actions et d’observations.

Nous vous montrerons également le fonctionnement des algorithmes et de l’environnement de renforcement avec le framework Ray Rllib.

Notre formation Apprentissage par Renforcement contient des cas pratiques d’implémentation d’un robot de Trading. À l’issue de cette formation, vous maîtriserez le principe de fonctionnement de l’apprentissage par renforcement. Vous saurez créer un environnement de renforcement dans le framework Ray Rllib.

 

Objectifs

  • Connaitre le principe de fonctionnement de l’apprentissage par renforcement
  • Savoir créer un environnement de renforcement avec le framework Ray Rllib
  • Optimiser un processus d’apprentissage par renforcement

 

Public visé

  • Développeurs
  • Architectes
  • Big Data analyst
  • Data scientist & Engineer

 

Pré-requis

Connaissance en Python

 

Pré-requis techniques

  • Avoir un compte Google pour avoir accès à Colab

 

Organisation de la formation

  • Équipe pédagogique
  • Moyens pédagogiques et techniques
    • Accueil des stagiaires dans une salle dédiée à la formation
    • Documents supports de formation projetés
    • Exposés théoriques
    • Étude de cas concrets
    • Quiz en salle
    • Mise à disposition en ligne de documents supports à la suite de la formation

 

Dispositif de suivi de l’exécution de l’évaluation des résultats de la formation

  • Feuilles de présence
  • Questions orales ou écrites (QCM)
  • Mises en situation
  • Formulaires d’évaluation de la formation

Programme de notre formation Apprentissage par Renforcement

 

Introduction

  • IA / ML / DL
  • Apprentissage supervisé, non-supervisé, par renforcement
  • Exemples et applications

 

BANDIT MANCHOT

  • Principe
  • Exploration / exploitation
  • Stratégies simples
  • UCB
  • Applications
  • TP : Système de recommandation

 

NOTIONS DE BASE ET FORMALISME

  • Agent / Environnement
  • États / Actions / Récompenses
  • MDP
  • Valeurs des états / couples (état, action)
  • Politique / politique optimale
  • TP : labyrinthe

 

RÉSOUDRE UN MDP

  • Équations de Bellman
  • Programmation dynamique
  • Monte-Carlo
  • TD-Learning
  • Algorithmes on-policy vs. off-policy
  • TP : labyrinthe

 

INTRODUCTION À RAY RLLIB

  • Environnement Gym
  • Créer un agent
  • Entraînement
  • Utilisation et observation de la politique
  • Configuration, sauvegarde et chargement d’un algorithme
  • TP : labyrinthe

 

CRÉER SON PROPRE ENVIRONNEMENT

  • Composantes d’un environnement
  • Environnement aléatoire
  • État vs. observation
  • Reward shaping
  • TP : robot de trading

 

POUR ALLER PLUS LOIN

  • Optimisation d’hyperparamètres
  • Apprendre de données off-line
  • Approche multi-agent
  • TP : robot de trading

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Nos Formateurs Référents

David

David

Datascientist et Ingénieur Aéronautique, j’accompagne les entreprises sur la mise en œuvre de l’IA dans leurs métiers. Je suis passionné par l’IA et son potentiel d’application dans de nombreux domaines. À présent je souhaite partager mes compétences afin de démultiplier leur impact auprès de nombreux salariés. Au plaisir d’échanger avec vous !

Témoignages

27 septembre 2024

Les + : Très bon formateur, prend bien le temps d’expliquer et connait très bien le sujet

Les – : La densité de ce qu’il faut retenir 🙂

Alain S. de chez BPCE SOLUTIONS INFORMATIQUE

Afficher tous les témoignages

27 septembre 2024

Les + : Très bon formateur, prend bien le temps d’expliquer et connait très bien le sujet

Les – : La densité de ce qu’il faut retenir 🙂

Alain S. de chez BPCE SOLUTIONS INFORMATIQUE
27 septembre 2024

Je recommande la formation

Franck R. de chez BPCE SOLUTIONS INFORMATIQUE
27 septembre 2024

Les + : Le sujet

Les – : Trop condensée.

En synthèse : RAS

Jose C. de chez BPCE SOLUTIONS INFORMATIQUE

Noter la formation

Prix 1530€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp