Formation Dataiku Avancé
1790€ HT / personne |
2 jours (14 heures) |
Présentation
Maîtrisez l’ensemble de votre workflow data grâce à notre formation Dataiku avancé. Que vous soyez Data Engineers, Data Analysts ou Data Scientists, notre programme de perfectionnement vous permettra de concevoir des pipelines de données complexes et scalables.
Nous explorerons les pipelines de données avancés. Vous apprendrez à les créer, les optimiser et les automatiser, en vous appuyant sur des scénarios complexes et des règles précises.
Cette première étape est essentielle pour quiconque souhaite se certifier en tant que concepteur avancé sur Dataiku.
Vous découvrirez comment créer, évaluer et affiner des modèles directement dans l’environnement de Dataiku. De la mise en application de vos modèles à leur compréhension profonde grâce aux outils de l’IA responsable.
Enfin, que vous souhaitiez intégrer votre propre code dans vos projets, gérer ce code de manière efficace, ou même créer des plugins pour vos collègues, cette formation vous donnera les clés pour devenir un développeur certifié sur Dataiku.
Pour cette formation, nous utiliserons la dernière version de Dataiku : DSS 12.
Objectifs
- Comprendre les bénéfices de Dataiku pour la gestion des données et le Machine Learning
- Savoir utiliser l’interface DSS pour préparer et analyser les données
- Construire et automatiser des flux de transformation et d’analyse de données
- Développer et entraîner des modèles de Machine Learning avec DSS
- Automatiser et déployer des modèles et workflows en production
Public visé
- Entreprises qui font des migrations de Saas vers dataikus
- Data Analysts
- Data Scientists
- Data Engineer
Pré-requis
- Bases en manipulation de données (SQL, Python, Excel ou outils BI)
- Connaissances de base en statistiques et Machine Learning souhaitées, mais non obligatoires
- Une première expérience avec un outil d’analyse de données (SAS, R, Power BI, Tableau…) est un plus
Pré-requis logiciel
Avoir une licence pour Dataiku.
Programme de notre formation Dataiku Avancé
Jour 1
Introduction
- Présentation des fonctionnalités avancées de Dataiku
- Vue d’ensemble des possibilités offertes par l’outil
Outils visuels avancés de Dataiku
- Recettes visuelles avancées
- Utiliser des variables
- Data Pipelines
- Automation
- Collaboration
- Quiz
- Récapitulatif
Introduction Machine Learning
- Concepts
- Modélisation prédictive
- Prédiction : Régression et classification
- Clustering
- Quiz
- Récapitulatif
Analysez vos données avec l’outil Interactive Stats
- Interface
- Analyse univariée et bivariée
- Ajustement de courbes et distributions
- Matrice de corrélation
- Analyse en composantes principales
- Tests statistiques
- Quiz
- Récapitulatif
Machine Learning
- Mettre en place d’un modèle
- Ajustement du modèle
- Compréhension des prédictions faites par le modèle
- Quiz
- Récapitulatif
Scoring
- Déploiement de votre modèle
- Scoring Data
- Evaluation de votre modèle
- Quiz
- Récapitulatif
Machine Learning avancé
- Stratégies de développement de modèles
- Diagnostic du modèle
- Actionability
- Quiz
- Récapitulatif
Modèles stratifiés ou partitionnés
- Mise en place d’un modèle stratifié
- Quiz
- Récapitulative
TALN – De manière visuelle
- Introduction au TALN
- Préparation des données textuelles
- Gestion des caractéristiques textuelles pour le ML
- Quiz
- Récapitulatif
Analyse et prévision des séries temporelles
- Fondamentaux des séries temporelles
- Analyse des séries temporelles
- Prévision des séries temporelles
- Quiz
- Récapitulatif
Préparation de données temporelles
- Recette Resampling
- Recette Interval extraction
- Recette Windowing
- Recette Exterma extraction
- Quiz
- Récapitulatif
Jour 2
Code dans Dataiku
- Notebooks de code
- Recettes de code
- Environnements de code
- Intégrations d’IDE externes
- Quiz
- Récapitulatif
Partagez votre code
- Introduction
- Libraries
- Importation depuis Git
- Échantillons de code
- Pratique
- Quiz
- Récapitulatif
Modèles ML personnalisés
- Prétraitement personnalisé en ML visuel
- Modélisation personnalisée en ML visuel
- Quiz
- Récapitulative
Variables pour les coders
- Définition des variables
- Utilisation des variables dans une recette de code
- Modification de la valeur des variables
- Pratique
- Quiz
- Récapitulatif
Visualisation
- Webapps
- Insights statiques
- Quiz
- Récapitulatif
Managed folders
- Savoir utiliser les Managed folders
- Pratique
- Quiz
- Récapitulatif
APIs de Dataiku
- Introduction
- Le package dataiku et l’API publique
- Pratique
- Quiz
- Récapitulatif
Déploiement et monitoring
- Dataiku Govern
- Suivi des modèles
- Déploiement par lots
- API en temps réel
- Quiz
- Récapitulatif
Examen Advanced Designer Certificate (Optionnel)
Examen ML Practitioner Certificate (Optionnel)
Examen Developer Certificate (Optionnel)
Pour aller plus loin
Formation Dataiku
Formation Tensorflow
Formation Pytorch
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1790€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS