Formation Dataiku : La plateforme DSS
1790€ HT / personne |
2 jours (14 heures) |
Présentation
Dataiku est une plateforme data science permettant la création de modèle tout en industrialisant en toile de fonds l’ensemble des chaînes de traitement : collecte, préparation des données…
Grâce à cette formation Dataiku, votre équipe pourra en apprendre davantage sur les fonctionnalités de Dataiku. Elle saura s’interfacer sur des environnements Cloud, améliorer votre organisation en mettant en valeur la donnée au cœur de votre stratégie.
Cet outil collaboratif va permettre à votre entreprise d’avoir à disposition des fonctionnalités autour du Machine Learning et de la Data Science.
Mais aussi de convertir les données en prédiction, utiliser pour explorer, développer vos propres produits data. Vous pourrez préparer votre plateforme afin d’automatiser le workflow et déployer la production.
Pour cette formation, nous utilisons la dernière version : DSS 11.
Objectifs
- Identifier les concepts fondamentaux de Dataiku DSS et son interface (Flow, Flowzones, recettes, moteurs, projets)
- Importer, préparer et enrichir des jeux de données à l’aide des recettes visuelles
- Structurer un projet complet avec une logique de Flow claire et export des résultats
- Créer des visualisations interactives dans un dashboard
- Automatiser l’exécution de traitements via les scénarios
- Mettre en œuvre un projet complet de bout en bout dans Dataiku
Public visé
- Data analysts
- Data scientists
- Data engineers
- Analyst SAS
Pré-requis
Connaissances en data science.
Pré-requis logiciel
- Une instance Dataiku DSS installée et accessible aux participants
- Un accès aux bases de données (SQL, NoSQL) ou des fichiers de données pour les exercices
- Connexion aux API et services cloud si nécessaire
Programme de notre formation Dataiku
Introduction à Dataiku DSS
- Présentation de la plateforme DSS : interface, logique projet/Flow
- Comprendre les Flowzones pour organiser les traitements
- Types de stockage et moteurs d’exécution
- Importation de fichiers (CSV, Excel)
- Cas pratique : création d’un projet DSS et premier import de données
PRÉPARATION ET NETTOYAGE DES DONNÉES
- Exploration des données importées : types de colonnes, formats, qualité
- Nettoyage des données avec la recette “Prepare” :
- Normalisation des formats
- Traitement des valeurs manquantes
- Renommage et filtrage de colonnes
- Cas pratique : préparer un jeu de données clients
ENRICHISSEMENT ET TRANSFORMATION DES DONNÉES
- Enrichissement par jointure de plusieurs datasets (recette Join)
- Regroupement et agrégation des données (recette Group)
- Structuration d’un Flow de traitement avec zones dédiées
- Cas pratique : enrichir un jeu de données avec des commandes ou des informations produit
STRUCTURATION ET EXPORT DU FLOW
- Création de Flowzones et organisation logique du projet
- Documentation des recettes et gestion des dépendances
- Export de données (CSV, Excel, base de données)
- Cas pratique : finaliser un Flow complet, prêt à l’export
DATA VISUALISATION ET DASHBOARDS
- Bonnes pratiques en data visualisation
- Création de graphiques à partir d’un dataset
- Mise en page et filtrage dans un Dashboard interactif
- Cas pratique : construire un dashboard des ventes ou clients
PERSONNALISÉ : RECETTES ET OUTILS ADAPTÉS AUX BESOINS MÉTIERS
- Écoute et identification des cas d’usage spécifiques des participants
- Présentation de recettes ou plugins pertinents pour leurs contextes métier
- Démonstration ciblée sur des données adaptées
- Accompagnement à l’exploration libre ou approfondissement au cas par cas
AUTOMATISATION DES TRAITEMENTS
- Introduction aux scénarios dans Dataiku
- Création d’un scénario simple : nettoyage, enrichissement, export
- Ajout d’étapes et déclencheurs (triggers)
- Cas pratique : automatiser l’exécution d’un projet
ÉTUDE DE CAS FINALE : PROJET COMPLET
- Réalisation d’un projet de A à Z :
- Import, nettoyage, enrichissement
- Structuration du Flow
- Visualisation via dashboard
- Automatisation via scénario
- Objectif : démontrer la maîtrise de toutes les étapes vues pendant la formation
- Feedback final et retour individuel sur le projet
Pour aller plus loin
Formation Pytorch
Formation Tensorflow
Formation Spark Machine Learning
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
Les + : Formation adaptée au niveau des participants + petit groupe (plus facile en distanciel quand il y a des novices)
Afficher tous les témoignages
Les + : Formation adaptée au niveau des participants + petit groupe (plus facile en distanciel quand il y a des novices)
Je recommande la formation
Je recommande la formation
Noter la formation
1790€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS