Formations › Data › Machine Learning › Formation Dataiku : La plateforme DSS

Formation Dataiku : La plateforme DSS

Niveau confirmé

Catégorie Essential

Prix	1790€ ^HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

lun 26

mar 27

Mai



lun 21

mar 22

Juillet

lun 17

mar 18

Novembre

lun 9

mar 10

Mars

 Dernières places  Virtuelle uniquement

Labs : Infrastructure DaaS avec Chrome



Cafés et déjeuners offerts en interentreprises



En intra-entreprise pour former votre équipe

Aide au financement 4000€ Bonus Atlas CPF

Nouveauté Programme fidélité : 5% cumulé

Présentation

Dataiku est une plateforme data science permettant la création de modèle tout en industrialisant en toile de fonds l’ensemble des chaînes de traitement : collecte, préparation des données…

Grâce à cette formation Dataiku, votre équipe pourra en apprendre davantage sur les fonctionnalités de Dataiku. Elle saura s’interfacer sur des environnements Cloud, améliorer votre organisation en mettant en valeur la donnée au cœur de votre stratégie.

Cet outil collaboratif va permettre à votre entreprise d’avoir à disposition des fonctionnalités autour du Machine Learning et de la Data Science.

Mais aussi de convertir les données en prédiction, utiliser pour explorer, développer vos propres produits data. Vous pourrez préparer votre plateforme afin d’automatiser le workflow et déployer la production.

Pour cette formation, nous utilisons la dernière version : DSS 11.

Objectifs

Identifier les concepts fondamentaux de Dataiku DSS et son interface (Flow, Flowzones, recettes, moteurs, projets)
Importer, préparer et enrichir des jeux de données à l’aide des recettes visuelles
Structurer un projet complet avec une logique de Flow claire et export des résultats
Créer des visualisations interactives dans un dashboard
Automatiser l’exécution de traitements via les scénarios
Mettre en œuvre un projet complet de bout en bout dans Dataiku

Public visé

Data analysts
Data scientists
Data engineers
Analyst SAS

Pré-requis

Connaissances en data science.

Pré-requis logiciel

Une instance Dataiku DSS installée et accessible aux participants
Un accès aux bases de données (SQL, NoSQL) ou des fichiers de données pour les exercices
Connexion aux API et services cloud si nécessaire

Programme de notre formation Dataiku

Introduction à Dataiku DSS

Présentation de la plateforme DSS : interface, logique projet/Flow
Comprendre les Flowzones pour organiser les traitements
Types de stockage et moteurs d’exécution
Importation de fichiers (CSV, Excel)
Cas pratique : création d’un projet DSS et premier import de données

PRÉPARATION ET NETTOYAGE DES DONNÉES

Exploration des données importées : types de colonnes, formats, qualité
Nettoyage des données avec la recette “Prepare” :
- Normalisation des formats
- Traitement des valeurs manquantes
- Renommage et filtrage de colonnes
Cas pratique : préparer un jeu de données clients

ENRICHISSEMENT ET TRANSFORMATION DES DONNÉES

Enrichissement par jointure de plusieurs datasets (recette Join)
Regroupement et agrégation des données (recette Group)
Structuration d’un Flow de traitement avec zones dédiées
Cas pratique : enrichir un jeu de données avec des commandes ou des informations produit

STRUCTURATION ET EXPORT DU FLOW

Création de Flowzones et organisation logique du projet
Documentation des recettes et gestion des dépendances
Export de données (CSV, Excel, base de données)
Cas pratique : finaliser un Flow complet, prêt à l’export

DATA VISUALISATION ET DASHBOARDS

Bonnes pratiques en data visualisation
Création de graphiques à partir d’un dataset
Mise en page et filtrage dans un Dashboard interactif
Cas pratique : construire un dashboard des ventes ou clients

PERSONNALISÉ : RECETTES ET OUTILS ADAPTÉS AUX BESOINS MÉTIERS

Écoute et identification des cas d’usage spécifiques des participants
Présentation de recettes ou plugins pertinents pour leurs contextes métier
Démonstration ciblée sur des données adaptées
Accompagnement à l’exploration libre ou approfondissement au cas par cas

AUTOMATISATION DES TRAITEMENTS

Introduction aux scénarios dans Dataiku
Création d’un scénario simple : nettoyage, enrichissement, export
Ajout d’étapes et déclencheurs (triggers)
Cas pratique : automatiser l’exécution d’un projet

ÉTUDE DE CAS FINALE : PROJET COMPLET

Réalisation d’un projet de A à Z :
- Import, nettoyage, enrichissement
- Structuration du Flow
- Visualisation via dashboard
- Automatisation via scénario
Objectif : démontrer la maîtrise de toutes les étapes vues pendant la formation
Feedback final et retour individuel sur le projet

Pour aller plus loin

Formation Pytorch

Formation Tensorflow

Formation Spark Machine Learning

Télécharger le plan du cours

Download the course outline

Langues et Lieux disponibles

 Langues

Français
Anglais / English

 Lieux

France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
Belgique
- Bruxelles
- Liège
Suisse
- Genève
- Zurich
- Lausanne
Luxembourg

Témoignages

29 novembre 2024

Les + : Formation adaptée au niveau des participants + petit groupe (plus facile en distanciel quand il y a des novices)

Lydia P. de chez CIMES Pour le compte de MSD FRANCE

Afficher tous les témoignages