Sélectionner une page
Formations Data ETL Formation Dagster : Orchestration des pipelines de données dans le cloud

Formation Dagster : Orchestration des pipelines de données dans le cloud

Formation Dagster

Prix 2400€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

Présentation

La formation Dagster, vous apprendra à utiliser cet orchestrateur de données. Vous saurez manier avec perfection ce cadre pour la création de pipelines de données et les expédier à une vitesse extraordinaire.

Durant cet apprentissage, votre équipe saura ingérer des données provenant de sources externes ou d’autres ressources de données. Vous pourrez également combiner et transformer les données de manière significative.

Dagster vous sera utile, car il dispose de trois points clés qui le rendent donc unique. Votre entreprise sera apte à développer localement et effectuer des tests automatisés. Vous pourrez notamment calculer la valeur d’un actif grâce à une fonction Python pure déclarative. Grâce à son découplage des canalisations de l’environnement, vous accèderez à un grand nombre de fonctionnalités.

Comme toutes nos formations, celle-ci vous présentera la dernière version en date et ses nouveautés : Dagster 1.1.

 

Objectifs

  • Savoir intégrer divers outils dans Dagster
  • Savoir où utiliser un actif stocké
  • Maîtriser l’ensemble des concepts
  • Comprendre l’architecture de déploiement et la mettre en place

 

Public visé

  • Data Scientists
  • Data Analysts
  • Ingénieurs d’analyse
  • Ingénieurs de données
  • Ingénieurs DevOps

 

Pré-Réquis

  • Connaissances générales sur les données
  • Connaissance du langage Python

Programme de notre formation Dagster

 

Introduction

  • Présentation de Dagster
  • Installation
  • Premier pas avec Dagster
  • Télémétrie

 

Création d’un nouveau projet

  • Utilisation du squelette de projet
  • Démarrage du serveur Web Today
  • Ajout de nouvelles dépendances Python
  • Test unitaire
  • Variables d’environnement et secrets

 

Actifs

  • Définir un actif
  • Construction de graphes de ressources
  • Définir des ressources sans valeurs de retour ou d’arguments
  • Test des actifs
  • Automatisation de la matérialisation des actifs
  • Partitionnement des actifs
  • Personnalisation du stockage des actifs
  • Travaux hors actifs

 

Concepts

  • Opérations
    • Crochets
    • Évènements
    • Tentatives
  • Graphiques
    • Dynamique
    • Emboîtement
  • Travaux
    • Métadonnées et balises
    • Exécution des travaux
  • Programmes
    • Capteurs
    • Cloisons
    • Lancement des remplissages
  • Lancement de l’interface utilisateur Dagit

 

Déploiement

  • Architecture de déploiement
  • Services de longue durée
  • Configuration
  • Flux d’exécution des tâches
  • Dagster Cloud

 

Intégrations

  • Utiliser Dagster avec Airflow
  • Spark
    • Exécution du code PySpark dans les opérations
    • Soumission d’opérations PySark sur EMR
  • Validation des DataFrames Pandas avec les types Pandas
  • Snowflake et Dagster
    • Utilisez Python pour analyser vos données stockées dans Snowflake sans requête SQL
    • Intégrez vos tables Snowflake à d’autres outils

Pour aller plus loin

Formation Apache Airflow

Formation Apache Nifi

Formation Alteryx

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 2400€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp