Sélectionner une page
Formations Data Analyse de données Formation Starburst

Formation Starburst

formation Starburst
Prix 2690€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

Présentation

Notre formation Starburst vous permettra de maitriser les fonctionnalités de ce data lakehouse et d’améliorer grandement vos processus d’analyse de données. Starburst dispose d’une architecture de données haute performance qui permet un traitement et une analyse rapides.

Ce programme de formation vous permettra de comprendre l’ensemble de l’architecture et de la terminologie de StarBurst ainsi que son utilisation avec Trino, le moteur d’analyse SQL.

Notre formation vous permettra de mettre vos connaissances à l’épreuve avec des exercices pratiques. Vous disposerez d’un entrepôt de données évolutif et sécurisé ainsi que la gouvernance nécessaire pour garantir que vos équipes d’ingénieurs et d’analystes ne rencontrent jamais de problèmes.

Comme toutes nos formations, elle se déroulera sur la dernière version de l’outil : Trino 448

 

Objectifs

  • Configurer Starburst pour vos flux de données
  • Comprendre l’utilisation du SQL dans Starburst
  • Gérer et exploiter votre base de données Starburst

 

Public visé

  • Data Analysts
  • Data scientists

 

Pré-requis

  • Une connaissance de base en SQL et en manipulation de données
  • Connaissance de base des commandes Linux/Unix

PROGRAMME DE NOTRE FORMATION STARBURST

 

INTRODUCTION À STARBURST

  • Présentation générale de Starburst
  • Composants clés et architecture
  • Avantages et cas d’utilisation
  • Introduction aux plateformes
  • Vue d’ensemble des connecteurs Starburst

 

FONDAMENTAUX DU SQL ET DE LA PARALLÉLISATION

  • Principes de base du SQL dans Starburst
  • Techniques de parallélisation des requêtes
  • Utilisation des agrégations et requêtes conditionnelles
  • Syntaxe SQL et jointures
  • Comprendre le langage de définition des données (DDL)

 

CARACTÉRISTIQUES AVANCÉES DE STARBURST

  • Exploration des tutoriels sur les fonctionnalités de Starburst
  • Exécution tolérante aux pannes et haute disponibilité
  • Fédération des données et mise à l’échelle des clusters
  • Introduction aux produits de données et contrôle d’accès
  • Découverte de schémas et recherche universelle

 

GESTION DES BASES DE DONNÉES ET STOCKAGE

  • Types de bases de données : relationnelles vs non relationnelles
  • Gestion des Data Warehouses et des Data Lakes
  • Formats de fichiers orientés ligne et colonne
  • Stockage d’objets dans le cloud et métadonnées
  • Comparaison des formats de table modernes : Hive vs Iceberg

 

CONCEPTION ET AUTOMATISATION DES PIPELINES DE DONNÉES

  • Principes de l’ETL (Extract, Transform, Load)
  • Automatisation et intégration des pipelines de données avec Starburst
  • Construction de jeux de données organisés comme des produits
  • Meilleures pratiques pour la gestion des pipelines de données

 

INTÉGRATION AVEC D’AUTRES SOLUTIONS

  • Compréhension des outils ETL tels que dbt et Informatica
  • Utilisation des outils BI comme Tableau et Power BI
  • Notions de base sur les outils de gouvernance et de catalogage
  • Intégration pratique avec des exemples de configuration

 

DÉPANNAGE ET SÉCURITÉ

  • Identification et résolution des problèmes de performance des requêtes
  • Stratégies de mise à l’échelle des clusters pour l’optimisation
  • Sécurité des données et contrôle d’accès basé sur les rôles et les attributs
  • Best practices pour la maintenance et la sécurité des systèmes

 

ATELIERS PRATIQUES ET ÉTUDES DE CAS

  • Mise en place d’un environnement Starburst
  • Exécution de requêtes complexes et optimisation
  • Simulation de dépannage sur des scénarios réels
  • Création de tableaux de bord d’analyse avec intégration BI

 

RÉVISION ET ÉVALUATION FINALE

  • Révision des principaux concepts et fonctionnalités de Starburst
  • Test de connaissances avec des questions d’examen basées sur des cas réels

 

Pour aller plus loin

Formation Power BI

Formation Power Platform

Formation Elastisearch

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Nos Formateurs Référents

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 2690€ HT / personne
Durée 3 jours (21 heures)

Paris | Classe Virtuelle

Il ne reste que quelques places
Cafés et déjeuners offerts en interentreprises
Disponible en intra-entreprise pour former votre équipe
Aide au Financement 4000€ de Bonus Atlas en CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp