Sélectionner une page
Formations Data Apache Formation Apache Iceberg

Formation Apache Iceberg

Formation Apache Iceberg
Prix 2390€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

Présentation

Vous cherchez un format de table pour l’ensemble de vos données analytiques ? Notre formation Apache Iceberg vous permettra de comprendre comment utiliser pour toutes vos analyses statistiques.

Ce framework open source vous offre une gestion efficace des tables massives avec plusieurs fonctionnalités comme l’intégrité transactionnelle et la compatibilité multiplateforme.

Durant ce cours, vous découvrirez la traçabilité des données qui permettent de suivre l’historique complet des modifications.

Cette formation devrait vous permettre d’acquérir une expertise dans la gestion des données à grande échelle, et vous devriez être capable de concevoir et gérer des données massives.

Comme pour toutes, la formation Apache Iceberg vous sera présentée avec ses toutes dernières nouveautés (à la date de rédaction de l’article).

 

Objectifs

  • Comprendre les fondamentaux d’Apache Iceberg
  • Apprendre les techniques d’optimisation des performances des tables
  • Savoir écrire et exécuter des requêtes de lecture et d’écriture dans Iceberg
  • Comprendre la gestion des catalogues et la sécurisation des données
  • Maîtriser l’architecture d’Iceberg ainsi que les couches de données et métadonnées

 

Public visé

  • Data scientists
  • Data analysts
  • Data engineers
  • Architectes

 

Pré-requis

  • Compréhension des concepts fondamentaux des data lakes et des bases de données
  • Connaissance en programmation (Python) et du SQL

PROGRAMME DE NOTRE FORMATION APACHE ICEBERG

 

Introduction à Apache Iceberg

  • Initiation
  • Entrepôt de données
  • Lac de données
  • Découvrir ce qu’est Hive
  • Formats de table

 

Architecture

  • La couche des données
  • La couche des métadonnées
    • Fichiers manifestes
    • Listes de manifestes
    • Fichiers de métadonnées
    • Fichiers macareux
  • Le catalogue

 

Cycle de vie des requêtes d’écriture et de lecture

  • Écrire des requêtes dans Apache Iceberg
    • Créer le tableau
    • Insérer la requête
    • Fusionner la requête
  • Lecture de requêtes dans Apache Iceberg
    • La requête SELECT
    • La requête du voyage dans le temps

 

Optimisation des performances des tables

  • Compactage
  • Pratique avec le compactage
    • Stratégies
    • Automatisation
  • Tri
  • Ordre Z
  • Partitionnement
    • Partitionnement caché
    • Évolution des partitions
    • Autres considérations de partitionnement
  • Copie sur écriture et fusion sur lecture

 

Catalogues

  • Exigences d’un catalogue Iceberg
  • Comparaison du catalogue
  • Migration du catalogue
    • Utilisation de la CLI de migration du catalogue Apache Iceberg
    • Utiliser un moteur

 

Apache Spark

  • Configuration
  • Opérations du langage de définition de données
  • Lecture des données
  • Procédures d’entretien des tables Iceberg

 

Moteur de requête SQL de Dremio

  • Entretien des tables icebergs
  • Réécrire les fichiers de données
  • Réécrire les manifestes

 

Colle AWS

  • Configuration
    • Conception d’une base de données Glue
    • Configuration du travail Glue ETL
  • Création d’une table via le catalogue de données Glue
    • Lire le tableau
    • Insérer les données

 

Gouvernance et sécurité

  • Sécuriser les fichiers de données
  • Sécuriser et gouverner au niveau de la couche sémantique
    • Meilleures pratiques en matière de couche sémantique
    • Drémio
    • Trino
  • Sécuriser et gouverner au niveau du catalogue

Pour aller plus loin

Formation Python Analyse de données

Formation Deep Learning et réseaux de neurones

Formation Power BI

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 2390€ HT / personne
3 jours (21 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp