Formation Datalake
1600€ HT / personne |
2 jours (14 heures) |
Présentation
L’augmentation phénoménale des données non structurées nous pousse à maîtriser l’analyse et le traitement des datalakes, aussi appelés « lac de données ».
Le data lake est un ensemble regroupant une grande quantité de données hétérogènes. Ces données peuvent désormais être traitées de manière opérationnelle en temps réel.
La maîtrise d’une approche data lake vous permettra de découvrir des données rares et diverses pouvant avoir un fort impact sur les performances de votre organisation.
Cette formation datalake de 2 jours vous enseignera comment ingérer, modifier et stocker vos données. Vous apprendrez également comment implémenter une architecture lambda.
Objectifs
- Comprendre le métier de Data Engineer
- Monter un Datalake
- Mettre à disposition rapidement un important volume de données prêtes à l’emploi
Public visé
- Data Scientists
- Devops
- Développeurs
- Vous travaillez avec data engineers
Pré-requis
Base en programmation
Programme de notre formation Datalake
QU’EST-CE QUE LE BIG DATA ?
• Définition du Big Data
• Définition du Data Engineering
• Cartographie des compétences
• Principaux use cases de Data Engineering
Atelier pratique : mise en place de l’environnement
UTILITÉ D’UN DATALAKE
• Théorème de CAP
• Qu’est-ce qu’un ETL et un ELT ?
• Définition d’un datalake
• Système de fichiers distribués
Atelier pratique : manipulation de noeuds HDFS
INGESTION DES DONNÉES
• Manipulation de données en temps réel avec Kafka
• Gestion des flux de données avec Nifi
Atelier pratique : ingestion de données en temps réel dans un datalake avec Nifi et Kafka
TRANSFORMATION DES DONNÉES
• Différence entre données structurées et non structurées
• Le paradigme MapReduce
• L’écosystème Hadoop
• Transformation de données avec Spark
Atelier pratique : uniformisation du format et enrichissement des données sur un data lake
MISE À DISPOSITION DE LA DONNÉE
• Définition d’un Datawarehouse
• Valeur ajoutée de Hyve pour l’exposition des données
• Atelier pratique : mise à disposition des données structurées avec Hyve
• Visualisation de données structurées
ARCHITECTURE LAMBDA
• Qu’est-ce qu’une architecture Lambda
• Implémentation d’une architecture Lambda dans un Datalake
Atelier pratique : implémentation d’une Architecture Lambda
Pour aller plus loin
Formation Databricks
Formation Data Mesh
Formation Data Vault
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1600€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS