Formation Apache Doris : analyse de données à grande échelle
2690€ HT / personne |
3 jours (21 heures) |
Présentation
Notre formation Apache Doris vous donnera les compétences et les connaissances nécessaires pour exploiter toutes les capacités d’Apache Doris pour l’analyse de données en temps réel. vous apprendrez l’utilisation de cette data warehouse moderne, évolutive et efficace qui se distingue par sa rapidité et sa simplicité dans le traitement des données à grande échelle.
La formation vous familiarisera avec les concepts fondamentaux d’Apache Doris, y compris son architecture Massively Parallel Processing (MPP), les modèles de stockage de données et les techniques d’optimisation SQL.
Notre programme couvrira également la configuration et les opérations de base jusqu’à des sujets plus avancés tels que l’optimisation des performances, l’intégration des données et la connectivité Python.
Comme toutes nos formations, elle se déroulera sur la dernière version d’Apache Doris.
Objectifs
- Configurer Apache Doris
- Intégrer et gérer des flux de données
- Intégrer Python avec Doris
Public visé
- Data engineers
- Data analyst
Pré-requis
- Connaissance des databases et de SQL
- Connaissance de base de Python
Programme de notre formation Apache Doris
Introduction à Apache Doris
- Qu’est-ce qu’Apache Doris ?
- Caractéristiques de l’outil
- Applications et étude de cas
Configuration de l’environnement
- Installation
- Paramètres de base
- FE et BE
- Exercice : mise en place d’un cluster simple
Opérations de base
- Dashboard Doris
- Types de données
- Importation des données
- Requêtes SQL
- Stockage de données
Opérations SQL avancées
- Requêtes SQL avancées
- Optimisation des requêtes
- Jointures et sous-requêtes
- Fonction et application des fenêtres
- Agrégation et filtrage
Intégration de données
- Chargement de données par lot
- Méthodes d’ingestion de données en temps réel
- Intégration avec Kafka
- Intégration avec Flink
Optimisation des performances
- Mise à l’échelle des clusters
- Vues matérialisées
- Optimisation des performances
- Surveillance des clusters
- Indexation
Intégration avec Python
- Configuration de Python
- Connexion avec Doris
- Manipulation de données
- Visualisation des données avec les bibliothèques python
Sécurité
- Privilèges et contrôle d’accès
- configurer le SSL
- Métadonnées
- Stratégies de sauvegarde
Fonctions avancées
- JSON
- Architecture Lakehouse
- Partition dynamique
- Analyse en temps réel
- Optimisation pour le cloud
Formation continue
- Utiliser les ressources de la communauté apache
- Suivit des MAJ
- Contribuer au projet
Pour aller plus loin
Formation Python débutant
Formation Apache Kafka
Formation Airflow
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
2690€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS