Formation Apache Arrow
1600€ HT / personne |
2 jours (14 heures) |
Présentation
Traitez efficacement vos données en mémoire avec notre formation Apache Arrow pour permettre d’avoir des échanges fluides entre vos différents frameworks.
À l’issue de cette formation, vous allez apprendre à utiliser Apache Arrow pour manipuler des données massives de manière efficiente, à intégrer plusieurs outils de traitement de données et aussi à effectuer des opérations analytiques complexes.
De plus, cet outil vous enseignera à maîtriser plusieurs concepts avancés de gestion de mémoire, d’optimisation des performances et de parallélisme des données à grande échelle.
Par ailleurs, cette technologie vous garantit la portabilité des données et elle simplifie le développement de logiciels.
Comme dans toutes nos formations, celle-ci vous présentera la toute dernière version d’Apache Arrow (à la date de rédaction de l’article : Apache Arrow 15.
Objectifs
- Explorer l’architecture interne d’Apache Arrow
- Développer et tester des fonctionnalités avec Apache Arrow
- Intégrer les pratiques d’intégration continue et de packaging
- Savoir effectuer des opérations analytiques
Public visé
- Développeurs
- Ingénieurs
- Data Analyst
Pré-requis
- Connaissance de base en programmation (Python, Java)
- Compréhension des concepts de traitement de données et de manipulation de fichiers
PROGRAMME DE NOTRE FORMATION APACHE ARROW
INTRODUCTION À APACHE ARROW
- Présentation d’Apache Arrow et son écosystème
- Importance d’Apache Arrow dans le Big Data et l’analyse de données
- Concepts clés : colonnes, tableaux, schémas, et types de données
- Avantages de l’utilisation d’Apache Arrow pour le traitement de données en mémoire
- Installation d’Apache Arrow et configuration de l’environnement de développement
ARCHITECTURE ET CONCEPTION
- Vue d’ensemble de l’architecture interne d’Apache Arrow
- Comprendre la représentation en mémoire et le format de données columnar
- La bibliothèque Arrow et ses différentes langages de programmation (C++, Python, Java, etc.)
- Exploration des interfaces IPC (Inter-Process Communication) et Flight (gRPC)
- Utilisation des datasets et des RecordBatches
CONTRIBUER À APACHE ARROW
- Guide pour les nouveaux contributeurs : Comment commencer
- Processus pour signaler des bugs et suggérer des fonctionnalités
- Réaliser et soumettre votre première Pull Request (PR)
- Bonnes pratiques pour le travail collaboratif avec Git et GitHub
- Cycle de vie d’une pull request et revue de code
DÉVELOPPEMENT ET TESTS
- Configuration de l’environnement de développement pour différentes langues
- Compilation des bibliothèques Arrow : étapes et dépannage
- Écrire, exécuter et déboguer des tests unitaires et d’intégration
- Appliquer les conventions de style de codage d’Apache Arrow
- Utilisation des outils de développement quotidiens comme Archery
INTÉGRATION CONTINUE ET PACKAGING
- Présentation de l’intégration continue dans le projet Arrow
- Exécution de builds Docker pour la validation des changements
- Utilisation de Crossbow pour le packaging et les tests
- Comprendre les outils et les processus de build automatisés
- Résolution des problèmes courants lors de l’intégration continue
TUTORIELS ET RESSOURCES SUPPLÉMENTAIRES
- Tutoriels pratiques pour l’utilisation d’Arrow en Python et R
- Accéder à des ressources complémentaires pour approfondir vos connaissances
- Aide avec la documentation : comment contribuer et améliorer les documents
- Exemples d’utilisation avancée d’Apache Arrow dans des cas réels
- Discussion sur les dernières mises à jour et les fonctionnalités à venir
Pour aller plus loin
Formation Docker
Formation Notion
Formation Apache Hop
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1600€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS