Sélectionner une page
Formations Data Apache Formation Apache Arrow : Plateforme de développement multilingue pour l’analyse en mémoire

Formation Apache Arrow

Formation Apache Arrow
Prix 1600€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

Présentation

 Traitez efficacement vos données en mémoire avec notre formation Apache Arrow pour permettre d’avoir des échanges fluides entre vos différents frameworks.

À l’issue de cette formation, vous allez apprendre à utiliser Apache Arrow pour manipuler des données massives de manière efficiente, à intégrer plusieurs outils de traitement de données et aussi à effectuer des opérations analytiques complexes.

De plus, cet outil vous enseignera à maîtriser plusieurs concepts avancés de gestion de mémoire, d’optimisation des performances et de parallélisme des données à grande échelle.

Par ailleurs, cette technologie vous garantit la portabilité des données et elle simplifie le développement de logiciels.

Comme dans toutes nos formations, celle-ci vous présentera la toute dernière version d’Apache Arrow (à la date de rédaction de l’article : Apache Arrow 15.

 

Objectifs

  • Explorer l’architecture interne d’Apache Arrow
  • Développer et tester des fonctionnalités avec Apache Arrow
  • Intégrer les pratiques d’intégration continue et de packaging
  • Savoir effectuer des opérations analytiques

 

Public visé

  • Développeurs
  • Ingénieurs
  • Data Analyst

 

Pré-requis

  • Connaissance de base en programmation (Python, Java)
  • Compréhension des concepts de traitement de données et de manipulation de fichiers

PROGRAMME DE NOTRE FORMATION APACHE ARROW

 

INTRODUCTION À APACHE ARROW

  • Présentation d’Apache Arrow et son écosystème
  • Importance d’Apache Arrow dans le Big Data et l’analyse de données
  • Concepts clés : colonnes, tableaux, schémas, et types de données
  • Avantages de l’utilisation d’Apache Arrow pour le traitement de données en mémoire
  • Installation d’Apache Arrow et configuration de l’environnement de développement

 

ARCHITECTURE ET CONCEPTION

  • Vue d’ensemble de l’architecture interne d’Apache Arrow
  • Comprendre la représentation en mémoire et le format de données columnar
  • La bibliothèque Arrow et ses différentes langages de programmation (C++, Python, Java, etc.)
  • Exploration des interfaces IPC (Inter-Process Communication) et Flight (gRPC)
  • Utilisation des datasets et des RecordBatches

 

CONTRIBUER À APACHE ARROW

  • Guide pour les nouveaux contributeurs : Comment commencer
  • Processus pour signaler des bugs et suggérer des fonctionnalités
  • Réaliser et soumettre votre première Pull Request (PR)
  • Bonnes pratiques pour le travail collaboratif avec Git et GitHub
  • Cycle de vie d’une pull request et revue de code

 

DÉVELOPPEMENT ET TESTS

  • Configuration de l’environnement de développement pour différentes langues
  • Compilation des bibliothèques Arrow : étapes et dépannage
  • Écrire, exécuter et déboguer des tests unitaires et d’intégration
  • Appliquer les conventions de style de codage d’Apache Arrow
  • Utilisation des outils de développement quotidiens comme Archery

 

INTÉGRATION CONTINUE ET PACKAGING

  • Présentation de l’intégration continue dans le projet Arrow
  • Exécution de builds Docker pour la validation des changements
  • Utilisation de Crossbow pour le packaging et les tests
  • Comprendre les outils et les processus de build automatisés
  • Résolution des problèmes courants lors de l’intégration continue

 

TUTORIELS ET RESSOURCES SUPPLÉMENTAIRES

  • Tutoriels pratiques pour l’utilisation d’Arrow en Python et R
  • Accéder à des ressources complémentaires pour approfondir vos connaissances
  • Aide avec la documentation : comment contribuer et améliorer les documents
  • Exemples d’utilisation avancée d’Apache Arrow dans des cas réels
  • Discussion sur les dernières mises à jour et les fonctionnalités à venir

Pour aller plus loin

Formation Docker

Formation Notion

Formation Apache Hop

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Afficher tous les témoignages

⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !

Noter la formation

Prix 1600€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp