Formation Samza
2490€ HT / personne |
3 jours (21 heures) |
Présentation
Samza est un moteur de traitement de données évolutif qui vous permet de traiter et d’analyser vos données en temps réel. Notre formation Samza va vous permettre de comprendre en profondeur et de simplifier le flux de vos données.
Dans cette formation pratique, vous apprendrez à gérer, mettre en place, administrer et configurer Samza.
Vous découvrirez comment utiliser Samza pour manipuler des pipelines de données, à maîtriser ses concepts, à utiliser les composants principaux, son architecture de base et à appeler ses API.
Au terme de cette formation, vous serez capable de configurer, d’optimiser et d’automatiser vos flux de données. Vous maîtriserez la configuration et le déploiement des API, l’optimisation des performances ainsi que la gestion de la latence et de la scalabilité de votre plateforme.
Comme pour toutes, la formation Samza vous sera présentée avec sa dernière version : Samza 1.8.0.
Objectifs
- Comprendre l’architecture de Samza
- Comprendre le fonctionnement des flux de données
- Utiliser et comprendre les outils et les API
- Sécuriser les différents flux
- Comprendre le fonctionnement de Samza réussir à l’intégrer.
Public visé
- Data Scientists
- Développeurs
- Architectes
- Data analysts
- Data engineers
Pré-requis
- Bonne compréhension des bases de données et de la manipulation de fichiers structurés
- Expérience avec un langage de programmation, tel que Python ou Java
- Connaissances de base en traitement de données massives (Hadoop, Spark, etc.)
- Familiarité avec les concepts de stockage en colonnes et de compression
Programme de la formation Samza
INTRODUCTION A SAMZA
- Présentation de Samza
- Avantages de l’utilisation de Samza pour traiter de grandes quantités de données
- Cas d’utilisation typiques
- Introduction au fonctionnement de Samza
PRÉSENTATION, CONCEPTS DE BASE
- Introduction à Samza
- Le flux et la partition
- Les demandes de flux
- Le traitement d’état
- Le temps de traitement et le temps d’un événement
ARCHITECTURE
- Modèle de threading et des commandes
- Gestion des états
- Tolérance aux pannes de l’état
- Distributed execution
- Tâches
- container
- Coordinateur
- Différentes affinités de l’hôte
CONFIGURATION DE SAMZA
- Configuration d’application Samza
- Configuration d’application avancée
- Les différents points de contrôle, système et flux
- Configurations pour la consommation et la production sur Amazon Kinesis
PRÉSENTATION DE L’API
- Introduction des API fournies par Samza
- Concepts clés et application Samza
- Flux et table Descriptors
- Définir la logique du traitement de flux
API DE HAUT ET BAS NIVEAU
- Différence, définition des API et des exemples de code
- Concepts clés et opérateurs
- Sérialisation des données et application
- Samza TABLE API
DÉPLOIEMENT DE SAMZA
- Les options de déploiement
- Le fonctionnement sur YARN
- Intégration de Samza dans la bibliothèque et son exécution
LES DIFFÉRENT CONNECTEURS DE SAMZA
- Présentation des connecteurs
- Apache Kafka
- Azure Event Hubs
- AWS Kinesis
Formation Kafka
Formation Spark Streaming
Formation Cassandra
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Nos Formateurs Référents
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
2490€ HT / personne |
3 jours (21 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS