Formation Azure Databricks
1590€ HT / personne |
2 jours (14 heures) |
Présentation
Azure Databricks est la solution pour manipuler un nombre massif de clusters de base de données. Azure Databricks s’appuie sur la puissance du Cloud de Microsoft pour simplifier votre processus Big Data.
Azure Databricks est une version améliorée d’Apache Spark géré entièrement par Azure. Le système est alors facilement scalable et contrôlable afin de réduire vos coûts durant la phase de développement.
Le système dispose de différents connecteurs comme ADSL, Azure SQL DW ou encore PowerBI. C’est également un outil hautement sécurisé, intégrant le cadre de sécurité Azure Active Directory.
Notre formation Azure Databricks vous enseignera comment utiliser cet outil lors de votre processus ETL. Nous vous présenterons comment extraire, transformer et charger des donnés avec Azure Databricks, nous évoquerons aussi la création de dashboard et de pipelines.
Notre formation Azure Databricks présentera la dernière version de l’outil à savoir, Azure Databricks.
Objectifs
- Bien connaître les spécificités de Azure Databricks
- Extraire les données avec Azure Databricks
- Savoir comment transformer et charger ses données
- Utiliser les dashboards et déployer son processus
Public visé
- Développeurs
- Data Engineer
- Architectes
- Administrateurs système
- Data miners
- Data scientists
- Data analysts
- Business intelligence analysts
- Market inteligence analysts
Pré-requis
- Avoir idéalement suivi nos formations Spark ML ou Spark Tuning Avancé
- Connaissance en SQL et Python
Pré-requis logiciel
- Disposer d’un compte Azure
- Disposer d’un compte Databricks
Programme de la formation Azure Databricks
INTRODUCTION
- Présentation de Databricks
- Les bénéfices de l’outil
- Databricks vs Apache Spark
- Présentation de l’interface
- Créer son workspace
- Présentation des notebooks
- Créer les composants d’Azure Databricks (cluster, job, pool)
EXTRACTION DES DONNÉES
- Les différentes tables (schemas, databases, tables)
- Les sources et les destinations
- Naviguer sur les fichiers système
- Le dossier Filestore
- Importer les données depuis son ordinateur
- Importer les données du web
- Importer les données avec SQL et Python
- Connecter ses données Excel, PowerBI et PyCharm
TRANSFORMATION DES DONNÉES
- Trouver et modifier les valeurs null
- Supprimer les données dupliquées
- Supprimer les valeurs extrêmes
- Mise en cache
- Compression des données
CHARGEMENT DES DONNÉES
- Méthodes de sauvegarde
- Managed vs unmanaged tables
- Gérer les partitions
- Connexion avec Azure SQL, Oracle et MongoDB
DASHBOARD ET DÉPLOIEMENT DU PROCESSUS
- Notebooks de tableaux de bord
- Créer un travail planifié pour rafraîchir le dashboard
- Présentation d’un pipeline Azure Databricks CI/CD
- Développer et valider son code
- Définir son pipeline de build
- Définir son pipeline de mise en version
Pour aller plus loin
Formation Azure Machine Learning
Formation Gouvernance avec Azure
Formation AZ-104
Formation Azure Data Factory
Formation Serverless
Formation Terraform
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
Les + : Très clairs et précis
Les – : ras
Je souhaite suivre : Probablement une partie sur Azure devops plus précisément.
En synthèse : très bien
Afficher tous les témoignages
Les + : Très clairs et précis
Les – : ras
Je souhaite suivre : Probablement une partie sur Azure devops plus précisément.
En synthèse : très bien
Les + : Très bonne présentation globale d’Azure Databricks. Le formateur s’adapte très facilement et à l’écoute des stagiaires. Il a su répondre aux demandes et a su proposer de nouveaux TP en fonction du rythme d’avancement. L’alternance théorie/pratique est bien dosée
Les – : peut être qu’un journée de plus aurait été nécessaire
Les + : Une formation adaptée au besoin
Les – : Les accès à la formation de Databricks doivent être apportés par les clients
Je souhaite suivre : Aucune
Les + : Adaptabilité, didactique, professionnel
Les + : L’adaptabilité des TP au niveau des participants
Je souhaite suivre : Découverte de l’outil Azure DevOps
Les + : Alternance théorie et pratique
Les – : Un petit peu très guidée mais très bien pour l’initiation à Databricks
Noter la formation
1590€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS