Formation Data Version Control : gestion avancée des données
1490€ HT / personne |
2 jours (14 heures) |
Présentation
Notre formation Data Version Control vous permettra de maitriser DVC pour une gestion optimale de vos données. Vous serez en mesure de gérer facilement les versions de vos ensembles de données, de suivre les modifications apportées au fil du temps et de revenir à des versions antérieures si nécessaire.
Notre formation DVC vous permettra de partager et de synchroniser vos ensembles de données, pour une collaboration efficace sur vos projets. Vous pourrez efficacement gérer des ensembles de données volumineux en optimisant le stockage, en utilisant des fonctionnalités d’échantillonnage et en économisant de l’espace.
Dans cette formation, vous découvrirez comment intégrer DVC avec d’autres outils couramment utilisés dans le domaine de la science des données, tels que TensorFlow, PyTorch et MLflow, pour une intégration harmonieuse dans vos workflows. Vous bénéficierez de conseils pratiques, de bonnes pratiques et d’astuces pour structurer votre projet, optimiser les performances et résoudre les problèmes courants.
Objectifs
- Comprendre les concepts fondamentaux de DVC et ses fonctionnalités clés
- Maîtriser la gestion des versions des ensembles de données avec DVC
- Apprendre à collaborer efficacement avec d’autres membres de l’équipe grâce à DVC
Public visé
- Data scientists
- Ingénieurs en apprentissage automatique
- Data analysts
Pré-requis
- Connaissance de base en programmation
- Compréhension des concepts de base des systèmes de contrôle de version
Programme de notre formation DVC
Introduction à DVC
- Qu’est-ce que DVC ?
- Contrôle de version pour le code source vs contrôle de version pour les données
- Vue d’ensemble des fonctionnalités principales de DVC
Configuration de base
- Installation de DVC et de ses dépendances
- Initialisation d’un projet
- Configuration de l’emplacement de stockage des données
Gestion des ensembles de données
- Ajout d’un ensemble de données à DVC
- Suivi des modifications apportées à un ensemble de données
- Création de versions des ensembles de données
Collaboration et partage
- Utilisation de dépôts distants pour la collaboration
- Partage des ensembles de données
- Récupération des ensembles de données partagés
Expérimentation et reproductibilité
- Création d’une configuration d’expérience
- Enregistrement des résultats et des métriques expérimentales
- Reproduction des expériences précédentes
Ensembles de données volumineux
- Gestion des ensembles de données volumineux
- Stratégies de stockage efficace des données
- Fonctionnalités d’échantillonnage
Intégration d’outils externes
- Intégration de frameworks d’apprentissage automatique (TensorFlow, PyTorch)
- Plates-formes de gestion des expériences (MLflow)
Fonctions Avancé
- Utilisation de DVC avec des pipelines de traitement des données
- Branches et expériences parallèles
- Tags pour marquer des versions spécifiques des ensembles de données
Sécurité et gestion des autorisations
- Contrôle d’accès aux ensembles de données
- Gestion des secrets
- Audit et suivi des modifications
- Intégration avec les outils de sécurité existants
Déploiement et déploiement en production
- Ensembles de données en production
- Déploiement en production (Kubernetes, Docker)
Études de cas
- Projet d’apprentissage automatique
- Projet de recherche en sciences des données
Ressources supplémentaires
- Documentation officielle et ressources en ligne
- Communauté et forums
Pour aller plus loin
Formation Airtable
Formation Snowflakes
Formation Elastic Stack ELK
Langues et Lieux disponibles
Langues
- Français
- Anglais / English
Lieux
-
France entière
- Paris
- Lille
- Reims
- Lyon
- Toulouse
- Bordeaux
- Montpellier
- Nice
- Sophia Antipolis
- Marseille
- Aix-en-Provence
- Nantes
- Rennes
- Strasbourg
- Grenoble
- Dijon
- Tours
- Saint-Étienne
- Toulon
- Angers
-
Belgique
- Bruxelles
- Liège
-
Suisse
- Genève
- Zurich
- Lausanne
-
Luxembourg
Témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Afficher tous les témoignages
⭐⭐⭐⭐⭐ 4,8/5 sur Google My Business. Vous aussi, partagez votre expérience !
Noter la formation
1490€ HT / personne |
2 jours (14 heures) |
UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?
Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.
ILS SE SONT FORMÉS CHEZ NOUS