Sélectionner une page
Formations Data ETL Formation Apache NiFi: Automatisez vos flux de données

Formation Apache NiFi : Automatisez vos flux de données

Niveau confirmé
Catégorie Essential
Logo formation Apache NiFi
Prix 1495€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

Présentation

Notre formation Apache NiFi vous permettra de facilement traiter et distribuer des données de manière performante.

En effet, proche d’un ETL, Apache NiFi est un outil qui a prouvé son efficacité, par delà le fait qu’il est hautement configurable afin que les utilisateurs bénéficient d’une livraison garantie, d’une faible latence, d’un débit élevé, d’une priorisation dynamique et d’une fonctionnalité permettant de modifier les flux en cours d’exécution.

Naturellement orienté vers les composants, le paradigme de NiFi est le flow-based programming (FBP). Des messages pouvant atteindre plusieurs giga-octets peuvent ainsi être traités de façon automatisée au sein de votre “usine de données”. Très productive, son interface intuitive permet de créer des flux de données par un simple glisser-déposer sans avoir besoin d’écrire la moindre ligne de code.

De plus, le programme est open-source et gratuit. Les documentations faisant référence à Apache NiFi sont nombreuses. Les utilisateurs du logiciel profitent de reportings personnalisés, d’une interface transparente pour le traitement des données avec la technologie DAG et d’un prototypage rapide.

NiFi supporte aussi les protocoles sécurisés comme SSL, HTTPS et SSH. Notre formation Apache NiFi se basera sur la dernière version du logiciel en date à savoir Apache NiFi 2.3.

 

Objectifs

  • Savoir installer et configurer Apache NiFi
  • Comprendre l’architecture et les fondements du traitement des données avec Apache NiFi
  • Maîtriser la gestion de flux de données
  • Intégrer Kafka avec NiFi

 

Public visé

Développeurs, Professionnels du Big Data, Architectes, Administrateurs systèmes, DevOps

 

Pré-requis

  • Connaissances de base des systèmes Unix
  • Connaissances de base en Java

Programme de la formation Apache NiFi

 

Introduction à NiFi et à l’Écosystème de Données

  • Vue d’ensemble de l’écosystème Big Data et rôle de NiFi
  • Cas d’usage et positionnement d’Apache NiFi
  • Principes fondamentaux du traitement des flux de données (Flow-Based Programming)
  • Introduction aux concepts clés de NiFi : FlowFile, Processeur, Connexion, Attributs

 

Installation, Configuration et Prise en Main de NiFi

  • Procédure détaillée d’installation et de configuration initiale de NiFi (Standalone, basée sur Unix)
  • Navigation et utilisation de l’interface utilisateur (UI) de NiFi
  • Comprendre les états des processeurs et des connexions
  • Ajouter, connecter et configurer ses premiers processeurs (GenerateFlowFile, LogAttribute)
  • Introduction essentielle au NiFi Expression Language (EL)
  • Introduction aux Controller Services : Rôle et gestion
  • Comprendre les Execution Engines (Traditional vs Stateless – Conceptuel)

 

Manipulation de Base des Données et des Flux

  • Travailler avec les attributs : UpdateAttribute, ExtractText
  • Gestion des fichiers : GetFile, PutFile, ListFile
  • Routage de base des FlowFiles : RouteOnAttribute
  • Introduction aux Processeurs orientés “Record”
  • Configuration des Record Readers/Writers (CSV, JSON)
  • Traitement de base des enregistrements : UpdateRecord, SplitRecord
  • Traitement spécifique JSON : EvaluateJsonPath, SplitJson
  • Gestion simple des erreurs et relation ‘failure’

 

Intégration Approfondie avec les Systèmes Externes (Focus Kafka & API)

  • Rappel des concepts clés d’Apache Kafka (Topic, Partition, Broker, Consumer Group)
  • Intégration NiFi-Kafka (Consommation) : Configurer et utiliser ConsumeKafkaRecord
  • Intégration NiFi-Kafka (Production) : Configurer et utiliser PublishKafkaRecord
  • Bonnes pratiques pour l’intégration NiFi-Kafka (Clés, Group ID, Formats)
  • Interaction avec les API REST (Client) : InvokeHTTP
  • Exposer une API simple avec NiFi : ListenHTTP, HandleHttpRequest/HandleHttpResponse
  • Interaction avec les bases de données (SQL) : QueryDatabaseTableRecord, PutDatabaseRecord

 

Administration, Surveillance et Optimisation des Flux NiFi

  • Surveillance de l’état de NiFi via l’UI (Dashboard, Status, Bulletins)
  • Analyse de la Provenance des Données (Data Provenance) : Suivi et investigation
  • Techniques de débogage avancées et gestion des erreurs (Files d’attente, stratégies de retry)
  • Gestion des utilisateurs et des accès : Politiques de base (Users, Groups, Policies globales)
  • Utilisation des Templates pour la réutilisation des flux
  • Introduction aux Parameter Contexts pour la gestion des configurations
  • Optimisation des performances : Back Pressure, Yield Duration, Concurrent Tasks
  • Introduction aux Reporting Tasks pour le monitoring externe
  • Introduction aux Flow Analysis Rules pour la validation des flux

 

Gestion Avancée, Sécurité et Écosystème NiFi

  • Introduction à NiFi Registry : Rôle et architecture
  • Gestion des versions des flux avec NiFi Registry (Enregistrer, Importer, Déployer)
  • Intégration avec un Schema Registry (ex: Confluent) pour la gestion centralisée des schémas
  • Gestion de la sécurité : Concepts clés (Authentification, Autorisation)
  • Gestion des certificats SSL/TLS pour la communication sécurisée (Controller Service StandardSSLContextService)
  • Introduction à la NiFi Command Line Interface (CLI) pour l’administration et l’automatisation
  • Gestion du Clustering dans NiFi : Concepts et avantages (Haute Disponibilité, Scalabilité)
  • (Optionnel) Introduction à MiNiFi pour la collecte de données à la source (Edge/IoT)

Pour aller plus loin

Formation Talend DI 

Formation Azure Data Factory

Formation Alteryx

Langues et Lieux disponibles

Langues

  • Français
  • Anglais / English

Lieux

  • France entière
    • Paris
    • Lille
    • Reims
    • Lyon
    • Toulouse
    • Bordeaux
    • Montpellier
    • Nice
    • Sophia Antipolis
    • Marseille
    • Aix-en-Provence
    • Nantes
    • Rennes
    • Strasbourg
    • Grenoble
    • Dijon
    • Tours
    • Saint-Étienne
    • Toulon
    • Angers
  • Belgique
    • Bruxelles
    • Liège
  • Suisse
    • Genève
    • Zurich
    • Lausanne
  • Luxembourg

Nos Formateurs Référents

Plus de 20 ans d’expérience en administration de base de données.

Enseignant expert en architecture et en modélisation de base de données pour les technologies Apache comme Kafka, Spark, Hadoop ou encore Cassandra.

J’ai également préconisé Kubernetes sur des architectures et je l’ai installé en production ainsi qu’un système de disque qui s’appelle glusterfs.

Témoignages

11 avril 2025

Les + : Très grande disponibilité du formateur, qui a su rester à l’écoute et ajuster son programme à mon niveau

Olivier W. de chez Inside - Agence de Toulouse

Afficher tous les témoignages

11 avril 2025

Les + : Très grande disponibilité du formateur, qui a su rester à l’écoute et ajuster son programme à mon niveau

Olivier W. de chez Inside - Agence de Toulouse
10 décembre 2024

Je recommande la formation

Faniriniaina Marie Francia R. de chez Orange Madagascar
10 décembre 2024

Les + : On a pu découvrir des fonctionnalités de NIFI que l’on ne savait pas avant, notamment le monitoring via les ReportingTasks.

L’utilisation de Nifi Registry pour le versionning control. L’utilisation des templates pour la sauvegarde, l’import/export des flux.

Les – : c’est le fait que la formation ait été faite à distance, dès fois la voix se coupe un peu.

Je souhaite suivre : Power BI

En synthèse : le délai de 2 jours semble trop court pour découvrir toutes les fonctionnalités de NIFI, on n’a pas pu aborder l’utilisation de NIFI avec Kafka

Andriantsalama Manjatonirina R. de chez Orange Madagascar
13 octobre 2023

Les + : Bonne couverture globale

Les – : Un jour supplémentaire serait nécessaire pour approfondir certains points, notamment sur le développement de flows avec des cas d’usage concret (connexion à kafka, à une base de données..)

Mathias G. de chez LA POSTE I-TEAM
13 octobre 2023

Je recommande la formation

Sylvie P.
7 juillet 2022

Pratique

Durée

Anthony R. de chez Modis
7 juillet 2022

Je recommande la formation

Christophe T. de chez Modis
7 juillet 2022

Les labs

Pas de correction des labs ensemble

Hugo M. de chez Modis
5 juillet 2022

les Labs

Patrice M. de chez Modis
5 juillet 2022

Mise en pratique

Stéphane M. de chez Modis
2 octobre 2020

Bon contenu/TP et très bonne formation.

Alexis de DeerCoder

Noter la formation

Prix 1495€ HT / personne
2 jours (14 heures)

Paris | Classe Virtuelle

Dernières places Virtuelle uniquement
Labs : Infrastructure DaaS avec Chrome
Cafés et déjeuners offerts en interentreprises
En intra-entreprise pour former votre équipe
Aide au financement 4000€ Bonus Atlas CPF

UNE QUESTION ? UN PROJET ? UN AUDIT DE CODE / D'INFRASTRUCTURE ?

Pour vos besoins d’expertise que vous ne trouvez nulle part ailleurs, n’hésitez pas à nous contacter.

ILS SE SONT FORMÉS CHEZ NOUS

partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp
partenaire sncf
partenaire hp
partenaire allianz
partenaire sfr
partenaire engie
partenaire boursorama
partenaire invivo
partenaire orange
partenaire psa
partenaire bnp