Ingestion de données avec NiFi
Code stage
NIFIINGESTION01
Durée
14 heures | 2 jours
Certification
non
Objectifs pédagogiques
- Décrire l’architecture de NiFi, y compris les configurations autonomes et en cluster
- Naviguer, configurer les flux de données et utiliser les informations sur les flux de données avec l’interface utilisateur NiFi
- Organiser et simplifier les flux de données
- Connecter les flux de données avec d’autres systèmes, tels que Kafka et HDFS
Niveau requis
Avoir des connaissances en développement Java, C# ou Python. Avoir de l'expérience en ETL.
Public concerné
Développeurs, Data engineers, Data scientists, Data stewards et toute personne intéressée par l'ingestion de données.
Programme
Jour 1
Apache NiFi : les fondamentaux
Introduction à Cloudera Flow Management
L’interface utilisateur NiFi
L’architecture de NiFi
Approches de développement
Extraction, transformation et chargement (ETL)
Installation et configuration de NiFi
NiFi : concepts
NiFi User Interface
NiFi Processors
NiFi Connections
NiFi Processor Groups
Controller services
Flowfile
Exemples de travaux pratiques (à titre indicatif)
Installation de NiFi
Création d’un premier flux de données
NiFi Dataflow
Commande et contrôle d’un flux de données
Relations avec les processeurs
Prioritizers
Labels
Dataflow templates
Jour 2
NiFi : concepts avancés
NiFi Registry
Les attributs de Flowfile
NiFi Expression Language
Syntaxe
Structures propriétés
Configuration
L’optimisation des flux de données
L’architecture NiFi
Management du cluster Edge
MiNiFi
Monitoring et rapports
NiFi, sécurité
Security configuration
User authentication
Lightweight Directory Access Protocol (LDAP)
HDF and HDP
Le contenu de ce programme peut faire l’objet d’adaptation selon les niveaux, prérequis et besoins des apprenants.