loader image

Ingestion de données avec NiFi

Code stage

NIFIINGESTION01

Durée

14 heures | 2 jours

Z

Certification

non

Objectifs pédagogiques

  • Décrire l’architecture de NiFi, y compris les configurations autonomes et en cluster
  • Naviguer, configurer les flux de données et utiliser les informations sur les flux de données avec l’interface utilisateur NiFi
  • Organiser et simplifier les flux de données
  • Connecter les flux de données avec d’autres systèmes, tels que Kafka et HDFS

Niveau requis

Avoir des connaissances en développement Java, C# ou Python. Avoir de l'expérience en ETL.

Public concerné

Développeurs, Data engineers, Data scientists, Data stewards et toute personne intéressée par l'ingestion de données.

Programme

Jour 1
Apache NiFi : les fondamentaux
Introduction à Cloudera Flow Management
L’interface utilisateur NiFi
L’architecture de NiFi
Approches de développement
Extraction, transformation et chargement (ETL)
Installation et configuration de NiFi
NiFi : concepts
NiFi User Interface
NiFi Processors
NiFi Connections
NiFi Processor Groups
Controller services
Flowfile
Exemples de travaux pratiques (à titre indicatif)
Installation de NiFi
Création d’un premier flux de données
NiFi Dataflow
Commande et contrôle d’un flux de données
Relations avec les processeurs
Prioritizers
Labels
Dataflow templates
Jour 2
NiFi : concepts avancés
NiFi Registry
Les attributs de Flowfile
NiFi Expression Language
Syntaxe
Structures propriétés
Configuration
L’optimisation des flux de données
L’architecture NiFi
Management du cluster Edge
MiNiFi
Monitoring et rapports
NiFi, sécurité
Security configuration
User authentication
Lightweight Directory Access Protocol (LDAP)
HDF and HDP
Le contenu de ce programme peut faire l’objet d’adaptation selon les niveaux, prérequis et besoins des apprenants.