FORMATIONS

Data

Un levier de performance et d’innovation durable

La data représente aujourd’hui un levier majeur pour améliorer la prise de décision et optimiser les opérations des organisations africaines. Exploiter les données permet de mieux comprendre les activités, d’anticiper les tendances et de créer de nouveaux services. Les équipes doivent développer des compétences en analyse, visualisation, gouvernance et traitement de données.

Afri-Learning propose des formations en Power BI, Python, SQL, Data Analytics et Data Engineering. Elles accompagnent les professionnels dans la valorisation des données pour produire des indicateurs fiables, automatiser des tâches et soutenir les stratégies de croissance. L’objectif est d’aider les entreprises africaines à devenir réellement pilotées par la donnée.

 

Power BI – Les fondamentaux

PBI-FND | 3 jour(s) | 21 heure(s)

Jour 1 - Matin Présentation des outils Power BI Définition de la Business Intelligence ou informatique décisionnelle Tour d'horizon de la solution Power BI de Microsoft Power BI Desktop Service Power BI...

Concevoir et piloter un projet Big Data

BIGDATAPROJET01 | 2 jour(s) | 14 heure(s)

Jour 1 Caractéristiques des projets Big Data Comparaison entre un projet classique et un projet Big Data Analyse des caractéristiques et retours d'expériences sur des projets mis en échec en Big Data Processus d'exploration de données et l'apport de la Data Science...

Fondamentaux du NoSQL

NOSQL01 | 2 jour(s) | 14 heure(s)

Jour 1 Introduction Origine des bases de données Les notions de transaction Les SGBD La standardisation SQL L'arrivée de nouveaux besoins Volumes importants liés aux technologies et aux nouveaux usages Traitements optimisés de flux de données au fil de l'eau...

Enjeux et perspectives du Big Data

BIGDATAENJEUX01 | 2 jour(s) | 14 heure(s)

Introduction Introduction au Big Data : de quoi s'agit-il ? Perspectives offertes par le Big Data Les acteurs du Big Data Exemples pratiques Démystification du Big Data Les technologies concernées Les outils Hadoop Les différents métiers du Big Data Les distributions...

Big Data – Gestion de référentiels de données

BIGDATAREF01 | 2 jour(s) | 14 heure(s)

Introduction Présentation du cours Concepts et glossaire des données de référence Rappel sur l'architecture des référentiels SI Les données de référence Définition des données de référence (Master Data) Types et nature des données de référence Les principaux...

Big Data – Sécurité des données

BIGDATASEC01 | 2 jour(s) | 14 heure(s)

Jour 1 Importance et challenges de la sécurité dans le Big Data Plus de volume, plus de données, plus de risques Données personnelles Propriété intellectuelle... Importance de la conformité réglementaire (RGPD...), des contrôles (CNIL) et pénalités Sécurité des...

Big Data – Développement d’applications de Machine Learning et d’IA

BIGDATADEVAPP01 | 5 jour(s) | 35 heure(s)

Jour 1 Vue d'ensemble du Big Data, du Machine Learning et de l'IA Introduction au Big Data et à l'IA (Intelligence Artificielle) : de quoi s'agit-il ? Perspectives offertes par le Big Data et l'IA Les acteurs du Big Data et de l'IA Exemples pratiques Les technologies...

Elastic Stack – Pour administrateurs

ELASTICSTACKADMIN01 | 2 jour(s) | 14 heure(s)

Introduction Présentation de la pile Elastic Positionnement d'Elasticsearch et des produits complémentaires Kibana Logstash Beats X-Pack Principes Base technique Lucene Apports d'Elasticsearch Fonctionnement distribué Installation et configuration Prérequis techniques...

Hadoop Cloudera développeur, préparation à la certification (CCA175)

HADOOPDEV01 | 4 jour(s) | 28 heure(s)

Hadoop, HDFS et traitement distribué sur un cluster Hadoop Introduction générale à Hadoop et à son écosystème. Traitement de données. HDFS : le système de fichiers Hadoop. Les composants d’un cluster hadoop. L’architecture d’HDFS. Utiliser HDFS. L’architecture de YARN...

HBase – Prise en main et développement

HBASEDEV01 | 2 jour(s) | 14 heure(s)

Introduction Introduction au Big Data Présentation de Hadoop et de son écosystème Architecture solution NoSQL Qu'est-ce que HBase ? Pourquoi utiliser HBase ? Les points forts de HBase HBase en production Les faiblesses de HBase Cas d'utilisation HBase : concepts HBase...

Elasticsearch – Prise en main et développement

ELASTICDEV01 | 2 jour(s) | 14 heure(s)

Introduction au NoSQL Nature et exigence de stockage Regard sur les BDD relationnelles Théorème de CAP Les familles des BDD NoSQL NoSQL, comparatif et use case Premier pas avec Elasticsearch L'histoire de Elastic Stack Pourquoi Elastic Stack ? Les composants de...

Hadoop – HBase, mise en œuvre et administration

HADOOPADM01 | 2 jour(s) | 14 heure(s)

Présentation de l’écosystème d’Hadoop L'architecture Hadoop. Description des principaux composants de la plateforme Hadoop. Rappels MapReduce. Le système de fichiers distribué HDFS (Hadoop Distributed File System) d'Hadoop. Présentation de HBase, ses apports, lien...

Cassandra – Prise en main et développement

CASSANDRADEV01 | 2 jour(s) | 14 heure(s)

Jour 1 Introduction Les bases de données NoSQL Types de bases NoSQL Le théorème CAP Cassandra Historique Fonctionnalités Architecture Principales composantes Cas d'utilisation Concepts de Cassandra Structure et format des données Keyspace, table et colonnes Clé...

Talend Open Studio for Big Data, exploiter ses données massives

TALENDINGENIERIE01 | 2 jour(s) | 14 heure(s)

Présentation de Talend Open Studio for Big Data Problématique du Big Data : le modèle de 3V, les cas d'usage. L'écosystème Hadoop (HDFS, MapReduce, HBase, Hive, Pig...). Données non structurées et bases de données NoSQL. TOS for Big Data versus TOS for Data...

Big Data – Les techniques d’analyse et de visualisation

BIGDATATECHNIQUES01 | 5 jour(s) | 35 heure(s)

Jour 1 Vue d'ensemble du Big Data Introduction au Big Data : de quoi s'agit-il ? Perspectives offertes par le Big Data Les acteurs du Big Data Exemples pratiques Démystification du Big Data Big Data et Cloud SaaS, PaaS et FaaS Les différents métiers du Big Data Data...

Spark avec Databricks

SPARKDATABRICKS01 | 3 jour(s) | 21 heure(s)

Jour 1 Introduction Qu'est-ce que Databricks ? Quels sont les composants de Databricks ? Démonstration : comprendre l'environnement de Databricks Créer un compte sur Databricks Créer un cluster sous Databricks Considération matérielle Databricks et le Cloud Databricks...

Spark Java – Traitement des données

SPARKJAVA01 | 3 jour(s) | 21 heure(s)

Introduction Architecture de Spark et les RDD Installation du Spark Reduce sur les RDD Mapping et outputting Les opérations de mapping Outputting des résultats sur la console Compter les éléments du Big Data "NotSerializableException" avec Spark Tuples RDD des objets...

Storm – Flux de données

STORM01 | 2 jour(s) | 14 heure(s)

Introduction Présentation de Storm Fonctionnalités Architecture Langages supportés Définitions Spout Bolt Topology Architecture Etude des composants d'un cluster Storm Master node "Nimbus" Worker node Positionnement par rapport à un cluster Hadoop Le modèle de données...

Ingestion de données avec NiFi

NIFIINGESTION01 | 2 jour(s) | 14 heure(s)

Jour 1 Apache NiFi : les fondamentaux Introduction à Cloudera Flow Management L'interface utilisateur NiFi L'architecture de NiFi Approches de développement Extraction, transformation et chargement (ETL) Installation et configuration de NiFi NiFi : concepts NiFi User...

PySpark – Traitement des données

PYSPARK01 | 3 jour(s) | 21 heure(s)

Jour 1 Introduction à Hadoop L'ère du Big Data Architecture et composants de la plateforme Hadoop HDFS NameNode / DataNode / ResourceManager MapReduce et YARN Introduction à Spark Qu'est-ce que Spark ? Spark vs MapReduce Fonctionnement RDD DataFrames Data Sets Comment...

Spark Scala – Traitement des données

SPARKSCALA01 | 3 jour(s) | 21 heure(s)

Jour 1 Introduction à Scala pour Apache Spark Présentation de Scala Pourquoi Scala avec Spark ? Scala dans les autres framework Introduction à Scala REPL Les opérations basiques sur Scala Les types de variables dans Scala Les structures de contrôles dans Scala Les...

Data Engineering avec Kafka, Cassandra et Spark

KAFKACASSANDRASPARK01 | 4 jour(s) | 28 heure(s)

Jour 1 Introduction à Kafka Kafka : une plateforme de données de flux Un aperçu de Kafka et de son efficacité Producers Brokers Consumers Installation et architecture Installation et options avancées Fichiers journaux de Kafka Réplication et fiabilité Chemins...

Ingestion et indexation de données avec Logstash et Elasticsearch

LOGSTASHES01 | 2 jour(s) | 14 heure(s)

Introduction NoSQL Nature et exigence de stockage Regard sur les BDD relationnelles Théorème de CAP Les familles des BDD NoSQL NoSQL, comparatif et use case Stack ELK, présentation L'histoire de Elastic Stack Pourquoi Elastic Stack Les composants de Elastic Stack La...

MongoDB – Mise en oeuvre et utilisation

MONGODB01 | 3 jour(s) | 21 heure(s)

Comprendre le fonctionnement de MongoDB Introduction Présentation de MongoDB, historique du projet, les versions Structure des données : notions de documents, de collections Le format BSON (Binary JSON), comparaison avec JSON Fonctionnalités de MongoDB Interfaces...

Cassandra – Mise en oeuvre et utilisation

CASSANDRA01 | 3 jour(s) | 21 heure(s)

Découvrir l'architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions Introduction Historique, fonctionnalités de Cassandra, licence Format des données, "key-value", traitement de volumes importants, haute disponibilité, système réparti de...

Big Data – Architecture et infrastructure Hadoop On-Premise et sur le Cloud

BIGDATAARCH01 | 5 jour(s) | 35 heure(s)

Jour 1 Présentation du Big Data et d'Hadoop Introduction au Big Data : de quoi s'agit-il ? Perspectives offertes par le Big Data Les acteurs du Big Data Exemples pratiques Démystification du Big Data Les technologies concernées Les outils Hadoop Les différents métiers...

Elasticsearch – Installation et administration

ELASTIC01 | 2 jour(s) | 14 heure(s)

Jour 1 Introduction Présentation de la pile Elastic Positionnement d'Elasticsearch et des produits complémentaires Kibana Logstash Beats X-Pack Principe : base technique Lucene et apports d'Elasticsearch Fonctionnement distribué Cas d'usage classiques Analyse de logs...

Hadoop HBase – Mise en oeuvre et administration

HADOOPHBASE01 | 2 jour(s) | 14 heure(s)

Introduction Introduction au Big Data Présentation d'Hadoop et de son écosystème Architecture solution NoSQL Qu'est-ce que HBase ? Pourquoi utiliser HBase ? Les points forts d'HBase HBase en production Les faiblesses de HBase Cas d'utilisation HBase : concepts HBase :...

Big Data – Qualité des données

BIGDATAQUALITE01 | 2 jour(s) | 14 heure(s)

Jour 1 La valeur stratégique de l'actif "données" Qu'est-ce qu'une donnée ? Qu'est-ce que la qualité des données ? Qu'est-ce que le management de la qualité des données ? Les données, pétrole brut des économies de demain Débloquer la valeur des données grâce aux...

Ingestion de données avec Kafka

KAFKAINGESTION01 | 2 jour(s) | 14 heure(s)

Jour 1 Apache Kafka, les fondamentaux Plateforme de diffusion d'évènements distribuée L'abstraction des logs dans la diffusion d'évènements distribués Brokers, topics, partitions et segments Enregistrements (alias messages, événements) Politiques de rétention...