Cassandra – Mise en oeuvre et utilisation
Code stage
CASSANDRA01
Durée
21 heures | 3 jours
Certification
non
Objectifs pédagogiques
- Installer et administrer des bases de données sous la solution NoSQL Apache Cassandra
- Décrire l’architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions
- Installer et configurer le SGBD NoSQL Apache Cassandra
- Administrer et sécuriser un cluster Cassandra
- Définir le CQL (Cassandra Query Language)
- Créer une base de données et manipuler ses objets
- Expliquer la notion de grappe au sein de la base de données
Niveau requis
Avoir des connaissances de base de l'administration Linux ou Windows et d'une base de données relationnelle.
Public concerné
Chefs de projets, administrateurs de bases de données, développeurs, architectes.
Programme
Découvrir l’architecture de NoSQL Apache Cassandra et ses apports par rapport aux autres solutions
Introduction
- Historique, fonctionnalités de Cassandra, licence
- Format des données, « key-value », traitement de volumes importants, haute disponibilité, système réparti de base de données…
- Installer et configurer le SGBD NoSQL Apache Cassandra
- Installation et configuration
- Prérequis
- Plateformes supportées
- Etude du fichier de configuration : conf/cassandra.yaml
- Répertoire de travail, de stockage des données, gestion de la mémoire
- Exemples de travaux pratiques (à titre indicatif)
- Ateliers : démarrage d’un noeud et test de l’interface cliente « cqlsh »
- Appréhender le CQL (Cassandra Query Language)
Commandes de base :
- Connexion au système de base de données
- Création de colonnes
- Insertion
- Modification
- Recherche
- Le CQL : Cassandra Query Language
- Limitations du CQL
- Créer une base de données et manipuler ses objets
- Utilisation de Cassandra
- Création de bases et interrogation avec CQL
- Définition de la notion de consistance
- Eléments en jeu :
- Commit.log
- Memtable
- Quorum
- Comment écrire des requêtes ?
- Approches
- Exemples de travaux pratiques (à titre indicatif)
- Ateliers : premiers pas avec une base de données Cassandra pré-chargée et mise à disposition sur l’infrastructure de travaux pratiques
Connaître la notion de grappe au sein de la base de données
- Gestion de la grappe
- Principe et configuration des noeuds
- Notion de bootstrapping et de token
- Paramètres de démarrage des noeuds
- Réplication : topologie du réseau et « endpoint snitch »
- Stratégie de réplication
- Méthode d’ajout de noeuds et suppression
- Architecture de stockage mémoire et disque dur, gestion des tombstones, bloom filter
- Exemple de travaux pratiques (à titre indicatif)
- Atelier : mise en place d’une configuration de production (multi Data Centers, multi-racks)
Administrer et sécuriser un cluster Cassandra
- Exploitation
Gestion des noeuds Cassandra
Sauvegardes, snapshots et export au format JSON
Principe de cohérence, hinted_handoff, digest request et read repair
Sécurité
Gestion des rôles et des autorisations sur une application standard
Exemples de travaux pratiques (à titre indicatif)
Ateliers : paramétrage, authentification et sécurisation de la base system_auth
Support Hadoop et Spark
Principe de map/reduce
Implémentation Hadoop et intégration Hadoop / Cassandra
Support Spark : description rapide de l’architecture Spark
Exemples de travaux pratiques (à titre indicatif)
Ateliers : Mise en oeuvre depuis Cassandra - Exécution d’application Spark s’appuyant sur une grappe Cassandra
Supervision et performances
- Prometheus : apports et particularité de Prometheus pour la supervision Cassandra
- Supervision avec nodetool
- Principe des accès JMX, exports JMX vers des outils de supervision
- Performance : présentation de l’outil de test de performance Cassandra-stress
- Exemples de travaux pratiques (à titre indicatif)
- Ateliers :
- Démonstration avec Prometheus et Grafana
- Mise en place d’un plan de stress et paramétrage
- Le contenu de ce programme peut faire l’objet d’adaptation selon les niveaux, prérequis et besoins des apprenants.
Modalités d’évaluation des acquis
Analyse des résultats individuels produits par chaque participant lors des travaux pratiques, correction au fur et à mesure du déroulé de la formation
Réalisation d’un test complet sur un projet global de fin de formation, et analyse par le consultant formateur
Un QCM individuel d’évaluation des acquis est proposé en fin de chaque session