• Prochaine session : nous contacter.
  • Formation accessible aux personnes en situation de handicap.
  • 70% de pratique et 30% de théorie en moyenne.
  • Nombreuses activités pratiques pour une évaluation constante.
  • Supports, exercices et corrections à disposition en ligne pendant et après la formation.
  • Délai d'accès minimum moyen : deux mois.
  • Formation en distanciel ou en présentiel au sein de votre entreprise.
  • Evaluation par le formateur à travers les activités pratiques.

  • Public : Développeur, administrateur
  • Prérequis : Java, administration système

  • Durée : 4 jours (7 heures/jour).
  • Tarif inter * : 2400 € - intra * : nous contacter.

Cette formation vous apprendra à vous servir et comprendre les enjeux du Bag Data avec Hadoop. Vous apprendrez à manipuler HDFS, MapReduce, HBase, HiveQL et Pig.

  • Introduction au Big Data
    • Qu'est-ce que le Big Data ?
    • Source des données : l'homme, la machine
    • La problématique de taille
    • Position de Hadoop dans le paysage
  • Introduction à Hadoop
    • L'origine du projet
    • Le système de fichiers HDFS
    • Comprendre l'algorithme MapReduce
    • L'environnement d'Hadoop : HBase, ZooKeeper, Hive, Pig…
    • L'API YARN
  • Mettre Hadoop en place : HDFS
    • Du mode autonome au mode complètement distribué en cluster
    • Pré-requis, distributions Hadoop
    • Cluster Hadoop : NameNode, ResourceManager, DataNode, NodeManager
    • Les fichiers de configuration
    • Opérations de base sur le cluster HDFS : formatage, démarrage, arrêt
  • Travailler avec MapReduce
    • L'intérêt de MapReduce
    • Mappers, reducers, parallélisme et indépendance des traitements
    • Entrées, sorties
    • Soumission d'un job à Hadoop
  • Une base de données distribuée : HBase
    • L'accès aléatoire, temps réel, lecture-écriture au Big Data
    • Fonctionnalités de HBase, NoSQL
    • Pré-requis, configuration
    • Manipulation via le shell HBase
  • Et pourquoi pas un peu de SQL avec Hive ?
    • Présentation de Hive
    • Gérer le schéma : bases, tables, vues, partitions
    • Manipulation des données, requêtes et map-reduce avec HiveQL
    • Audits et journal d'erreurs
  • Analyser les données avec Pig
    • Présentation, installation du projet Apache Pig
    • Exécutions de Pig en local, en mode map-reduce
    • Scripter pour Pig
    • Le langage Pig Latin
    • Manipulations de données et stockage avec Pig

  • Formation avec un formateur, qui peut être suivie selon l’une des 2 modalités suivantes : dans la salle de cours en présence du formateur en intra ou en téléprésence / distanciel depuis votre domicile ou votre entreprise. Vous rejoignez un environnement deformation en ligne, à l’aide de votre ordinateur, tout en étant éloigné physiquement du formateur et des autres participants. Vous êtes en totale immersion avec le groupe et le formateur.
  • Le nombre de stagiaires peut varier de de 1 à 8 personnes, ce qui facilite le suivi permanent et la proximité avec chaque stagiaire.
  • Chaque stagiaire dispose d’un support, d’exercices à disposition en ligne pendant et après la formation. Pour une meilleure assimilation, le formateur alterne tout au long de la journée les exposés théoriques, les démonstrations et la mise en pratique au travers d’exercices et de cas concrets réalisés seul ou en groupe (70% de pratique er 30% de théorie en moyenne).

  • Feuille de présence, émargée par demi-journée par chaque stagiaire et le formateur
  • Evaluation qualitative de fin de formation
  • Attestation de fin de formation
  • Evaluation par le formateur à travers les activités pratiques.
  • Auto-évaluation des participants à travers les activités pratiques.

La formation est animée par un professionnel de l'informatique et de la pédagogie, dont les compétences techniques, professionnelles et pédagogiques ont été validées par des certifications et/ou testées et approuvées par les éditeurs et/ou notre responsable technique et pédagogique. Il est en veille technologique permanente et possède plusieurs années d'expérience sur les produits, technologies et méthodes enseignés. Il est présent auprès des stagiaires pendant toute la durée de la formation.

* Types de formation

  • En inter (plusieurs entreprises) : session ouverte et maintenue à partir de 3 participants (tarif à la session par participant);
  • En intra (une seule entreprise) : cours individuel ou collectif, standard ou sur-mesure (tarif à la journée, 8 participants max.)