- Prochaine session : nous contacter.
- Formation accessible aux personnes en situation de handicap.
- 70% de pratique et 30% de théorie en moyenne.
- Nombreuses activités pratiques pour une évaluation constante.
- Supports, exercices et corrections à disposition en ligne pendant et après la formation.
- Délai d'accès minimum moyen : deux mois.
- Formation en distanciel ou en présentiel au sein de votre entreprise.
- Evaluation par le formateur à travers les activités pratiques.
- Public : Développeurs, Architectes, Chefs de projets
- Prérequis : Java
- Durée : 4 jours (7 heures/jour).
- Tarif inter * : 2560 € - intra * : nous contacter.
Les principes du Big Data ont révolutionné le monde de l’informatique pour le traitement de grandes volumétries de données hétérogène, notamment avec Apache Hadoop. Cette formation vous permet d’acquérir les connaissances nécessaires à une bonne utilisation d’Apache Hadoop.
- Introduction
- Problèmes avec les systèmes traditionnels à grande échelle.
- Définition du périmètre du Big Data.
- Le rôle du projet Hadoop.
- Les concepts de base des projets Big Data.
- Présentation du Cloud Computing.
- Différence entre Cloud Computing privé et public.
- Les architectures Big Data à base du projet Hadoop.
- Problèmes liés à Hadoop.
- Composants Hadoop.
- HDFS (Hadoop Distributed File System).
- Collecte de données et application de Map Reduce
- Mappers.
- Reducers.
- Jobs Hadoop et tâches.
- Analyse des flux de données dans l'entreprise.
- Données structurées et non-structurées.
- Les principes de l'analyse sémantique des données d'entreprise.
- Graphe des tâches à base de MapReduce.
- La granularité de cohérence des données.
- Transfert de données depuis un système de persistance dans Hadoop.
- Transfert de données d'un Cloud dans Hadoop.
- Diminution de la quantité de données intermédiaires avec les multiplexeurs.
- Le stockage des données avec HBase
- Plusieurs types de base de données XML.
- Patterns d'usages et application au Cloud.
- Application de Hadoop database au sein d'un workflow.
- Vue d’ensemble de Hive et Pig.
- Utilisation des projets Hive/Pig.
- Utilisation du projet HCatalog.
- L'API Java HBase.
- Le stockage des données sur HDFS
- Patterns d'usages et application au Cloud.
- Architecture et installation d'un système HDFS, journal, NameNode, DataNode.
- Accès à la programmation HDFS.
- Utiliser le cache distribué.
- Opérations, commandes et gestion des commandes.
- L'API HDFS Java.
- Analyse de données avec Apache Pig.
- Le langage Pig Latin. Utiliser Apache Pig avec Java.
- Requêtage avec Apache Hive.
- Réplication de données. Partage de données sur une architecture HDFS.
- Formation avec un formateur, qui peut être suivie selon l’une des 2 modalités suivantes : dans la salle de cours en présence du formateur en intra ou en téléprésence / distanciel depuis votre domicile ou votre entreprise. Vous rejoignez un environnement deformation en ligne, à l’aide de votre ordinateur, tout en étant éloigné physiquement du formateur et des autres participants. Vous êtes en totale immersion avec le groupe et le formateur.
- Le nombre de stagiaires peut varier de de 1 à 8 personnes, ce qui facilite le suivi permanent et la proximité avec chaque stagiaire.
- Chaque stagiaire dispose d’un support, d’exercices à disposition en ligne pendant et après la formation. Pour une meilleure assimilation, le formateur alterne tout au long de la journée les exposés théoriques, les démonstrations et la mise en pratique au travers d’exercices et de cas concrets réalisés seul ou en groupe (70% de pratique er 30% de théorie en moyenne).
- Feuille de présence, émargée par demi-journée par chaque stagiaire et le formateur
- Evaluation qualitative de fin de formation
- Attestation de fin de formation
- Evaluation par le formateur à travers les activités pratiques.
- Auto-évaluation des participants à travers les activités pratiques.
La formation est animée par un professionnel de l'informatique et de la pédagogie, dont les compétences techniques, professionnelles et pédagogiques ont été validées par des certifications et/ou testées et approuvées par les éditeurs et/ou notre responsable technique et pédagogique. Il est en veille technologique permanente et possède plusieurs années d'expérience sur les produits, technologies et méthodes enseignés. Il est présent auprès des stagiaires pendant toute la durée de la formation.
* Types de formation
- En inter (plusieurs entreprises) : session ouverte et maintenue à partir de 3 participants (tarif à la session par participant);
- En intra (une seule entreprise) : cours individuel ou collectif, standard ou sur-mesure (tarif à la journée, 8 participants max.)