• Prochaine session : nous contacter.
  • Formation accessible aux personnes en situation de handicap.
  • 70% de pratique et 30% de théorie en moyenne.
  • Nombreuses activités pratiques pour une évaluation constante.
  • Supports, exercices et corrections à disposition en ligne pendant et après la formation.
  • Délai d'accès minimum moyen : deux mois.
  • Formation en distanciel ou en présentiel au sein de votre entreprise.
  • Evaluation par le formateur à travers les activités pratiques.

  • Public : Développeurs
  • Prérequis : Python ou Java ou Scala

  • Durée : 3 jours (7 heures/jour).
  • Tarif inter * : 1800 € - intra * : nous contacter.

Spark est souvent désigné comme le successeur d'Hadoop afin de gérer les enjeux du Big Data et analyser finement vos données. Cette formation vous apprendra à traiter un flux de données en temps réel avec Spark afin de faire des batchs.

  • Présentation d'Apache Spark
    • Historique du Framework.
    • Les différentes versions de Spark (Scala, Python et Java).
    • Comparaison avec l'environnement Apache Hadoop.
    • Les différents modules de Spark.
  • Programmer avec les Resilient Distributed Dataset (RDD)
    • Présentation des RDD.
    • Créer, manipuler et réutiliser des RDD.
    • Accumulateurs et variables broadcastées.
    • Utiliser des partitions.
  • Manipuler des données structurées avec Spark SQL
    • SQL, DataFrames et Datasets.
    • Les différents types de sources de données.
    • Interopérabilité avec les RDD.
    • Performance de Spark SQL. JDBC/ODBC server et Spark SQL CLI.
  • Spark sur un cluster
    • Les différents types d'architecture : Standalone, Apache Mesos ou Hadoop YARN.
    • Configurer un cluster en mode Standalone.
    • Packager une application avec ses dépendances.
    • Déployer des applications avec Spark-submit.
    • Dimensionner un cluster
  • Analyser en temps réel avec Spark Streaming
    • Principe de fonctionnement.
    • Présentation des Discretized Streams (DStreams).
    • Les différents types de sources.
    • Manipulation de l'API.
    • Comparaison avec Apache Storm.
  • Manipuler des graphes avec GraphX
    • Présentation de GraphX.
    • Les différentes opérations.
    • Créer des graphes.
    • Vertex and Edge RDD.
    • Présentation de différents algorithmes.
  • Machine Learning avec Spark
    • Introduction au Machine Learning.
    • Les différentes classes d'algorithmes.
    • Présentation de SparkML et MLlib.
    • Implémentations des différents algorithmes dans MLlib.

  • Formation avec un formateur, qui peut être suivie selon l’une des 2 modalités suivantes : dans la salle de cours en présence du formateur en intra ou en téléprésence / distanciel depuis votre domicile ou votre entreprise. Vous rejoignez un environnement deformation en ligne, à l’aide de votre ordinateur, tout en étant éloigné physiquement du formateur et des autres participants. Vous êtes en totale immersion avec le groupe et le formateur.
  • Le nombre de stagiaires peut varier de de 1 à 8 personnes, ce qui facilite le suivi permanent et la proximité avec chaque stagiaire.
  • Chaque stagiaire dispose d’un support, d’exercices à disposition en ligne pendant et après la formation. Pour une meilleure assimilation, le formateur alterne tout au long de la journée les exposés théoriques, les démonstrations et la mise en pratique au travers d’exercices et de cas concrets réalisés seul ou en groupe (70% de pratique er 30% de théorie en moyenne).

  • Feuille de présence, émargée par demi-journée par chaque stagiaire et le formateur
  • Evaluation qualitative de fin de formation
  • Attestation de fin de formation
  • Evaluation par le formateur à travers les activités pratiques.
  • Auto-évaluation des participants à travers les activités pratiques.

La formation est animée par un professionnel de l'informatique et de la pédagogie, dont les compétences techniques, professionnelles et pédagogiques ont été validées par des certifications et/ou testées et approuvées par les éditeurs et/ou notre responsable technique et pédagogique. Il est en veille technologique permanente et possède plusieurs années d'expérience sur les produits, technologies et méthodes enseignés. Il est présent auprès des stagiaires pendant toute la durée de la formation.

* Types de formation

  • En inter (plusieurs entreprises) : session ouverte et maintenue à partir de 3 participants (tarif à la session par participant);
  • En intra (une seule entreprise) : cours individuel ou collectif, standard ou sur-mesure (tarif à la journée, 8 participants max.)