YGL-3979 Initiation à Spark avec Java 8 et Scala | Devoxx

Initiation à Spark avec Java 8 et Scala

Hand's on Labs

bigd Big Data & Analytics

Neuilly 253 Lab

mercredi at 09:30 - 12:30

Apache Spark se présente comme la nouvelle génération de moteur de calcul distribué qui remplace progressivement Hadoop/MapReduce.

L'objet de ce Hands-on Labs est de vous familiariser par la pratique au traitement massif et distribué dans le domaine du data crunching et du machine learning. A l'issue de cette session, vous serez familiers avec :

  • Les Resilient Data Sets (RDD) qui désignent l’abstraction essentielle pour la manipulation distribuée des données.
  • les patterns de transformations et d'actions offerts par l'API
  • les API de chargement et de stockage de données - filesystem / hdfs / NoSQL(Elasticsearch et Cassandra)
  • Les bonnes pratiques de programmation distribuée avec la mise en oeuvre du partitionnement sélectif et l'usage de variables partagées (accumulators et broadcast variables)
  • l'analyse et le reporting via Spark SQL
  • l'analytique temps-réel avec Spark Streaming

Les prérequis à installer :

Hayssam Saleh Hayssam Saleh

Apache Spark Certified Developer, Hayssam Saleh is Senior Architect with a focus on fault tolerant distributed systems and Web applications. He is currently the technical lead at EBIZNEXT where he supervises Scala / NoSQL projects since early 2012. He holds a PhD in distributed computing from Université Pierre et Marie Curie (Paris VI).

Olivier Girardot Olivier Girardot

Consultant et Associé fondateur de Lateral-Thoughts.com. Je suis développeur Java, Scala, Python et je m'intéresse de près aux problématiques des Moteurs de Recherche, du BigData, du Machine Learning et du NLP.