DNS-5749 Utilisation de SparkSQL pour analyser vos données Cassandra en Java, Scala et Python | Devoxx

Utilisation de SparkSQL pour analyser vos données Cassandra en Java, Scala et Python

Tools-in-Action

bigd Big Data & Analytics

Paris 241

mercredi at 18:40 - 19:10

Cassandra ne permet ni jointure, ni agrégats et limite drastiquement vos capacités à requêter vos données pour permettre une scalabilité linéaire dans une architecture masterless. L'outil de choix pour effectuer des traitements analytiques sur vos tables Cassandra est Spark mais ce dernier complexifie des opérations pourtant simples en SQL. SparkSQL permet de retrouver une syntaxe SQL dans Spark et nous allons voir comment l'utiliser en Scala, Java et en Python pour travailler sur des tables Cassandra, et retrouver jointures et agrégats (entre autres).

Alexander DEJANOVSKI Alexander DEJANOVSKI

Développeur chez Chronopost

Je me suis pris d'une passion toute particulière pour Apache Cassandra, et compte bien ne pas retravailler sur une base relationnelle de sitôt. Je contribue au driver JDBC "legacy" de Cassandra et j'ai récemment terminé sa réécriture pour qu'il utilise le driver Java Datastax au lieu de Thrift.

Maxence Lecointe Maxence Lecointe

Just passionate about Java.

Every day is a day for improve coding skills.

Great experience with Java tools/technologies/frameworks/standards (e.g. Eclipse, Hibernate, Spring, etc.) and software development methods and tools.

Code review.

Software architecture and design.

Implementation of innovative technologies.