Alexander DEJANOVSKI | Devoxx

Alexander DEJANOVSKI
Alexander DEJANOVSKI Twitter

From Chronopost International

Développeur chez Chronopost

Je me suis pris d'une passion toute particulière pour Apache Cassandra, et compte bien ne pas retravailler sur une base relationnelle de sitôt. Je contribue au driver JDBC "legacy" de Cassandra et j'ai récemment terminé sa réécriture pour qu'il utilise le driver Java Datastax au lieu de Thrift.

Blog: https://www.linkedin.com/pub/alexander-dejanovski/a/912/2a9

bigd Big Data & Analytics

Utilisation de SparkSQL pour analyser vos données Cassandra en Java, Scala et Python

Tools-in-Action

Cassandra ne permet ni jointure, ni agrégats et limite drastiquement vos capacités à requêter vos données pour permettre une scalabilité linéaire dans une architecture masterless. L'outil de choix pour effectuer des traitements analytiques sur vos tables Cassandra est Spark mais ce dernier complexifie des opérations pourtant simples en SQL. SparkSQL permet de retrouver une syntaxe SQL dans Spark et nous allons voir comment l'utiliser en Scala, Java et en Python pour travailler sur des tables Cassandra, et retrouver jointures et agrégats (entre autres).