13th édition – du 16 au 18 avril 2025
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
Houssem Chihoub
Databricks

Houssem est Solutions Architect chez Databricks, passionné par la data, l'IA et les technologies émergentes. Il détient un doctorat en gestion de données dans le cloud et a développé une expertise solide à travers ses expériences chez AWS et d'autres acteurs majeurs dans l'industrie.

View
Spark 4 et Iceberg, le nouveau standard pour tous vos projets Data
Tools-in-Action (INTERMEDIATE level)

La révolution du traitement des données est en marche avec l'arrivée de Spark 4 et Apache Iceberg ! Cette présentation vous démontrera comment cette combinaison technologique devient rapidement le nouveau standard incontournable pour les projets data modernes.

Au programme :

  • Les nouveautés majeures de Spark 4 : découvrez les améliorations significatives en termes de performances, notamment avec le nouveau moteur de requêtes, le support natif des lacs de données et l'optimisation automatique des requêtes.
  • Apache Iceberg démystifié : plongez dans cette table format nouvelle génération qui révolutionne la gestion des données dans les lacs de données. Nous aborderons ses fonctionnalités clés comme le Time Travel, le Schema Evolution et le partitionnement dynamique.
  • Cas d'usage concrets : à travers des démonstrations pratiques, nous verrons comment implémenter un pipeline de données moderne combinant ces technologies, avec un focus particulier sur les bonnes pratiques et les pièges à éviter.
  • Performance et scalabilité : découvrez comment cette stack permet d'obtenir des performances exceptionnelles même sur des volumes de données massifs, tout en maintenant une cohérence ACID.

More

Searching for speaker images...

en_USEnglish