13th édition – du 16 au 18 avril 2025
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
La révolution du traitement des données est en marche avec l'arrivée de Spark 4 et Apache Iceberg ! Cette présentation vous démontrera comment cette combinaison technologique devient rapidement le nouveau standard incontournable pour les projets data modernes.
Au programme :
  • Les nouveautés majeures de Spark 4 : découvrez les améliorations significatives en termes de performances, notamment avec le nouveau moteur de requêtes, le support natif des lacs de données et l'optimisation automatique des requêtes.
  • Apache Iceberg démystifié : plongez dans cette table format nouvelle génération qui révolutionne la gestion des données dans les lacs de données. Nous aborderons ses fonctionnalités clés comme le Time Travel, le Schema Evolution et le partitionnement dynamique.
  • Cas d'usage concrets : à travers des démonstrations pratiques, nous verrons comment implémenter un pipeline de données moderne combinant ces technologies, avec un focus particulier sur les bonnes pratiques et les pièges à éviter.
  • Performance et scalabilité : découvrez comment cette stack permet d'obtenir des performances exceptionnelles même sur des volumes de données massifs, tout en maintenant une cohérence ACID.
Pierre Andrieux
Capgemini
Pierre Andrieux est Architecte Solutions au sein de Capgemini. Passionné par les nouvelles technologies et le craftsmanship, Pierre a eu l’occasion de développer son expertise sur le E-commerce, la Data et le Cloud. Riche de son expérience chez un intégrateur, un éditeur et un client final, Pierre partage ses découvertes en contribuant activement à l'animation d'une des plus grandes communautés de Software Engineer de France.
Florent Brosse
Databricks
Senior Solutions Architect à Databricks, ex AWS & Datastax
en_USEnglish