13ème édition – du 16 au 18 avril 2025
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
HELA BEN KHALFALLAH

Bonjour ! Je suis Héla Ben Khalfallah, une ingénieure logiciel experte spécialisée dans les solutions web modernes.

Ingénieure logiciel passionnée, je crée des expériences web élégantes et performantes. J'aime jouer avec l'architecture et la conception logicielle (styles d'architecture, modèles de conception, code propre), le FrontendOps (générateurs de code, CLI, configurations, outils) et les concepts logiciels avancés (algorithmes optimaux, structures de données, Big O) pour optimiser les performances, rationaliser les flux de travail et garantir que les sites web sont non seulement visuellement époustouflants, mais aussi SAGES (Sémantiques, Accessibles, Green, Ergonomiques et Sécurisés).

Je m'efforce de faire en sorte que l'ingénierie logicielle paraisse simple et facile en décomposant les problèmes complexes en solutions élégantes et en communiquant clairement les concepts techniques. J'adore raconter des histoires sur les logiciels.

Je suis également une communicatrice passionnée, partageant mes idées lors de conférences et d'événements. Animée par une passion pour l'apprentissage et l'innovation, je repousse constamment les limites de mes compétences.

Enfin, j'ai récemment publié mon livre, un aboutissement de ma passion et de mon expertise. Vous pouvez le découvrir ici :

👉 https://amzn.eu/d/hNqV7HF

View
Structures de Données Probabilistes : Relever les Défis des Données Massives
Conference (INTERMEDIATE level)
Paris 143

Présentation :

Face au Big Data, les structures de données classiques montrent leurs limites. Découvrez les structures probabilistes (filtres de Bloom, HyperLogLog...) qui privilégient l'efficacité pour gérer d'énormes volumes de données. Apprenez à estimer la cardinalité, détecter les similarités et résoudre des problèmes complexes avec une précision "suffisante".

Plan :

  1. Introduction : Limites classiques, principes probabilistes.
  2. Types : Bloom, HyperLogLog, Count-Min Sketch, t-digest, SimHash, MinHash.
  3. Applications (basées sur mon article ITNEXT) :
    1. HyperLogLog : Redis, Redshift, ScyllaDB, Facebook, Google BigQuery.
    2. Count-Min Sketch : Redis, trafic réseau, e-commerce.
    3. t-digest : Redis, Druid, PostgreSQL, ElasticSearch, Redshift.
    4. SimHash : Moteurs de recherche, réseaux sociaux, plagiat.
    5. MinHash : Déduplication, filtrage collaboratif, génomique.
  4. Conclusion : Avantages, limites, futur.

Mots-clés :

Structures de données probabilistes, Big Data, filtres de Bloom, HyperLogLog, Count-Min Sketch, t-digest, SimHash, MinHash, Skip lists, estimation de cardinalité, recherche de similarité, approximation.

More

Searching for speaker images...

fr_FRFrançais