/ SPEAKER
Bonjour ! Je suis Héla Ben Khalfallah, une ingénieure logiciel experte spécialisée dans les solutions web modernes.
Ingénieure logiciel passionnée, je crée des expériences web élégantes et performantes. J'aime jouer avec l'architecture et la conception logicielle (styles d'architecture, modèles de conception, code propre), le FrontendOps (générateurs de code, CLI, configurations, outils) et les concepts logiciels avancés (algorithmes optimaux, structures de données, Big O) pour optimiser les performances, rationaliser les flux de travail et garantir que les sites web sont non seulement visuellement époustouflants, mais aussi SAGES (Sémantiques, Accessibles, Green, Ergonomiques et Sécurisés).
Je m'efforce de faire en sorte que l'ingénierie logicielle paraisse simple et facile en décomposant les problèmes complexes en solutions élégantes et en communiquant clairement les concepts techniques. J'adore raconter des histoires sur les logiciels.
Je suis également une communicatrice passionnée, partageant mes idées lors de conférences et d'événements. Animée par une passion pour l'apprentissage et l'innovation, je repousse constamment les limites de mes compétences.
Enfin, j'ai récemment publié mon livre, un aboutissement de ma passion et de mon expertise. Vous pouvez le découvrir ici :
Présentation :
Face au Big Data, les structures de données classiques montrent leurs limites. Découvrez les structures probabilistes (filtres de Bloom, HyperLogLog...) qui privilégient l'efficacité pour gérer d'énormes volumes de données. Apprenez à estimer la cardinalité, détecter les similarités et résoudre des problèmes complexes avec une précision "suffisante".
Plan :
- Introduction : Limites classiques, principes probabilistes.
- Types : Bloom, HyperLogLog, Count-Min Sketch, t-digest, SimHash, MinHash.
- Applications (basées sur mon article ITNEXT) :
- HyperLogLog : Redis, Redshift, ScyllaDB, Facebook, Google BigQuery.
- Count-Min Sketch : Redis, trafic réseau, e-commerce.
- t-digest : Redis, Druid, PostgreSQL, ElasticSearch, Redshift.
- SimHash : Moteurs de recherche, réseaux sociaux, plagiat.
- MinHash : Déduplication, filtrage collaboratif, génomique.
- Conclusion : Avantages, limites, futur.
Mots-clés :
Structures de données probabilistes, Big Data, filtres de Bloom, HyperLogLog, Count-Min Sketch, t-digest, SimHash, MinHash, Skip lists, estimation de cardinalité, recherche de similarité, approximation.
Searching for speaker images...