13ème édition – du 16 au 18 avril 2025
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
Yannick Lambruschi

I'm a Senior ML Data Engineer with a passion for building scalable data systems and driving machine learning solutions into production. With extensive experience in data engineering, Feature store, and cloud technologies, I enjoy sharing insights and best practices about data pipelines, ML workflows, and emerging trends in data and machine learning. Whether it's automating deployments, optimizing big data performance, or exploring new tools in the ML ecosystem, I'm dedicated to helping others navigate the ever-evolving world of data and AI.

View
IA en Production : Servir des modèles d'IA avec performance et scalabilité
Conference (INTERMEDIATE level)
Maillot

Les différents cas d’usages de modèles d’IA et de GenAI en production sont sujets à des contraintes de déploiement spécifiques qui nécessitent des approches adaptées. Par exemple, pour un cas d’usage e-commerce basse latence, nous avons déployé nos modèles sur KServe, une solution cloud-native qui exploite Kubernetes pour permettre une colocalisation efficace et optimiser les coûts. À l’opposé, pour un cas d’usage de transformation de catalogues avec des modèles LLM fine-tunés, nous avons réussi à intégrer une architecture Multi-LoRA sur Anyscale grâce à RayLLM, répondant à des besoins de traitement à haut volume avec coût maîtrisé.

Cette présentation abordera ces deux approches distinctes en mettant en lumière les défis techniques, les critères de choix des solutions et les enseignements tirés pour optimiser le déploiement et l’orchestration de modèles d’IA selon leurs contraintes spécifiques en production

More

Searching for speaker images...

fr_FRFrançais