13th édition – du 16 au 18 avril 2025
3 jours de conférences, 70 exposants, 4500 visiteurs par jour
Utiliser ChatGPT, Claude ou Copilot nous oblige à partager nos données avec les sociétés qui opèrent les modèlent correspondants.

Si on préfère garder le contrôle de ses données (ou qu'on y est obligé par la réglementation), on peut se tourner vers des modèles comme Llama, Mistral, Phi-3 ou encore Qwen, que l'on peut héberger en local ou sur des clusters Kubernetes, par exemple.

C'est ce qu'on va faire ensemble dans ce tutoriel ! On va :
  • Créer une petite app d'IA générative avec Java et Spring AI
  • Intégrer cette app avec un LLM local
  • Déployer l'app et le LLM sur Kubernetes
  • Passer l'app et le LLM à l'échelle grâce à une architecture asynchrone (avec des files de message)
  • Se doter de métriques afin de pouvoir correctement dimensionner l'application (notamment au niveau des "requests" et "limits" CPU et mémoire dans Kubernetes)
  • Mettre en place de l'auto-scaling avec ces métriques

Notre application de démo est écrite en Java, mais les concepts liés au déploiement et au passage à l'échelle de l'app et du LLM sont totalement indépendants du langage.

N'hésitez pas à nous rejoindre si vous n'avez que des bases en Java et souhaitez monter en compétence sur Kubernetes, ou même l'inverse!
Sandra Ahlgrimm
Microsoft
Sandra Ahlgrimm est développeuse cloud senior à Microsoft spécialisée en Java. Elle s'intéresse particulièrement à la fluidité de l'expérience du développeur lors du déploiement de leur charge de travail Java sur Azure, avec des machines virtuelles, App Service, AKS, Azure Spring Apps, Azure Functions ou Azure Container Apps.

Sandra et son équipe, les Advocates Java, travaillent en étroite collaboration avec les équipes produit et les développeurs pour s’assurer que les services Azure sont testés et optimisés pour répondre aux besoins des développeurs. Ils sensibilisent et informent également la communauté sur les fonctionnalités de ces services.
Jérôme Petazzoni
Jérôme fait partie de l'équipe qui a conçu et popularisé Docker. Il a passé 7 ans au service de la fameuse startup Californienne. Après avoir été responsable du PAAS dotCloud, il a représenté Docker lors de conférences comme LinuxCon, Yandex YAC, OSCON, Velocity, LISA, ou encore AWS re:invent. Puis il a conçu et délivré des formations et tutoriels sur Docker, Swarm, et Kubernetes. Il possède un nombre indéterminé d'instruments de musique, et sait jouer le thème de Zelda sur la plupart d'entre eux.
en_USEnglish