/ SPEAKER
Je suis un développeur passionné par tout ce qui façonne notre futur. Dans une vie antérieure, j’ai cofondé Bookeen et été un pionnier de l'industrie du livre électronique. Aujourd'hui explorateur cloud chez Google Paris, je parcours les frontières de l'innovation et me plais à partager le monde des possibles.
2025 est l’année des agents IA. Les grands modèles de langage (LLM) ne cessent d’évoluer et l’état de l’art offre désormais une interface multimodale, en entrée mais aussi en sortie, avec une API bidirectionnelle permettant des échanges naturels en live. Ajoutez à cela le long contexte unique de Gemini, et les possibilités sont décuplées.
Dans cet atelier, nous couvrirons notamment les cas d’usage suivants :
- Interagir en temps réel avec un agent IA, en partageant audio et vidéo
- Analyser des vidéos pour en extraire les transcriptions tout en identifiant les différents locuteurs (diarisation multimodale)
- Construire un graphe de connaissance en extrayant l’information contenue dans 1M de tokens
Aucune expertise, préparation ou installation n’est requise. Venez avec votre ordinateur, un navigateur et une bonne pincée de curiosité…
Searching for speaker images...