Aujourd'hui, quand on pense à mettre en place la recherche textuelle dans une application, les mots qui viennent spontanément sont : ElasticSearch, SoLR ou encore Lucene.
Qu’on se le dise : les solutions sont incroyables, et ont vraiment eu un gros impact dans de nombreux SIs. Mais en avez-vous vraiment besoin ?
Car déployer et maintenir des clusters ElasticSearch, gérer la manière dont on réplique la donnée à indexer, comment on la garde synchronisée...
Et s’il suffisait d’utiliser votre PostgreSQL, est-ce que ça ne serait pas beaucoup plus simple et moins cher ?
Nous vous présenterons les concepts clé de recherche textuelle tels que la tokenisation, les stop words, la pertinence. Nous montrerons leur utilisation dans PostgreSQL à chaque étape sur un jeu de données de livres français fourni par la BNF !
On terminera par une prise de hauteur sur ce qui marche bien, les limites du système, pour aider à prendre des décisions d’architecture dans vos projets.
Qu’on se le dise : les solutions sont incroyables, et ont vraiment eu un gros impact dans de nombreux SIs. Mais en avez-vous vraiment besoin ?
Car déployer et maintenir des clusters ElasticSearch, gérer la manière dont on réplique la donnée à indexer, comment on la garde synchronisée...
Et s’il suffisait d’utiliser votre PostgreSQL, est-ce que ça ne serait pas beaucoup plus simple et moins cher ?
Nous vous présenterons les concepts clé de recherche textuelle tels que la tokenisation, les stop words, la pertinence. Nous montrerons leur utilisation dans PostgreSQL à chaque étape sur un jeu de données de livres français fourni par la BNF !
On terminera par une prise de hauteur sur ce qui marche bien, les limites du système, pour aider à prendre des décisions d’architecture dans vos projets.
Zied Ben abderrahim
Capco
Développeur java depuis 2008, suis actuellement tech lead chez Capco où j'interviens dans la refonte des applications bancaires. Passionné, j'aime apprendre et partager sur tous les sujets qui touchent au développement et l architecture logicielle.
Sébastien Keller
Takima
S’il n’est pas en train de faire sa séance de bloc quasi-quotidienne, vous pourrez trouver Sébastien en train de répondre à des questions sur son diagramme d’archi ou de lire le code de Kafka Stream pour trouver le bon TaskAssignor.
Après 13 ans, et quelques générations de juniors formées, Sébastien se décide enfin à partager son expérience à un public plus large.
Côté métier, il a travaillé sur des codebases aussi variées que de l’assurance, des sites e-commerce et plus récemment, de la Big Data. Il pourra vous parler de toutes les mauvaises idées qu’il a croisé sur son chemin, mais aussi des bonnes !
Après 13 ans, et quelques générations de juniors formées, Sébastien se décide enfin à partager son expérience à un public plus large.
Côté métier, il a travaillé sur des codebases aussi variées que de l’assurance, des sites e-commerce et plus récemment, de la Big Data. Il pourra vous parler de toutes les mauvaises idées qu’il a croisé sur son chemin, mais aussi des bonnes !