Umanis est une société française créée autour de la data, il y a plus de 20 ans, par des statisticiens. Rencontre avec Ronald Chrisostom, IT Manager Big Data & Search Engines, Architecte Big Data & Analytics, du pôle Consulting qui nous livre son expertise sur le sujet.
Pourquoi les projets Big Data ont besoin des moteurs de recherche ?
Rapidité, simplicité, facilité, distribution …
Pourquoi a-t-on besoin de moteurs de recherche dans le milieu Big Data ?
Revenons sur un point, « les moteurs de recherche sont distribués, fragmentés et devenus scalables avant même l’ère Big Data ». De plus, les moteurs de recherche peuvent gérer des milliards d’enregistrements, on parle dorénavant en millisecondes. Et « ce même concept est exploité dans Hadoop ».
Mais, pourquoi a-t-on besoin des moteurs de recherche dans ce contexte ?
Aujourd’hui « certes, nous commençons à mettre en production les datalakes, mais pour aller rechercher et puiser les informations plus tard, il sera nécessaire de taper une requête afin de récupérer les informations stockées. A ce moment-là, disposerez-vous de toutes les informations pour savoir ce qu’on a mis dans le datalake ?». Or, comment taper ces requêtes, car n’importe quel datalake c’est plus 95 % de tables structurées. « Quand on fait des requêtes SQL, on fait des ‘like’, alors que quand on utilise les moteurs de recherche c’est un million de fois plus rapide que les ‘like’, les temps de réponse sont courts ». Faire des recherches avec des mots clés permet de trouver les informations utiles !

Les mécanismes de recherche sont facilement distribuables sur de larges clusters, d’autant que les données sont devenues hautement volumétriques.
Téléchargez cette ressource
Mac en entreprise : le levier d’un poste de travail moderne
Ce livre blanc répond aux 9 questions clés des entreprises sur l’intégration du Mac : sécurité, compatibilité, gestion, productivité, coûts, attractivité talents, RSE et IA, et l’accompagnement sur mesure proposé par inmac wstore.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Analyse Patch Tuesday Juin 2026
- La bataille de la 6G se gagne dans la donnée en temps réel
- BlueSecure repense la sensibilisation à la cybersécurité avec des formats immersifs et engageants
- Les agents d’IA fragilisent la sécurité : pour les sécuriser, inutile de repartir de zéro
Articles les + lus
Cryptographie post-quantique : le Campus Cyber publie deux guides clés pour accélérer la transition des entreprises
Cyberattaques : 46% des entreprises françaises perdent du chiffre d’affaires dès le premier jour
Le Cercle de l’Innovation décerne le Prix de l’Innovation du Public 2026
Les marchés publics peuvent-ils encore faire émerger des champions numériques français ?
Ready For IT 2026 : IA industrialisée, deepfakes et Prix Start-up au cœur des enjeux
À la une de la chaîne Enjeux IT
- Cryptographie post-quantique : le Campus Cyber publie deux guides clés pour accélérer la transition des entreprises
- Cyberattaques : 46% des entreprises françaises perdent du chiffre d’affaires dès le premier jour
- Le Cercle de l’Innovation décerne le Prix de l’Innovation du Public 2026
- Les marchés publics peuvent-ils encore faire émerger des champions numériques français ?
- Ready For IT 2026 : IA industrialisée, deepfakes et Prix Start-up au cœur des enjeux
