> Enjeux IT > Pourquoi les projets Big Data ont besoin des moteurs de recherche ?

Pourquoi les projets Big Data ont besoin des moteurs de recherche ?

Enjeux IT - Par Sabine Terrey - Publié le 13 mai 2019

Umanis est une société française créée autour de la data, il y a plus de 20 ans, par des statisticiens. Rencontre avec Ronald Chrisostom, IT Manager Big Data & Search Engines, Architecte Big Data & Analytics, du pôle Consulting qui nous livre son expertise sur le sujet.

Pourquoi les projets Big Data ont besoin des moteurs de recherche ?

Rapidité, simplicité, facilité, distribution …

Pourquoi a-t-on besoin de moteurs de recherche dans le milieu Big Data ?

Revenons sur un point, « les moteurs de recherche sont distribués, fragmentés et devenus scalables avant même l’ère Big Data ». De plus, les moteurs de recherche peuvent gérer des milliards d’enregistrements, on parle dorénavant en millisecondes. Et « ce même concept est exploité dans Hadoop ».

Mais, pourquoi a-t-on besoin des moteurs de recherche dans ce contexte ?

Aujourd’hui « certes, nous commençons à mettre en production les datalakes, mais pour aller rechercher et puiser les informations plus tard, il sera nécessaire de taper une requête afin de récupérer les informations stockées. A ce moment-là, disposerez-vous de toutes les informations pour savoir ce qu’on a mis dans le datalake ?». Or, comment taper ces requêtes, car n’importe quel datalake c’est plus 95 % de tables structurées. « Quand on fait des requêtes SQL, on fait des ‘like’, alors que quand on utilise les moteurs de recherche c’est un million de fois plus rapide que les ‘like’, les temps de réponse sont courts ». Faire des recherches avec des mots clés permet de trouver les informations utiles !

Le moteur de recherche ne se soucie pas de la structure, les documents sont pris sous n’importe quelle forme et sont stockés, on réindexe les termes pour faire des recherches par terme Share on X

Les mécanismes de recherche sont facilement distribuables sur de larges clusters, d’autant que les données sont devenues hautement volumétriques.

Téléchargez cette ressource

Guide de Threat Intelligence contextuelle

Ce guide facilitera l’adoption d’une Threat Intelligence - renseignement sur les cybermenaces, cyberintelligence - adaptée au "contexte", il fournit des indicateurs de performance clés (KPI) pour progresser d' une posture défensive vers une approche centrée sur l’anticipation stratégique

Les articles les plus consultés

A travers cette chaîne

A travers ITPro

Les plus consultés sur iTPro.fr

Articles les + lus

Pourquoi la souveraineté des données relève du contrôle et non de la géographie

Attaques IA : un Active Directory peut être compromis en 40 minutes

Au-delà du polling: pourquoi la surveillance des systèmes hérités devient un risque pour l’entreprise

La souveraineté numérique commence par avoir le choix de son infrastructure

Réforme de la facturation électronique : une préparation largement théorique

A lire aussi sur le site

Analyse Patch Tuesday Juillet 2026

Microsoft vient de publier son dernier patch Tuesday. Que retenir en quelques points clés ?

À la une de la chaîne Enjeux IT

Sécuriser sa téléphonie IP : 5 failles critiques à anticiper

Sécuriser sa téléphonie IP n’est plus une option. Avec la généralisation de la téléphonie cloud et des infrastructures VoIP, la voix circule désormais sur les mêmes réseaux que les données stratégiques de l’entreprise.

A la Une des Ressources IT

Inscrivez-vous !

Actualités, Dossiers et Ressources IT Professionnelles - mercredi 29 juillet 2026

Pourquoi les projets Big Data ont besoin des moteurs de recherche ?

Rapidité, simplicité, facilité, distribution …