> Data > Big Data : comment maîtriser son patrimoine informationnel

Big Data : comment maîtriser son patrimoine informationnel

Data - Par Sabine Terrey - Publié le 27 mars 2018
email

Editeur de logiciels, depuis 1993, spécialiste de la gestion des données et du décisionnel qui n’a évidemment pas de secret pour l’entreprise, Informatica a étendu son offre avec des solutions de qualité et de gouvernance des données, des outils dédiés métiers… Mais revenons au Big Data avec Edouard Guérin, expert Big Data chez Informatica. Comment les DSI peuvent-ils assurer la cohérence de leur SI ? Et si le Data Catalog influençait la donne ...

Big Data : comment maîtriser son patrimoine informationnel

Volume de données & cas d’usage

« Au-delà de l’IT classique, on s’adresse beaucoup plus aux métiers » souligne d’emblée Edouard Guérin. Jusqu’ici les données étaient stockées et pas vraiment accessibles, mais le rapport à la donnée a fondamentalement changé avec le temps.

« Auparavant, il y avait une distinction nette entre producteurs et consommateurs de la donnée, aujourd’hui avec les nouvelles technologies, le stockage et l’accès plus rapide notamment, chacun est producteur et consommateur de la donnée » nous rappelle Edouard Guérin. Pas de doute, le Big Data démocratise l’accès aux données…

Face à ce bouleversement majeur, les volumes de données sont énormes et les cas d’usage sont multiples, prédiction des détections de pannes dans le monde industriel ou suggestion de nouvelles offres par rapport à l’usage … Informatica répond à ces problématiques avec « la construction d’un datalake et la gestion du Système d’Information dans sa globalité ».

Avoir une vision d’ensemble est primordial pour savoir d’où viennent les données, comment elles sont constituées, qui en est le responsable « afin de proposer le bon service aux consommateurs internes mais aussi externes de l’entreprise ». C’est ici qu’interviennent les notions de data préparation et de gouvernance de la donnée sur le Big Data.

L’atout du Data Catalog

On parle du « catalogage » des données, en d’autres termes, il est impératif de faire une cartographie des données pour savoir « ce qui existe dans le SI ». « Si on veut proposer l’accès aux données, encore faut-il en avoir un inventaire et donc en avoir un catalogue » explique Edouard Guérin.

Avec Enterprise Data Catalog, Informatica collecte ainsi les métadonnées du SI (gestion, production, RH …) pour obtenir une vision globale des données dans l’entreprise, un moteur de recherche permet de retrouver l’information très rapidement, et de préciser « d’où elle vient, où elle va ».

La force de proposition réside, ensuite, dans la qualification des données (forte ou faible valeur ajoutée) « nous sondons les données pour en déterminer la qualité, la valeur et les croiser avec d’autres jeux de données présents dans le SI ». L’aspect catalogue est tout simplement la base, notamment pour savoir si les données sont réutilisables.

L’indépendance fait la force d’Informatica qui « peut assurer une couverture la plus large du marché, ce qui permet un accès à tous types de métadonnées à la fois dans le datalake Hadoop et celles à l’extérieur ». Le Data Catalog est exhaustif « 360° avec tous types de technologies ». De plus, « nous relions l’ensemble à un glossaire métier pour avoir une vision synthétique de l’inventaire du patrimoine informationnel avec, à la fois, la vision technique et la vision métier ».

Le libre-service !

L’accès aux données est démocratisé au travers d’une plate-forme libre-service qui permet de préparer les données, pour qu’elles soient accessibles par l’utilisateur lui-même.

En effet, face à la multiplicité des formats, « les données ne sont pas toujours présentables pour l’utilisateur final, ici notre rôle est de restructurer l’information qui ne l’est pas, d’une part, et de croiser les informations les unes avec les autres pour apporter une vraie valeur ajoutée » commente Edouard Guérin.

Il ne vous reste plus qu’à cataloguer, cartographier et auditer !

 

Téléchargez cette ressource

Les mégatendances cybersécurité et cyber protection 2024

Les mégatendances cybersécurité et cyber protection 2024

L'évolution du paysage des menaces et les conséquences sur votre infrastructure, vos outils de contrôles de sécurité IT existants. EPP, XDR, EDR, IA, découvrez la synthèse des conseils et recommandations à appliquer dans votre organisation.

Data - Par Sabine Terrey - Publié le 27 mars 2018