Editeur de logiciels, depuis 1993, spécialiste de la gestion des données et du décisionnel qui n’a évidemment pas de secret pour l’entreprise, Informatica a étendu son offre avec des solutions de qualité et de gouvernance des données, des outils dédiés métiers… Mais revenons au Big Data avec Edouard Guérin, expert Big Data chez Informatica. Comment les DSI peuvent-ils assurer la cohérence de leur SI ? Et si le Data Catalog influençait la donne ...
Big Data : comment maîtriser son patrimoine informationnel
Volume de données & cas d’usage
« Au-delà de l’IT classique, on s’adresse beaucoup plus aux métiers » souligne d’emblée Edouard Guérin. Jusqu’ici les données étaient stockées et pas vraiment accessibles, mais le rapport à la donnée a fondamentalement changé avec le temps.
« Auparavant, il y avait une distinction nette entre producteurs et consommateurs de la donnée, aujourd’hui avec les nouvelles technologies, le stockage et l’accès plus rapide notamment, chacun est producteur et consommateur de la donnée » nous rappelle Edouard Guérin. Pas de doute, le Big Data démocratise l’accès aux données…
Face à ce bouleversement majeur, les volumes de données sont énormes et les cas d’usage sont multiples, prédiction des détections de pannes dans le monde industriel ou suggestion de nouvelles offres par rapport à l’usage … Informatica répond à ces problématiques avec « la construction d’un datalake et la gestion du Système d’Information dans sa globalité ».
Avoir une vision d’ensemble est primordial pour savoir d’où viennent les données, comment elles sont constituées, qui en est le responsable « afin de proposer le bon service aux consommateurs internes mais aussi externes de l’entreprise ». C’est ici qu’interviennent les notions de data préparation et de gouvernance de la donnée sur le Big Data.
L’atout du Data Catalog
On parle du « catalogage » des données, en d’autres termes, il est impératif de faire une cartographie des données pour savoir « ce qui existe dans le SI ». « Si on veut proposer l’accès aux données, encore faut-il en avoir un inventaire et donc en avoir un catalogue » explique Edouard Guérin.
Avec Enterprise Data Catalog, Informatica collecte ainsi les métadonnées du SI (gestion, production, RH …) pour obtenir une vision globale des données dans l’entreprise, un moteur de recherche permet de retrouver l’information très rapidement, et de préciser « d’où elle vient, où elle va ».
La force de proposition réside, ensuite, dans la qualification des données (forte ou faible valeur ajoutée) « nous sondons les données pour en déterminer la qualité, la valeur et les croiser avec d’autres jeux de données présents dans le SI ». L’aspect catalogue est tout simplement la base, notamment pour savoir si les données sont réutilisables.
L’indépendance fait la force d’Informatica qui « peut assurer une couverture la plus large du marché, ce qui permet un accès à tous types de métadonnées à la fois dans le datalake Hadoop et celles à l’extérieur ». Le Data Catalog est exhaustif « 360° avec tous types de technologies ». De plus, « nous relions l’ensemble à un glossaire métier pour avoir une vision synthétique de l’inventaire du patrimoine informationnel avec, à la fois, la vision technique et la vision métier ».
Le libre-service !
L’accès aux données est démocratisé au travers d’une plate-forme libre-service qui permet de préparer les données, pour qu’elles soient accessibles par l’utilisateur lui-même.
En effet, face à la multiplicité des formats, « les données ne sont pas toujours présentables pour l’utilisateur final, ici notre rôle est de restructurer l’information qui ne l’est pas, d’une part, et de croiser les informations les unes avec les autres pour apporter une vraie valeur ajoutée » commente Edouard Guérin.
Il ne vous reste plus qu’à cataloguer, cartographier et auditer !
Téléchargez cette ressource
Guide inmac wstore pour l’équipement IT de l’entreprise
Découvrez les dernières tendances et solutions IT autour des univers de Poste de travail, Affichage et Collaboration, Impression et Infrastructure, et notre dossier Green IT sur les actions engagés par inmac wstore pour réduire son impact environnemental
Les articles les plus consultés
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- 10 grandes tendances Business Intelligence
- L’utilisation des données pour survivre !
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble