Selon Bill Inmon, les métadonnées représentent tout à la fois "la description
de la structure, du contenu, des clés, des index, etc… des données" (Managing
the data Warehouse , John Wiley & Sons, 1996).
Plus spécifiquement, dans un environnement d'entrepôt de données, les métadonnées
peuvent représenter des informations sur les
Qu’est-ce qu’une métadonnée ?
données de l’entrepôt, des informations
sur la manière d’extraire une partie des données de l’entrepôt, ou des informations
sur la qualité des données de l’entrepôt. Les métadonnées peuvent également fournir
des informations sur la manière d’utiliser les outils de l’entrepôt pour accomplir
différentes tâches. Les métadonnées d’un entrepôt de données incluent des informations
sur les systèmes, les processus, les bases de données sources et cibles, les transformations
des données, le nettoyage et l’accès aux données, les data marts et les outils
OLAP.
Par exemple, les métadonnées d’un entrepôt de données peuvent indiquer comment
un outil OLAP a calculé la colonne Total des ventes d’un rapport. Sans rien savoir
d’autre sur l’entrepôt de données, un utilisateur analysant un rapport sur les
ventes régionales peut penser que le total des ventes inclut toutes les remises
et les frais d’expédition et de distribution.
Or, la colonne Total des ventes pourrait ne pas inclure tous ces éléments. Pour
aider l’utilisateur final, l’entrepôt de données a besoin de métadonnées qui associent
les colonnes des rapports à la fois aux transformations de données, aux requêtes
de données, aux calculs de champs et aux tables et colonnes des bases de données
sources. L’entrepôt peut fournir cette aide s’il dispose des métadonnées sur les
bases de données sources (telles que les tables et les colonnes), les informations
extraites, la manière dont elles ont été transformées, la base de données cible
(ou entrepôt de données), les outils de génération de rapports sur les données
ainsi que les outils de conception et de modélisation de la base de données.
De nombreuses implémentations d’entrepôts utilisent aujourd’hui une simple feuille
de calcul pour gérer les mises en correspondance et les conversions entre les
sources et les cibles. Toutefois, au delà de la phase initiale de définition des
besoins du projet, cette information devient rapidement obsolète et inaccessible
à la plupart des utilisateurs qui interagissent avec le data warehouse.
Téléchargez cette ressource

Percer le brouillard des rançongiciels
Explorez les méandres d’une investigation de ransomware, avec les experts de Palo Alto Networks et Unit 42 pour faire la lumière dans la nébuleuse des rançongiciels. Plongez au cœur de l’enquête pour comprendre les méthodes, les outils et les tactiques utilisés par les acteurs de la menace. Découvrez comment prévenir les attaques, les contrer et minimiser leur impact. Des enseignements indispensables aux équipes cyber.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Cybersécurité : le secteur de la santé toujours au défi de la sécurité des e-mails
- Attaque Microsoft SharePoint, analyse et recommandations
- Devenir RSSI : quels parcours et de quelles qualités faire preuve ?
- Évolution du marché de la virtualisation : quelle voie choisir ?
- La performance de l’IA et l’analytique reposent sur des fondations de données solides
