Selon Bill Inmon, les métadonnées représentent tout à la fois "la description
de la structure, du contenu, des clés, des index, etc… des données" (Managing
the data Warehouse , John Wiley & Sons, 1996).
Plus spécifiquement, dans un environnement d'entrepôt de données, les métadonnées
peuvent représenter des informations sur les
Qu’est-ce qu’une métadonnée ?
données de l’entrepôt, des informations
sur la manière d’extraire une partie des données de l’entrepôt, ou des informations
sur la qualité des données de l’entrepôt. Les métadonnées peuvent également fournir
des informations sur la manière d’utiliser les outils de l’entrepôt pour accomplir
différentes tâches. Les métadonnées d’un entrepôt de données incluent des informations
sur les systèmes, les processus, les bases de données sources et cibles, les transformations
des données, le nettoyage et l’accès aux données, les data marts et les outils
OLAP.
Par exemple, les métadonnées d’un entrepôt de données peuvent indiquer comment
un outil OLAP a calculé la colonne Total des ventes d’un rapport. Sans rien savoir
d’autre sur l’entrepôt de données, un utilisateur analysant un rapport sur les
ventes régionales peut penser que le total des ventes inclut toutes les remises
et les frais d’expédition et de distribution.
Or, la colonne Total des ventes pourrait ne pas inclure tous ces éléments. Pour
aider l’utilisateur final, l’entrepôt de données a besoin de métadonnées qui associent
les colonnes des rapports à la fois aux transformations de données, aux requêtes
de données, aux calculs de champs et aux tables et colonnes des bases de données
sources. L’entrepôt peut fournir cette aide s’il dispose des métadonnées sur les
bases de données sources (telles que les tables et les colonnes), les informations
extraites, la manière dont elles ont été transformées, la base de données cible
(ou entrepôt de données), les outils de génération de rapports sur les données
ainsi que les outils de conception et de modélisation de la base de données.
De nombreuses implémentations d’entrepôts utilisent aujourd’hui une simple feuille
de calcul pour gérer les mises en correspondance et les conversions entre les
sources et les cibles. Toutefois, au delà de la phase initiale de définition des
besoins du projet, cette information devient rapidement obsolète et inaccessible
à la plupart des utilisateurs qui interagissent avec le data warehouse.
Téléchargez cette ressource
Guide de Cyber-résilience pour Microsoft 365
La violation de votre tenant M365 va au-delà d’un simple incident de cybersécurité. Elle peut entraîner une interruption opérationnelle généralisée, des perturbations commerciales et une exposition de vos données sensibles. Découvrez les méthodes et technologies pour évaluer, comparer et renforcer votre posture de sécurité Microsoft 365.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Face aux ransomwares, la résilience passe par les sauvegardes immuables
- L’IA, nouveau moteur des entreprises françaises d’ici 2030
- Gouvernance, cybersécurité et agents IA : trois défis clés à relever pour réussir la transition en 2026
- Top 5 des évolutions technologiques impactant la sécurité 2026
Articles les + lus
CES 2026 : l’IA physique et la robotique redéfinissent le futur
Les 3 prédictions 2026 pour Java
Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
Face à l’urgence écologique, l’IT doit faire sa révolution
D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
À la une de la chaîne Tech
- CES 2026 : l’IA physique et la robotique redéfinissent le futur
- Les 3 prédictions 2026 pour Java
- Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
- Face à l’urgence écologique, l’IT doit faire sa révolution
- D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
