Si vous avez déjà lu quelques articles sur le data warehousing, vous en savez un peu plus sur les faits et dimensions, et comment ils forment un modèle dimensionnel. Mais vous vous interrogez peut-être sur la manière de créer un data warehouse à partir de faits et de dimensions.
Il me semble que c’est Ralph Kimball (ou un ou une de ses collègues) qui a inventé l’expression « architecture de bus » pour le data warehouse d’entreprise. Microsoft emploie le terme de modèle dimensionnel unifié (UDM, Unified Dimensional Model) pour un concept similaire, mais celui-ci va au delà du schéma en étoile.
L’architecture de bus du data warehouse
Une architecture de bus utilise une planification descendante et une grille de dimensions et fonctions métier, afin de fournir un ensemble de data marts étroitement intégrés. Pour avoir une meilleure idée du fonctionnement de l’architecture de bus, imaginez un bus électrique, autrement dit une structure de branchement universel servant de source d’alimentation pour tous les éléments raccordés, par exemple un gros câble électrique.
L’architecture de bus de data warehouse est constituée d’un ensemble de data marts étroitement intégrés, dont la « source d’alimentation » est un ensemble de dimensions et tables de faits mises en conformité. Une table de dimension est la table de recherche (lookup) d’un modèle dimensionnel. Elle contient des données textuelles qui décodent un identifiant dans les tables de faits associées. Une dimension mise en conformité est définie et implémentée une seule fois, et elle utilisée dans les différents schémas en étoile qui forment le data mart d’entreprise.
Les dimensions définissent le qui, quoi, où, quand, pourquoi et comment de la situation, et elles sont organisées pour leur exploitation par les utilisateurs métier. La figure 1 est un exemple d’une architecture de bus partielle. Elle contient deux tables de faits (RETAIL SALES et SHIP FORM MANUFACTURING), dérivables de la chaîne de valeur de production, et les dimensions mises en conformité qui les modifient.
Téléchargez cette ressource
Microsoft 365 Tenant Resilience
Face aux failles de résilience des tenants M365 (configurations, privilèges, sauvegarde). Découvrez 5 piliers pour durcir, segmenter et surveiller vos environnements afin de limiter l’impact des attaques. Prioriser vos chantiers cyber et améliorer la résilience de vos tenants Microsoft 365.
Les articles les plus consultés
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- Les projets d’intégration augmentent la charge de travail des services IT
- L’utilisation des données pour survivre !
- Databricks lève 1 milliard de dollars !
Les plus consultés sur iTPro.fr
- CRM et souveraineté : le choix technologique est devenu un choix politique
- France : la maturité data devient le moteur du retour sur investissement de l’IA
- Cloud et IA : une maturité en retard face à l’explosion des usages
- On ne peut pas gouverner ce qu’on ne peut pas voir : pourquoi la visibilité doit-elle passer avant la gouvernance en matière de sécurité des identités ?
Articles les + lus
ADI, l’infrastructure de données de Scality pensée pour l’ère de l’IA et de la souveraineté
Faire évoluer la souveraineté des données du statut d’ambition politique à son application opérationnelle
Fuites de données : la France, 2ème pays le plus touché au monde début 2026
Redéfinir la confiance à l’ère de l’IA agentique : les entreprises sont-elles prêtes pour le SOC autonome ?
Les défaillances des pipelines de données pèsent lourdement sur la performance des grandes entreprises
À la une de la chaîne Data
- ADI, l’infrastructure de données de Scality pensée pour l’ère de l’IA et de la souveraineté
- Faire évoluer la souveraineté des données du statut d’ambition politique à son application opérationnelle
- Fuites de données : la France, 2ème pays le plus touché au monde début 2026
- Redéfinir la confiance à l’ère de l’IA agentique : les entreprises sont-elles prêtes pour le SOC autonome ?
- Les défaillances des pipelines de données pèsent lourdement sur la performance des grandes entreprises
