> Data > Du relationnel au multidimensionnel

Du relationnel au multidimensionnel

Data - Par iTPro.fr - Publié le 24 juin 2010
email

par Bob Pfeiffer
Inspirez-vous de l'exemple simple décrit ici pour extraire des données relationnelles vers un datamart multidimensionnel Vous avez certainement déjà  entendu les termes datamart, bases de données multidimensionnelles, schéma en étoile. Mais nombreux sont ceux qui pensent que le fonctionnement des entrepôts de données (datawarehouse) reste un mystère. Si vous n'avez pas pris part à  un projet de développement de datawarehouse d'entreprise ou d'un département de l'entreprise, vous avez peut-être du mal à  maîtriser ces concepts et à  imaginer comment ils peuvent se traduire en solutions pratiques. Aussi, commençons cette présentation des entrepôts de données une fois encore par l'analyse d'un problème de gestion courant, et en parcourant une solution de datamart simple utilisant l'environnement contrôlé de la base de données témoin Northwind fournie avec SQL Server.

Du relationnel au multidimensionnel

Supposons que je travaille pour Northwind Traders Inc. en qualité d’administrateur
de bases de données, et de développeur, et que je sois un peu l’homme à  tout faire
dans la maison. Et, disons qu’un jour, le Dr Andrew Fuller, vice-président des
ventes, vient me voir pour me demander des informations sur les produits vendus
par Northwind Traders.  » Je veux voir la quantité de chaque produits commandée
par trimestre par les clients américains en 1997. Et j’aimerai connaître nos trois
meilleurs commerciaux et leurs managers  » demande-t-il.

Je lui réponds :  » Oui, monsieur « . Je sais que le système de prise des commandes
de l’entreprise contient toutes ces informations (commandes, clients, produits,
fournisseurs, expéditeurs et employés) dans une base de données en troisième forme
norme comme le montre l’écran 1. Toutefois, je venais à  peine de terminer d’optimiser
cette base de données pour qu’elle puisse traiter l’enregistrement des commandes
aussi rapidement que possible, et voilà  maintenant que le patron me demande de
générer des rapports qui vont très probablement devoir se partager des ressources
avec d’autres fonctions, et ralentir à  nouveau la prise des commandes.

J’ai décidé que j’avais besoin d’informations supplémentaires sur la façon dont
le Dr Fuller et son équipe de commerciaux ont défini et comptent utiliser cette
information. En discutant avec les responsables des ventes et les commerciaux,
j’ai constaté que « la quantité de chaque produits commandée par les clients américains »
se résumait en fait au nombre et au prix des articles commandés (informations
contenues dans les enregistrements de la table Order Details). Le Dr Fuller veut
voir ces données « par trimestre en 1997 », ce qui signifie qu’il veut filtrer les
informations en fonction de la date, et il veut voir « les trois meilleurs commerciaux »,
ce qui veut dire qu’il veut voir les informations sur les ventes triées par employé.
Le responsable des ventes m’a également informé que le Dr Fuller voulait disposer
de cette information avant la réunion du département commercial, qui a lieu tous
les mardi matin, ce qui signifie qu’il n’a pas besoin d’avoir d’un rapport précis
à  la minute près du système de production (bonne nouvelle pour les performances
de la saisie des commandes).

La transformation de données dans la réalité

Mefiez-vous : dans les solutions d’entrepôt de données grandeur nature,
qui impliquent des sources de données disparates, on ne trouvera pratiquement
jamais des données aussi propres que celles de la base de données Northwind.
Il m’est arrivé d’extraire des données d’un système central qui ne possédait
ni domaine, ni entité pas plus que d’intégrité référentielle. J’ai même
trouvé des parties de noms de personnes dans des colonnes sensées contenir
des dates. Dans d’autres cas, je ne disposais d’aucun moyen dans le système
de production pour associer des comptes de facturation clients à  la liste
des clients, même si ces informations sont clairement associées commercialement
parlant.

La simplicité de ce projet fictif peut permettre de se familiariser avec
certains concepts, mais cela n’est en aucun cas représentatif des challenges
en matière de qualité, d’intégration et de gestion des données auxquels
on aura probablement à  faire face dans la plupart des projets de datawarehousing.
Une solution de datamart et les outils OLAP que l’on est susceptible de
lui associer pour générer des rapports et des analyses, ne représentent
que la partie visible d’un iceberg par rapport à  un entrepôt de données.
Caché sous l’eau, on retrouvera les analyses sur la qualité et le cycle
de vie des données, les processus d’intégration et d’extraction des données,
les processus d’extraction, de transformation et de chargement des données,
les considérations liées à  la structure et la mise en oeuvre et la gestion
des métadonnées. Ne vous laissez pas surprendre par ces éléments cachés.

A partir des besoins, j’ai identifié les mesures et les dimensions de
la base de données du datamart

Téléchargez cette ressource

Guide de réponse aux incidents de cybersécurité

Guide de réponse aux incidents de cybersécurité

Le National Institute of Standards and Technology (NIST) propose un guide complet pour mettre en place un plan de réponse aux incidents de cybersécurité, nous en avons extrait et détaillé les points essentiels dans ce guide. Découvrez les 6 étapes clés d'un plan de réponse efficace aux incidents de cybersécurité.

Data - Par iTPro.fr - Publié le 24 juin 2010