> Tech > Construire les data warehouses

Construire les data warehouses

Tech - Par iTPro - Publié le 24 juin 2010
email

Pour le data warehouse géologique, nous avons utilisé un schéma en étoile avec une table de faits contenant tous les résultats analytiques et les tables de dimensions contenant des informations de temps, d'endroit, de description d'échantillon, de méthode d'échantillonnage et de croisière. La figure 5 montre le modèle que nous

avons utilisé. Au
début, nous avons essayé
de peupler la table
de faits à  partir d’Access
en utilisant l’option DTS
Lookup. Nous voulions
utiliser DTS Lookup
parce que nous peuplions
la table de faits avec des données
d’analyses basées sur les clés primaires
multi champs provenant de
nombreuses sources de tables différentes.
Après avoir consulté diverses
sources sur le Web et dans SQL Server
Books Online (BOL) et après avoir
posé des questions sur les groupes
d’utilisateurs MSDN, nous en avons
conclu qu’il était probablement impossible
de consulter une valeur dans la
table dans laquelle on est en train
d’écrire des données. Nous avons aussi
appris que cela ralentit l’exécution
du package DTS sensiblement parce
qu’on est obligé de pratiquer le
chargement de données ligne par
ligne.
En utilisant SQL Server 2000 DTS,
nous avons créé un package local qui
contenait chacune des transformations
de données. Nous avons tapé les commandes
que montre le listing 1, pour
mettre à  jour chacune des tables à  l’intérieur
d’une tâche execute SQL dans
le package local. Il nous a paru plus
pratique d’exécuter chaque tâche de
transformation séparément plutôt que simultanément, pour détecter plus vite
les erreurs de coding.
Le listing 2 montre une commande
qui a servi à  importer des données
dans les tables de dimensions. Une fois
les données correctement transférées,
nous avons utilisé une requête T-SQL
semblable à  celle du listing 1 pour
charger les données dans les tables de
dimensions. Toutefois, cette seconde
requête contenait une clause WHERE
qui montrait l’égalité de la clé étrangère
appropriée de la table de faits par
rapport à  la clé primaire de la table de
dimensions à  laquelle elle était en train
d’être reliée.
Les données d’étude du bois résidaient
dans huit tables qui utilisaient le
nom de site comme clé primaire. Le
nom de site a été attribué quand
l’étude scientifique originale a commencé
et il était unique pour chaque
échantillon. Pour le data warehouse
d’étude du bois, nous avons à  nouveau choisi un schéma en étoile, en utilisant
la table d’informations du site comme
la table de faits. La granularité pour
l’étude du bois a été tirée des espèces
de bois présentes à  chaque nom de
site.

Téléchargez gratuitement cette ressource

Guide de Services Cloud Managés

Guide de Services Cloud Managés

Accélérer votre transformation digitale, protéger et sécuriser vos environnements Cloud avec les offres de support, d'accompagnement et de services managés. Découvrez le TOP 3 des Services Managés pour accompagner la transformation de vos environnements Cloud, gagner en agilité et en sécurité dans un monde d'incertitudes.

Tech - Par iTPro - Publié le 24 juin 2010