> Tech > L’intégration avec le Microsoft Data Warehousing Framework

L’intégration avec le Microsoft Data Warehousing Framework

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Le référentiel est un composant du Microsoft Data Warehousing Framework, et une partie importante de la stratégie SQL Server. Microsoft apporte de la valeur ajoutée à  ses clients base de données en rajoutant des outils de gestion d'entrepôts de données comme DTS (Data Transformation Services), OLAP Services, English Query et

Repository à  SQL Server 7.0. On peut également accéder au référentiel par le
biais de SQL Server Enterprise Manager, comme le montre l’écran 1, en cliquant
sur le noeud Metadata sous Data Transformation Services. De là , on peut accéder
aux informations du schéma relationnel et aux informations des packages et des
lignages. On peut également explorer les relations entre les colonnes et les packages
qui les mettent à  jour.

Data Transformation Services. DTS est l’outil d’extraction, de transformation
et de chargement fourni avec SQL Server 7.0. Sa flexibilité et l’étendue de ses
fonctions permettent de remplir un entrepôt de données. On peut sauvegarder des
packages directement dans le référentiel. Une des fonctions les plus attrayantes
de DTS, le lignage, nécessite la présence du référentiel. Le lignage permet de
suivre à  la trace la façon dont les données ont été calculées et la date de leur
insertion dans l’entrepôt de données.

Pour sauvegarder les informations de DTS dans Microsoft Repository, sélectionnez
SQL Server Repository comme cible pour sauvegarder le package. Utilisez l’onglet
« Advanced » sur les propriétés du package pour configurer les options de scanning,
comme le montre l’écran 2. En procédant ainsi, DTS fait appel au scanner OLE DB
pour charger tous les catalogues sources et cibles dans le référentiel. Si on
ne configure pas les options du scanner, DTS crée les DTS Local Catalogs en tant
que référence pour tous les catalogues sources et cibles, ce qui peut rendre impossible
la localisation des bases de données. Toute sauvegarde subséquente réplique cette
référence. Ainsi, on ne pouvez pas maintenir des commentaires et autres informations
descriptives à  jour.

On risque de rencontrer des problèmes lorsqu’on tente de sauvegarder certaines
transformations DTS dans un référentiel. Si on utilise un script type pour effectuer
une transformation simple et que l’on choisit les colonnes sources explicitement
(et non à  partir d’une requête), toutes les données des transformations sont capturées,
comme on peut le constater dans le modèle de transformation décrit dans l’article
« Le modèle OIM ». Si on choisit une requête comme source de transformation, cette
source devient des objets qui ne font pas partie des données importées par OLE
DB. Ce choix rend difficiles les connexions suivantes aux véritables objets sources.

En outre, la requête n’est pas analysée pour créer une connexion entre les colonnes
des requêtes et les colonnes à  partir desquelles on choisit les données. Ainsi,
dans de nombreux cas, la connexion entre la source et la cible est disponible,
mais dans d’autres elle ne l’est pas. On peut résoudre ces problèmes en écrivant
un programme chargé de résoudre les références dans un référentiel ou en utilisant
un modèle personnalisé associé au modèle DTS pour enregistrer les correspondances
des sources cibles.

DTS utilise également le versioning pour l’objet package, mais il réplique tous
les objets subordonnés à  chaque sauvegarde. On peut alors retourner à  n’importe
quelle version d’un package pour voir exactement comment les données ont été transformées.
Cette fonction est importante pour dépister les problèmes liés aux données des
mois (voire des années) après qu’elles soient entrées dans l’entrepôt de données.
Ce procédé de versioning ne pose pas beaucoup de problèmes si on utilise les options
de scanning appropriées pour importer les schémas relationnels qui seront ensuite
convenablement numérotés pour assurer la continuité.

Services OLAP. Les « OLAP Services » permettent une analyse multidimensionnelle
des données de l’entrepôt. Avec un utilitaire Repository SDK, on peut importer
toutes les définitions des données OLAP dans un référentiel. Avec SQL Server 2000,
OLAP Services stocke les métadonnées directement dans le référentiel. Le seul
problème avec l’utilitaire de SQL Server 7.0 est qu’il ne relie pas les mesures
et les dimensions aux colonnes sous-jacentes, sur lesquelles elles sont basées.
L’établissement de ces connexions peut représenter une tâche manuelle fastidieuse.
On peut également écrire un programme pour établir les relations automatiquement.
Les informations concernant les colonnes utilisées sont disponibles dans le modèle
du référentiel. Ainsi, on peut pouvez facilement extraire les données.

English Query English Query permet de définir un modèle sémantique pour une base
de données, puis traduit des expressions anglaises en SQL. Le modèle sémantique
fournit des informations sur un système et la façon dont il est utilisé et peut
être important lorsqu’on utilise l’entrepôt de données. Le Repository SDK contient
un utilitaire permettant d’importer des données de English Query dans un référentiel.
SQL Server 2000 comporte une option dans English Query permettant d’exporter et
d’importer des modèles d’un référentiel.

OLE DB (schéma relationnel). L’importation de schémas relationnels dans un référentiel
fournit l’ensemble des informations de base nécessaires pour commencer à  documenter
le data warehouse. On peut importer des schémas de base de données depuis n’importe
quelle source de données compatible OLE DB ou ODBC. Pour exécuter l’importation
à  partir d’Enterprise Manager, cliquez à  l’aide du bouton droit de la souris sur
l’onglet Metadata sous Data Transformation Services, puis sélectionnez Import
Metadata. Cet utilitaire d’importation met en oeuvre un versioning intégral lors
du chargement des données. Ainsi, on peut aisément suivre les modifications intervenues
sur les schémas de base de données au fil du temps. Etant donné que l’utilitaire
gère les versions, il conserve toutes les informations descriptives, comme les
commentaires, et le rebalayage du catalogue n’affecte pas les informations.

Téléchargez cette ressource

Guide inmac wstore pour l’équipement IT de l’entreprise

Guide inmac wstore pour l’équipement IT de l’entreprise

Découvrez toutes nos actualités à travers des interviews, avis, conseils d'experts, témoignages clients, ainsi que les dernières tendances et solutions IT autour de nos 4 univers produits : Poste de travail, Affichage et Collaboration, Impression et Infrastructure.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010