> Tech > Transformation des données

Transformation des données

Tech - Par iTPro - Publié le 24 juin 2010
email

Alors que l’archivage des données extraites constitue une tâche périphérique importante, votre objectif principal est de transformer les données et de les écrire dans la table cible. Sur la figure 2, vous pouvez voir que la transformation inclut la résolution d’une valeur NULL dans la colonne MaxQty, laquelle identifie la

Transformation des données

quantité maximale pour laquelle une promotion marketing est valable.

S’il n’y a pas de quantité maximale (autrement dit, si la promotion s’applique quel que soit le nombre d’articles achetés), le système source place une valeur NULL dans la colonne MaxQty. Vous allez remplacer cette valeur par l’entier le plus grand possible pouvant être contenu dans la colonne, à savoir 2147483647.

Bien que vous puissiez employer SQL Server pour effectuer cette transformation dans la requête d’extraction, nous vous recommandons de déplacer toutes les transformations plus compliquées vers SSIS. Bien que notre transformation ne puisse pas franchement être qualifiée de compliquée, elle constitue un bon exemple. Prenez une transformation de colonne dérivée (Derived Column) et liez-la à la transformation de multidiffusion.

Remplacez le contenu de la colonne MaxQty par une expression écrite dans le langage d’expressions SSIS, comme le montre la figure 3. (Microsoft a eu assurément de bonnes raisons de créer un tout nouveau langage pour les expressions SSIS.) Comme toujours, renommez la transformation, dans notre cas pour remplacer les valeurs NULL. Ensuite, faites glisser une deuxième transformation de colonne dérivée et liez-la à la transformation Replace NULLs. Créez deux nouvelles colonnes, InsertAuditKey et Update- AuditKey, puis attribuez-leur la valeur -1.

L’ajout de clés d’audit à toutes les tables dans votre entrepôt de données constitue une bonne idée et nous aborderons cet aspect plus en détail dans un prochain article. Il suffit, pour le moment, de définir la valeur -1 pour les clés. Vous vous interrogez peut-être sur la raison d’être des deux transformations de colonne dérivée sur une ligne. Vous pouvez effectuer plusieurs transformations dans une transformation de colonne dérivée, alors quel est l’intérêt de les séparer ? Tout simplement pour la lisibilité et la répétabilité.

La première transformation porte sur les données réelles et la deuxième concerne les métadonnées d’audit. Vous pouvez inclure la transformation des métadonnées d’audit en tant que composant standard de votre package car il est toujours configuré de la même manière. Evidemment, c’est légèrement moins performant à l’exécution du package, mais la différence est minime.

Téléchargez gratuitement cette ressource

Guide de facturation électronique, voie royale pour le DAF et la digitalisation de la fonction finance

Guide de facturation électronique, voie royale pour le DAF et la digitalisation de la fonction finance

Ce livre blanc expose les problématiques auxquelles sont confrontés les DAF modernes et souligne les bénéfices de la facturation électronique pour la trésorerie. Il dévoile également le processus de déploiement de ce projet de transformation digitale que la réglementation rendra bientôt obligatoire.

Tech - Par iTPro - Publié le 24 juin 2010