> Tech > Transformation des données

Transformation des données

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Alors que l’archivage des données extraites constitue une tâche périphérique importante, votre objectif principal est de transformer les données et de les écrire dans la table cible. Sur la figure 2, vous pouvez voir que la transformation inclut la résolution d’une valeur NULL dans la colonne MaxQty, laquelle identifie la

Transformation des données

quantité maximale pour laquelle une promotion marketing est valable.

S’il n’y a pas de quantité maximale (autrement dit, si la promotion s’applique quel que soit le nombre d’articles achetés), le système source place une valeur NULL dans la colonne MaxQty. Vous allez remplacer cette valeur par l’entier le plus grand possible pouvant être contenu dans la colonne, à savoir 2147483647.

Bien que vous puissiez employer SQL Server pour effectuer cette transformation dans la requête d’extraction, nous vous recommandons de déplacer toutes les transformations plus compliquées vers SSIS. Bien que notre transformation ne puisse pas franchement être qualifiée de compliquée, elle constitue un bon exemple. Prenez une transformation de colonne dérivée (Derived Column) et liez-la à la transformation de multidiffusion.

Remplacez le contenu de la colonne MaxQty par une expression écrite dans le langage d’expressions SSIS, comme le montre la figure 3. (Microsoft a eu assurément de bonnes raisons de créer un tout nouveau langage pour les expressions SSIS.) Comme toujours, renommez la transformation, dans notre cas pour remplacer les valeurs NULL. Ensuite, faites glisser une deuxième transformation de colonne dérivée et liez-la à la transformation Replace NULLs. Créez deux nouvelles colonnes, InsertAuditKey et Update- AuditKey, puis attribuez-leur la valeur -1.

L’ajout de clés d’audit à toutes les tables dans votre entrepôt de données constitue une bonne idée et nous aborderons cet aspect plus en détail dans un prochain article. Il suffit, pour le moment, de définir la valeur -1 pour les clés. Vous vous interrogez peut-être sur la raison d’être des deux transformations de colonne dérivée sur une ligne. Vous pouvez effectuer plusieurs transformations dans une transformation de colonne dérivée, alors quel est l’intérêt de les séparer ? Tout simplement pour la lisibilité et la répétabilité.

La première transformation porte sur les données réelles et la deuxième concerne les métadonnées d’audit. Vous pouvez inclure la transformation des métadonnées d’audit en tant que composant standard de votre package car il est toujours configuré de la même manière. Evidemment, c’est légèrement moins performant à l’exécution du package, mais la différence est minime.

Téléchargez cette ressource

Les mégatendances cybersécurité et cyber protection 2024

Les mégatendances cybersécurité et cyber protection 2024

L'évolution du paysage des menaces et les conséquences sur votre infrastructure, vos outils de contrôles de sécurité IT existants. EPP, XDR, EDR, IA, découvrez la synthèse des conseils et recommandations à appliquer dans votre organisation.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010