Les tâches de flux de données peuvent être complexes et nous allons donc commencer par une tâche simple. Sur la figure 2, vous pouvez constater que la source de la dimension Promotion est une table unique et que les transformations nécessaires sont minimes. Au niveau de l’onglet Flux de données,
Extraction et archivage des données
faites glisser Source OLE DB (OLE DB Source) de la boîte à outils vers l’espace de conception.
La configuration de la source OLE DB est un jeu d’enfant : faites-la pointer vers la connexion de package pour AdventureWorks et entrez une requête source. L’approche par défaut consiste à établir une table ou une vue comme source, mais nous vous conseillons d’écrire systématiquement une requête source explicite, comme l’illustre le listing 1. La raison d’être d’une requête explicite est qu’elle vous permet de renommer les colonnes et d’effectuer des transformations triviales comme les conversions de type.
Vous avez, dans le pipeline de flux de données, de nombreuses opportunités d’effectuer des changements de noms et des conversions de type, mais nous vous conseillons de l’effectuer le plus tôt possible. Ces opérations ajoutent une charge négligeable sur la base de données source. Il est vital que vos requêtes source minimisent la charge sur le système source. Soyez particulièrement vigilant avec les jointures de tables et travaillez en étroite collaboration avec les DBA du système source afin qu’ils approuvent vos requêtes d’extraction. Veillez à renommer les objets dans votre package.
Dans notre exemple, renommez Source OLD DB en Source from Sales SpecialOffer. Ainsi, vous aurez l’assurance de comprendre le rôle de votre package lorsque vous l’examinerez dans quelques mois. L’étape suivante consiste à enregistrer une copie des données extraites avant d’effectuer toute transformation supplémentaire. L’archivage des données extraites constitue une bonne pratique, mais pas une exigence technique. Votre département d’audit interne sera heureux de voir que votre système ETL archive automatiquement les données extraites pour une durée établie (généralement un mois ou deux).
Ces archives peuvent, en effet, s’avérer précieuses lorsque vous devez, par exemple, modifier le système ETL et réexécuter des chargements couvrant une période d’un mois. Pour archiver les données extraites, ajoutez la transformation de multidiffusion (Multicast) sur la surface de conception et liez-la à la source. La transformation de multidiffusion effectue plusieurs copies identiques du flux de données. Ajoutez une destination de fichier brut (Raw File Destination) à la surface de conception et liez-la à la transformation de multidiffusion.
Il s’agit d’un format de fichier unique à SSIS. Il est facile à configurer et écrit des données très rapidement. Toutefois, la seule manière de lire un fichier brut est de le faire à partir d’un package SSIS. Par conséquent, si vous souhaitez qu’une autre personne puisse voir le fichier de sortie, utilisez plutôt Destination de fichier plat (Flat File Destination). Pour configurer une destination de fichier brut, spécifiez simplement le chemin et le nom du fichier de destination, puis ouvrez l’onglet Input Columns et spécifiez les colonnes à stocker.
Téléchargez cette ressource
Plan de sécurité Microsoft 365
Les attaquants savent comment prendre le contrôle de votre tenant Microsoft 365, et vous, savez-vous comment le reprendre en main ?
Les articles les plus consultés
- Et si les clients n’avaient plus le choix ?
- Partager vos images, vidéos, musique et imprimante avec le Groupe résidentiel
- Chiffrements symétrique vs asymétrique
- N° 2 : Il faut supporter des langues multiples dans SharePoint Portal Server
- Cybersécurité Active Directory et les attaques de nouvelle génération
Les plus consultés sur iTPro.fr
- Cyberattaques assistées par IA : Pourquoi le modèle Mythos d’Anthropic représente une menace sérieuse pour la cybersécurité
- Avec les Smart Data, les entreprises mènent la danse de l’observabilité moderne
- Les dirigeants européens redéfinissent la C-suite à l’ère de l’IA
- Analyse Patch Tuesday Mai 2026
Articles les + lus
Rhea1 : SiPearl allume le CPU européen le plus ambitieux pour le HPC et l’IA souveraine
Analyse Patch Tuesday Mai 2026
Les coûts cachés des merge requests générées par l’IA
Femmes et métiers de la tech : une attractivité réelle freinée par des stéréotypes persistants
Moderniser le développement logiciel : de la fragmentation à l’intégration
À la une de la chaîne Tech
- Rhea1 : SiPearl allume le CPU européen le plus ambitieux pour le HPC et l’IA souveraine
- Analyse Patch Tuesday Mai 2026
- Les coûts cachés des merge requests générées par l’IA
- Femmes et métiers de la tech : une attractivité réelle freinée par des stéréotypes persistants
- Moderniser le développement logiciel : de la fragmentation à l’intégration
