Je dois admettre un fait. Je faisais partie des personnes du monde des bases de données relationnelles qui ne s’intéressaient pas réellement à Analysis Services. Je pensais qu’un cube OLAP était le poste où travaillait un certain Oliver Lap du département de la comptabilité entre 8 h 00 et 17 h 00. Pour moi, les dimensions étaient réservées aux physiciens et aux adeptes de la série La quatrième dimension.Mon point de vue s’est modifié il y a quelques années, lorsque j’ai appris en quoi Analysis Services pouvait être avantageux, pour moi comme pour mes clients. Si vous vous focalisez depuis toujours sur les bases de données relationnelles, vous allez peut-être changer d’avis en essayant la CTP (Community Technical Preview) analyse décisionnelle (en anglais BI (Business Intelligence)) fantastiques proposées par SSIS (SQL Server Integration Services) pour vos applications relationnelles. Deux nouvelles tâches de transformation vous simplifieront la vie lorsque vous travaillez sur des données incohérentes et une tâche de data mining vous permettra de créer un modèle de données s’adaptant aux évolutions de l’activité.
Ces fonctionnalités ne requièrent pas une grosse infrastructure d’entrepôt de données ou de cube OLAP. Il vous suffit d’avoir SQL Server 2005 et d’être prêt à tester quelque chose de nouveau.
Développez votre connaissance de l’analyse décisionnelle
Commençons par examiner deux tâches de transformation SSIS. Si vous êtes resté en dehors du circuit, SSIS est le successeur de DTS (Data Transformation Services) et, non seulement cet outil accomplit la même fonction que son prédécesseur, à savoir déplacer des données, mais il offre encore plus de possibilités, est plus simple à utiliser, réduit le travail de codage et est extrêmement rapide.
Les tâches de transformation examinées ici sont les « recherches floues » (Fuzzy Lookup) et les « groupements flous » (Fuzzy Grouping). Comme leur nom leur suggère, ces tâches permettent de réaliser des opérations de recherche et de regroupement sans nécessiter une correspondance exacte des données, ce qui peut s’avérer utile si vous importez des données de systèmes propriétaires ou de champs de saisie de données non normalisés.
Recherche floue. La tâche Fuzzy Lookup prend des colonnes et recherche les valeurs dans une table de référence de flux de données SSIS. Elle ne recherche pas une correspondance exacte, mais travaille comme votre professeur préféré. Elle effectue des classements selon une courbe et donne des unités de valeur partielles. Elle recherche une correspondance entre les valeurs de colonne et les éléments dans la table.
Prenons un cas de figure dans lequel vous devez charger un fichier texte, illustré à la figure 1, à partir d’une table d’adresses d’un système propriétaire. Les éléments city (ville) et state (état) de l’adresse dans le système cible sont normalisés, de sorte que les combinaisons city et state sont stockées dans une table de recherche séparée. Malheureusement, les villes figurant dans le système propriétaire n’ont pas été validées. Par conséquent, l’établissement d’une correspondance entre une paire city/state et un enregistrement dans la table de recherche risque d’être ardu.
Entrez dans SSIS et accédez à la tâche Fuzzy Lookup. Vous créez le lot de la figure 2 en utilisant la programmation par glisser-déplacer. Il suffit de faire glisser des éléments de la boîte à outils, de les placer dans le flux de données et de définir leurs propriétés. Aucun codage n’est nécessaire. Ce lot récupère les données du fichier texte, effectue une recherche floue afin de trouver la clé étrangère pour la combinaison city/state, puis enregistre les informations dans la table Address de SQL Server.
Téléchargez cette ressource
Créer des agents dans Microsoft 365 Copilot
Insight vous guide dans l’utilisation de la nouvelle expérience de création d’agents dans Microsoft Copilot Studio, disponible dans Copilot Chat. Découvrez les étapes clés pour concevoir, configurer et déployer ces nouveaux agents et injecter la puissance de l’IA directement dans le flux de travail.
Les articles les plus consultés
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble
- Les projets d’intégration augmentent la charge de travail des services IT
- 9 défis de transformation digitale !
- Databricks lève 1 milliard de dollars !
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
Les plus consultés sur iTPro.fr
- Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
- À l’aube de 2026, le SaaS entre dans une nouvelle phase
- Face à l’urgence écologique, l’IT doit faire sa révolution
- IoT et cybersécurité : les bases que chaque décideur doit maîtriser
Articles les + lus
Les 6 tournants qui redéfinissent l’IA en entreprise
Infrastructures IT : 5 leviers concrets pour éviter les impasses technologiques
Une menace à 1 milliard d’euros : le gouffre de la fraude e-commerce en France
Maîtriser l’observabilité des données IA
Data & IA en 2025 : ce que les CDO révèlent aux équipes IT et data
À la une de la chaîne Data
- Les 6 tournants qui redéfinissent l’IA en entreprise
- Infrastructures IT : 5 leviers concrets pour éviter les impasses technologiques
- Une menace à 1 milliard d’euros : le gouffre de la fraude e-commerce en France
- Maîtriser l’observabilité des données IA
- Data & IA en 2025 : ce que les CDO révèlent aux équipes IT et data
