Je dois admettre un fait. Je faisais partie des personnes du monde des bases de données relationnelles qui ne s’intéressaient pas réellement à Analysis Services. Je pensais qu’un cube OLAP était le poste où travaillait un certain Oliver Lap du département de la comptabilité entre 8 h 00 et 17 h 00. Pour moi, les dimensions étaient réservées aux physiciens et aux adeptes de la série La quatrième dimension.Mon point de vue s’est modifié il y a quelques années, lorsque j’ai appris en quoi Analysis Services pouvait être avantageux, pour moi comme pour mes clients. Si vous vous focalisez depuis toujours sur les bases de données relationnelles, vous allez peut-être changer d’avis en essayant la CTP (Community Technical Preview) analyse décisionnelle (en anglais BI (Business Intelligence)) fantastiques proposées par SSIS (SQL Server Integration Services) pour vos applications relationnelles. Deux nouvelles tâches de transformation vous simplifieront la vie lorsque vous travaillez sur des données incohérentes et une tâche de data mining vous permettra de créer un modèle de données s’adaptant aux évolutions de l’activité.
Ces fonctionnalités ne requièrent pas une grosse infrastructure d’entrepôt de données ou de cube OLAP. Il vous suffit d’avoir SQL Server 2005 et d’être prêt à tester quelque chose de nouveau.
Développez votre connaissance de l’analyse décisionnelle
Commençons par examiner deux tâches de transformation SSIS. Si vous êtes resté en dehors du circuit, SSIS est le successeur de DTS (Data Transformation Services) et, non seulement cet outil accomplit la même fonction que son prédécesseur, à savoir déplacer des données, mais il offre encore plus de possibilités, est plus simple à utiliser, réduit le travail de codage et est extrêmement rapide.
Les tâches de transformation examinées ici sont les « recherches floues » (Fuzzy Lookup) et les « groupements flous » (Fuzzy Grouping). Comme leur nom leur suggère, ces tâches permettent de réaliser des opérations de recherche et de regroupement sans nécessiter une correspondance exacte des données, ce qui peut s’avérer utile si vous importez des données de systèmes propriétaires ou de champs de saisie de données non normalisés.
Recherche floue. La tâche Fuzzy Lookup prend des colonnes et recherche les valeurs dans une table de référence de flux de données SSIS. Elle ne recherche pas une correspondance exacte, mais travaille comme votre professeur préféré. Elle effectue des classements selon une courbe et donne des unités de valeur partielles. Elle recherche une correspondance entre les valeurs de colonne et les éléments dans la table.
Prenons un cas de figure dans lequel vous devez charger un fichier texte, illustré à la figure 1, à partir d’une table d’adresses d’un système propriétaire. Les éléments city (ville) et state (état) de l’adresse dans le système cible sont normalisés, de sorte que les combinaisons city et state sont stockées dans une table de recherche séparée. Malheureusement, les villes figurant dans le système propriétaire n’ont pas été validées. Par conséquent, l’établissement d’une correspondance entre une paire city/state et un enregistrement dans la table de recherche risque d’être ardu.
Entrez dans SSIS et accédez à la tâche Fuzzy Lookup. Vous créez le lot de la figure 2 en utilisant la programmation par glisser-déplacer. Il suffit de faire glisser des éléments de la boîte à outils, de les placer dans le flux de données et de définir leurs propriétés. Aucun codage n’est nécessaire. Ce lot récupère les données du fichier texte, effectue une recherche floue afin de trouver la clé étrangère pour la combinaison city/state, puis enregistre les informations dans la table Address de SQL Server.
Téléchargez cette ressource
Mac en entreprise : le levier d’un poste de travail moderne
Ce livre blanc répond aux 9 questions clés des entreprises sur l’intégration du Mac : sécurité, compatibilité, gestion, productivité, coûts, attractivité talents, RSE et IA, et l’accompagnement sur mesure proposé par inmac wstore.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Les agents d’IA fragilisent la sécurité : pour les sécuriser, inutile de repartir de zéro
- Yampa : innovation en IA, souveraineté et sécurité au service des DSI
- Les marchés publics peuvent-ils encore faire émerger des champions numériques français ?
- ESET accélère en France et mise sur l’IA face à la montée des cybermenaces
Articles les + lus
La bataille de la 6G se gagne dans la donnée en temps réel
Souveraineté des données : cessons de traiter le symptôme, attaquons-nous aux causes
IA générative en Europe : une adoption massive, mais une gouvernance toujours en retard
Golden records : le socle oublié des projets IA
Avec les Smart Data, les entreprises mènent la danse de l’observabilité moderne
À la une de la chaîne Data
- La bataille de la 6G se gagne dans la donnée en temps réel
- Souveraineté des données : cessons de traiter le symptôme, attaquons-nous aux causes
- IA générative en Europe : une adoption massive, mais une gouvernance toujours en retard
- Golden records : le socle oublié des projets IA
- Avec les Smart Data, les entreprises mènent la danse de l’observabilité moderne
