Je dois admettre un fait. Je faisais partie des personnes du monde des bases de données relationnelles qui ne s’intéressaient pas réellement à Analysis Services. Je pensais qu’un cube OLAP était le poste où travaillait un certain Oliver Lap du département de la comptabilité entre 8 h 00 et 17 h 00. Pour moi, les dimensions étaient réservées aux physiciens et aux adeptes de la série La quatrième dimension.Mon point de vue s’est modifié il y a quelques années, lorsque j’ai appris en quoi Analysis Services pouvait être avantageux, pour moi comme pour mes clients. Si vous vous focalisez depuis toujours sur les bases de données relationnelles, vous allez peut-être changer d’avis en essayant la CTP (Community Technical Preview) analyse décisionnelle (en anglais BI (Business Intelligence)) fantastiques proposées par SSIS (SQL Server Integration Services) pour vos applications relationnelles. Deux nouvelles tâches de transformation vous simplifieront la vie lorsque vous travaillez sur des données incohérentes et une tâche de data mining vous permettra de créer un modèle de données s’adaptant aux évolutions de l’activité.
Ces fonctionnalités ne requièrent pas une grosse infrastructure d’entrepôt de données ou de cube OLAP. Il vous suffit d’avoir SQL Server 2005 et d’être prêt à tester quelque chose de nouveau.
Développez votre connaissance de l’analyse décisionnelle

Commençons par examiner deux tâches de transformation SSIS. Si vous êtes resté en dehors du circuit, SSIS est le successeur de DTS (Data Transformation Services) et, non seulement cet outil accomplit la même fonction que son prédécesseur, à savoir déplacer des données, mais il offre encore plus de possibilités, est plus simple à utiliser, réduit le travail de codage et est extrêmement rapide.
Les tâches de transformation examinées ici sont les « recherches floues » (Fuzzy Lookup) et les « groupements flous » (Fuzzy Grouping). Comme leur nom leur suggère, ces tâches permettent de réaliser des opérations de recherche et de regroupement sans nécessiter une correspondance exacte des données, ce qui peut s’avérer utile si vous importez des données de systèmes propriétaires ou de champs de saisie de données non normalisés.
Recherche floue. La tâche Fuzzy Lookup prend des colonnes et recherche les valeurs dans une table de référence de flux de données SSIS. Elle ne recherche pas une correspondance exacte, mais travaille comme votre professeur préféré. Elle effectue des classements selon une courbe et donne des unités de valeur partielles. Elle recherche une correspondance entre les valeurs de colonne et les éléments dans la table.
Prenons un cas de figure dans lequel vous devez charger un fichier texte, illustré à la figure 1, à partir d’une table d’adresses d’un système propriétaire. Les éléments city (ville) et state (état) de l’adresse dans le système cible sont normalisés, de sorte que les combinaisons city et state sont stockées dans une table de recherche séparée. Malheureusement, les villes figurant dans le système propriétaire n’ont pas été validées. Par conséquent, l’établissement d’une correspondance entre une paire city/state et un enregistrement dans la table de recherche risque d’être ardu.
Entrez dans SSIS et accédez à la tâche Fuzzy Lookup. Vous créez le lot de la figure 2 en utilisant la programmation par glisser-déplacer. Il suffit de faire glisser des éléments de la boîte à outils, de les placer dans le flux de données et de définir leurs propriétés. Aucun codage n’est nécessaire. Ce lot récupère les données du fichier texte, effectue une recherche floue afin de trouver la clé étrangère pour la combinaison city/state, puis enregistre les informations dans la table Address de SQL Server.
Téléchargez cette ressource

Guide de Cyber-résilience pour Microsoft 365
La violation de votre tenant M365 va au-delà d’un simple incident de cybersécurité. Elle peut entraîner une interruption opérationnelle généralisée, des perturbations commerciales et une exposition de vos données sensibles. Découvrez les méthodes et technologies pour évaluer, comparer et renforcer votre posture de sécurité Microsoft 365.
Les articles les plus consultés
- L’utilisation des données pour survivre !
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble
- Les projets d’intégration augmentent la charge de travail des services IT
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- Databricks lève 1 milliard de dollars !
Les plus consultés sur iTPro.fr
- Les banques passent à l’action avec l’IA générative et le cloud
- DSI en assurance : gardien du temple ou moteur de la transformation ?
- Ransomware : persistance des cyberattaques à l’échelle mondiale
- Cybersécurité : l’IA générative rebat les cartes du cybercrime
- Le World Cyber Ranking, 1er classement mondial de la cybersécurité des entreprises
Sur le même sujet

ActiveViam fait travailler les data scientists et les décideurs métiers ensemble

10 grandes tendances Business Intelligence

Les projets d’intégration augmentent la charge de travail des services IT

Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises

La blockchain en pratique
