Vous savez désormais ce que vous cherchez, vous devez maintenant le trouver. Vous devez déterminer où se trouve l'information critique et comment la déplacer dans la structure du data warehouse. Par exemple, les données de notre société virtuelle proviennent pour la plupart de trois sources : une application spécifique pour
Localisez les sources de données et planifiez les transformations

gérer les ventes de formations, un package de CRM qui suit les activités des forces
de vente et un système de pointeuse gère le temps de présence des employés.
Les données doivent être déplacées dans une structure de données cohérente et
consolidée. La grande difficulté sera la corrélation des informations entre l’application
maison, le système de CRM et la pointeuse. Ces systèmes ne partagent pas d’informations
telles que le numéro d’employé, de client ou un numéro de projet. A cette étape
de la conception, vous devez prévoir de regrouper les données dans une base de
données distincte afin que l’information soit corrélée pour être copiée dans les
tables du data warehouse.
Il vous faudra également apurer les données. Dans les systèmes OLTP, les personnels
de saisie des informations laissent fréquemment des champs à blanc. L’information
manquante dans ces champs est souvent cruciale pour permettre une analyse précise
des données. Assurez-vous que la source de données est complète avant de l’utiliser.
On peut parfois compléter l’information à la source de façon automatisée. On peut
déduire le code postal de la ville et du département, ou obtenir des éléments
de prix d’autres sources de données.
Parfois, il vous faudra néanmoins extraire les fichiers et les compléter manuellement.
Le coût de modification des données peut rendre leur utilisation prohibitive,
il vous faudra donc déterminer le moyen le plus efficace pour corriger les données
et prendre en compte ces coûts dans le coût global du système. Faites les corrections
sur les données à la source afin que les rapports générés par le data warehouse
soient cohérentes avec d’éventuels rapports générés par l’application source.
Vous devrez transformer les données lorsque vous les déplacerez d’une structure
de données à une autre. Certaines transformations reviennent à réaliser un simple
mapping des colonnes de bases de données avec des noms différents. Certaines modifications
peuvent impliquer la conversion du type de stockage des données.
Certaines transformations sont des conversions d’unités de mesure (des livres
en kilogrammes, des centimètres en pouces….) et certaines sont des résumés des
données (par exemple, le nombre d’étudiants formés par classe pour un client et
non pas la liste complète des étudiants). Certaines transformations exigent des
programmes complexes qui utilisent des algorithmes sophistiqués pour déterminer
une valeur. Vous devez donc choisir le bon outil pour réaliser ces transformations.
Votre décision doit être basée principalement sur le coût, y compris le coût de
la formation ou de l’embauche de personnels pour utiliser l’outil et le
Téléchargez cette ressource

Comment accélérer la transformation des environnements de travail ?
Dans un monde professionnel en pleine mutation, la mobilité, l’efficacité énergétique, la sécurité et l’intelligence embarquée sont devenues des critères décisifs pour les équipements informatiques. Découvrez comment les nouveaux PC Microsoft Surface dotés des processeurs Snapdragon X Series s’imposent comme une réponse stratégique aux nouveaux enjeux IT.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Les banques passent à l’action avec l’IA générative et le cloud
- DSI en assurance : gardien du temple ou moteur de la transformation ?
- Ransomware : persistance des cyberattaques à l’échelle mondiale
- Cybersécurité : l’IA générative rebat les cartes du cybercrime
- Le World Cyber Ranking, 1er classement mondial de la cybersécurité des entreprises
