Vous savez désormais ce que vous cherchez, vous devez maintenant le trouver. Vous devez déterminer où se trouve l'information critique et comment la déplacer dans la structure du data warehouse. Par exemple, les données de notre société virtuelle proviennent pour la plupart de trois sources : une application spécifique pour
Localisez les sources de données et planifiez les transformations
gérer les ventes de formations, un package de CRM qui suit les activités des forces
de vente et un système de pointeuse gère le temps de présence des employés.
Les données doivent être déplacées dans une structure de données cohérente et
consolidée. La grande difficulté sera la corrélation des informations entre l’application
maison, le système de CRM et la pointeuse. Ces systèmes ne partagent pas d’informations
telles que le numéro d’employé, de client ou un numéro de projet. A cette étape
de la conception, vous devez prévoir de regrouper les données dans une base de
données distincte afin que l’information soit corrélée pour être copiée dans les
tables du data warehouse.
Il vous faudra également apurer les données. Dans les systèmes OLTP, les personnels
de saisie des informations laissent fréquemment des champs à blanc. L’information
manquante dans ces champs est souvent cruciale pour permettre une analyse précise
des données. Assurez-vous que la source de données est complète avant de l’utiliser.
On peut parfois compléter l’information à la source de façon automatisée. On peut
déduire le code postal de la ville et du département, ou obtenir des éléments
de prix d’autres sources de données.
Parfois, il vous faudra néanmoins extraire les fichiers et les compléter manuellement.
Le coût de modification des données peut rendre leur utilisation prohibitive,
il vous faudra donc déterminer le moyen le plus efficace pour corriger les données
et prendre en compte ces coûts dans le coût global du système. Faites les corrections
sur les données à la source afin que les rapports générés par le data warehouse
soient cohérentes avec d’éventuels rapports générés par l’application source.
Vous devrez transformer les données lorsque vous les déplacerez d’une structure
de données à une autre. Certaines transformations reviennent à réaliser un simple
mapping des colonnes de bases de données avec des noms différents. Certaines modifications
peuvent impliquer la conversion du type de stockage des données.
Certaines transformations sont des conversions d’unités de mesure (des livres
en kilogrammes, des centimètres en pouces….) et certaines sont des résumés des
données (par exemple, le nombre d’étudiants formés par classe pour un client et
non pas la liste complète des étudiants). Certaines transformations exigent des
programmes complexes qui utilisent des algorithmes sophistiqués pour déterminer
une valeur. Vous devez donc choisir le bon outil pour réaliser ces transformations.
Votre décision doit être basée principalement sur le coût, y compris le coût de
la formation ou de l’embauche de personnels pour utiliser l’outil et le
Téléchargez cette ressource
Guide de Cyber-résilience pour Microsoft 365
La violation de votre tenant M365 va au-delà d’un simple incident de cybersécurité. Elle peut entraîner une interruption opérationnelle généralisée, des perturbations commerciales et une exposition de vos données sensibles. Découvrez les méthodes et technologies pour évaluer, comparer et renforcer votre posture de sécurité Microsoft 365.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- L’IA, nouveau moteur des entreprises françaises d’ici 2030
- Gouvernance, cybersécurité et agents IA : trois défis clés à relever pour réussir la transition en 2026
- Top 5 des évolutions technologiques impactant la sécurité 2026
- Tendances 2026 : l’IA devra prouver sa rentabilité
Articles les + lus
CES 2026 : l’IA physique et la robotique redéfinissent le futur
Les 3 prédictions 2026 pour Java
Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
Face à l’urgence écologique, l’IT doit faire sa révolution
D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
À la une de la chaîne Tech
- CES 2026 : l’IA physique et la robotique redéfinissent le futur
- Les 3 prédictions 2026 pour Java
- Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
- Face à l’urgence écologique, l’IT doit faire sa révolution
- D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
