> Tech > Localisez les sources de données et planifiez les transformations

Localisez les sources de données et planifiez les transformations

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Vous savez désormais ce que vous cherchez, vous devez maintenant le trouver. Vous devez déterminer où se trouve l'information critique et comment la déplacer dans la structure du data warehouse. Par exemple, les données de notre société virtuelle proviennent pour la plupart de trois sources : une application spécifique pour

Localisez les sources de données et planifiez les transformations

gérer les ventes de formations, un package de CRM qui suit les activités des forces
de vente et un système de pointeuse gère le temps de présence des employés.

Les données doivent être déplacées dans une structure de données cohérente et
consolidée. La grande difficulté sera la corrélation des informations entre l’application
maison, le système de CRM et la pointeuse. Ces systèmes ne partagent pas d’informations
telles que le numéro d’employé, de client ou un numéro de projet. A cette étape
de la conception, vous devez prévoir de regrouper les données dans une base de
données distincte afin que l’information soit corrélée pour être copiée dans les
tables du data warehouse.

Il vous faudra également apurer les données. Dans les systèmes OLTP, les personnels
de saisie des informations laissent fréquemment des champs à  blanc. L’information
manquante dans ces champs est souvent cruciale pour permettre une analyse précise
des données. Assurez-vous que la source de données est complète avant de l’utiliser.
On peut parfois compléter l’information à  la source de façon automatisée. On peut
déduire le code postal de la ville et du département, ou obtenir des éléments
de prix d’autres sources de données.
Parfois, il vous faudra néanmoins extraire les fichiers et les compléter manuellement.
Le coût de modification des données peut rendre leur utilisation prohibitive,
il vous faudra donc déterminer le moyen le plus efficace pour corriger les données
et prendre en compte ces coûts dans le coût global du système. Faites les corrections
sur les données à  la source afin que les rapports générés par le data warehouse
soient cohérentes avec d’éventuels rapports générés par l’application source.

Vous devrez transformer les données lorsque vous les déplacerez d’une structure
de données à  une autre. Certaines transformations reviennent à  réaliser un simple
mapping des colonnes de bases de données avec des noms différents. Certaines modifications
peuvent impliquer la conversion du type de stockage des données.
Certaines transformations sont des conversions d’unités de mesure (des livres
en kilogrammes, des centimètres en pouces….) et certaines sont des résumés des
données (par exemple, le nombre d’étudiants formés par classe pour un client et
non pas la liste complète des étudiants). Certaines transformations exigent des
programmes complexes qui utilisent des algorithmes sophistiqués pour déterminer
une valeur. Vous devez donc choisir le bon outil pour réaliser ces transformations.
Votre décision doit être basée principalement sur le coût, y compris le coût de
la formation ou de l’embauche de personnels pour utiliser l’outil et le

Téléchargez cette ressource

Comment sécuriser une PME avec l’approche par les risques ?

Comment sécuriser une PME avec l’approche par les risques ?

Disposant de moyens financiers et humains contraints, les PME éprouvent des difficultés à mettre en place une véritable stratégie de cybersécurité. Opérateur de services et d’infrastructures, Naitways leur propose une approche pragmatique de sécurité « by design » en priorisant les risques auxquelles elles sont confrontées.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010