Ceci nous amène à la problématique d’intégration des données. Les données proviennent généralement de nombreuses sources de l’entreprise voire de l’extérieur de l’entreprise. Elles sont très souvent hétérogènes, possèdent leurs propres règles, leurs propres formats et chacune a ses défauts. Il arrive qu’une source de données
La problématique
ne soit pas fiable.
Un processus mal maîtrisé, comme un fichier manquant une fois sur deux ; un outil vieillissant qui travaille avec des formats non standard ; une fusion d’entreprises qui n’ont pas les mêmes références ; il y a de nombreux cas pour lesquels on ne peut pas faire confiance intégralement aux données qui vont être injectées dans notre DataWarehouse.
Il faut donc gérer des problèmes de qualité des données. Un des problèmes de qualité des données les plus courants est la gestion des données manquantes et ce sera ce point précis que nous allons détailler. Pour illustrer ce problème, nous allons prendre un exemple simple. Notre solution analyse des ventes ; nous prendrons la base de données d’exemple de Microsoft Adventure Works.
Nous allons étudier le cas où une vente n’est pas associée à un produit du catalogue. Dans notre scénario, notre processus d’intégration consolide les ventes des différents magasins et s’appuie sur un catalogue central de produits. Il peut arriver qu’une vente ne corresponde à aucun article de notre système central d’analyse des ventes. Voir figure 1.
Nous allons voir les différents moyens de gérer cela. Les solutions seront abordées d’un point de vue technique avec l’offre décisionnelle de Microsoft, basée sur SQL Server. Mais nous aurons aussi une approche plus méthodologique, pour traiter le problème de fond.
Téléchargez cette ressource
Construire une infrastructure cloud optimisée pour l’IA avec Microsoft Azure
Les managers IT ont besoin d’une stratégie claire et de solutions concrètes pour préparer leur infrastructure cloud à l'adoption de l'IA, tout en optimisant les coûts, renforçant la sécurité et développant les compétences internes. Découvrez tous les conseils dans ce guide Insight.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
- À l’aube de 2026, le SaaS entre dans une nouvelle phase
- Face à l’urgence écologique, l’IT doit faire sa révolution
- IoT et cybersécurité : les bases que chaque décideur doit maîtriser
Articles les + lus
CES 2026 : l’IA physique et la robotique redéfinissent le futur
Les 3 prédictions 2026 pour Java
Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
Face à l’urgence écologique, l’IT doit faire sa révolution
D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
À la une de la chaîne Tech
- CES 2026 : l’IA physique et la robotique redéfinissent le futur
- Les 3 prédictions 2026 pour Java
- Semi-conducteurs : comment l’Irlande veut contribuer à atténuer la pénurie mondiale de puces
- Face à l’urgence écologique, l’IT doit faire sa révolution
- D’ici 2030, jusqu’à 90 % du code pourrait être écrit par l’IA, pour les jeunes développeurs, l’aventure ne fait que commencer
