> Tech > Une mine d’or (3)

Une mine d’or (3)

Tech - Par iTPro - Publié le 24 juin 2010
email

Vous pouvez exploiter le modèle de data mining formé en tant que partie du lot SSIS qui importe la liste d’ouvrages du distributeur. Comme le montre la figure 8, la partie flux de contrôle du processus récupère le fichier texte sur le site FTP du distributeur, recycle le modèle de

data mining au moyen des données de ventes actuelles, puis exécute au final le flux de données chargé de l’importation proprement dite.

Le processus de flux de données de la figure 9 effectue une lecture parmi la liste des ouvrages disponibles du fichier texte, puis se sert de la tâche de transformation Data Mining Prediction Query pour prédire le statut de vente de chaque nouveau livre. La tâche ajoute les ouvrages qui correspondent aux critères des meilleures ventes (à savoir, ayant un statut de vente de 1) à la table Books et les ajoute au catalogue de la boutique en ligne.

La figure 10 présente la requête DMX employée par la tâche de transformation Data Mining Prediction Query. Elle ressemble largement à une requête SELECT qui utilise une jointure sur deux tables. La différence réside dans l’utilisation d’un mot-clé PREDICTION JOIN au lieu de INNER ou LEFT OUTER JOIN, visibles généralement dans les instructions TSQL. Dans ce cas, PREDICTION JOIN accepte les critères du flux de données de lot SSIS @InputRowset et les injecte dans les arbres de décision d’ouvrage du modèle de data mining. La condition JOIN précise comment sera établie la correspondance entre les champs de la table de données et les entrées du modèle de data mining. Le mot-clé FLATTENED indique à la requête DMX de produire un ensemble de données sous forme de lignes et colonnes au lieu de l’ensemble de données hiérarchique par défaut. La fonction Predict() dans la liste de champs renvoie la valeur prédite pour le statut de vente.

La figure 11 présente le résultat de la requête de prédiction : les meilleures ventes de la semaine ajoutées à la boutique en ligne. Sans surprise, les ajouts de cette semaine sont tous des livres du genre Mystery, publiés par Random House. En revanche, la semaine suivante, les meilleures ventes vont peut-être correspondre à un autre ensemble de critères et aboutiront à une sélection radicalement différente. C’est là où réside toute la beauté des algorithmes de data mining et de l’automatisation des processus dans SSIS : vous vous adaptez à l’évolution de la situation en recyclant continuellement votre modèle.

Téléchargez gratuitement cette ressource

HP Elite Slice G2 : optimisez la collaboration… et votre budget !

HP Elite Slice G2 : optimisez la collaboration… et votre budget !

Téléchargez cette étude Forrester et découvrez comment booster la collaboration tout en dégageant un excellent R.O.I grâce au système de vidéoconférence HP Elite Slice G2 avec Microsoft Teams !

Tech - Par iTPro - Publié le 24 juin 2010