> Tech > Une mine d’or (3)

Une mine d’or (3)

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Vous pouvez exploiter le modèle de data mining formé en tant que partie du lot SSIS qui importe la liste d’ouvrages du distributeur. Comme le montre la figure 8, la partie flux de contrôle du processus récupère le fichier texte sur le site FTP du distributeur, recycle le modèle de

data mining au moyen des données de ventes actuelles, puis exécute au final le flux de données chargé de l’importation proprement dite.

Le processus de flux de données de la figure 9 effectue une lecture parmi la liste des ouvrages disponibles du fichier texte, puis se sert de la tâche de transformation Data Mining Prediction Query pour prédire le statut de vente de chaque nouveau livre. La tâche ajoute les ouvrages qui correspondent aux critères des meilleures ventes (à savoir, ayant un statut de vente de 1) à la table Books et les ajoute au catalogue de la boutique en ligne.

La figure 10 présente la requête DMX employée par la tâche de transformation Data Mining Prediction Query. Elle ressemble largement à une requête SELECT qui utilise une jointure sur deux tables. La différence réside dans l’utilisation d’un mot-clé PREDICTION JOIN au lieu de INNER ou LEFT OUTER JOIN, visibles généralement dans les instructions TSQL. Dans ce cas, PREDICTION JOIN accepte les critères du flux de données de lot SSIS @InputRowset et les injecte dans les arbres de décision d’ouvrage du modèle de data mining. La condition JOIN précise comment sera établie la correspondance entre les champs de la table de données et les entrées du modèle de data mining. Le mot-clé FLATTENED indique à la requête DMX de produire un ensemble de données sous forme de lignes et colonnes au lieu de l’ensemble de données hiérarchique par défaut. La fonction Predict() dans la liste de champs renvoie la valeur prédite pour le statut de vente.

La figure 11 présente le résultat de la requête de prédiction : les meilleures ventes de la semaine ajoutées à la boutique en ligne. Sans surprise, les ajouts de cette semaine sont tous des livres du genre Mystery, publiés par Random House. En revanche, la semaine suivante, les meilleures ventes vont peut-être correspondre à un autre ensemble de critères et aboutiront à une sélection radicalement différente. C’est là où réside toute la beauté des algorithmes de data mining et de l’automatisation des processus dans SSIS : vous vous adaptez à l’évolution de la situation en recyclant continuellement votre modèle.

Téléchargez cette ressource

Guide de technologie 5G pour l’entreprise

Guide de technologie 5G pour l’entreprise

Pourquoi la 5G est-elle faite pour votre entreprise ? La 5G peut améliorer la vitesse, la fiabilité et la capacité de votre réseau, permettant ainsi une meilleure collaboration, une productivité accrue et une prise de décision plus rapide. Notre livre blanc " The Big Book of Enterprise 5G" vous fournit les informations stratégiques dont vous avez besoin pour prendre des décisions éclairées et préparer votre entreprise à prospérer dans l'ère de la 5G. Cradlepoint, part of Ericsson est le leader mondial des solutions de réseau sans fil 4G LTE et 5G fournies via le cloud. Connectez vos employés, lieux et objets avec la 4G LTE et la 5G pour un WAN sans fil d'entreprise.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010