> Tech > Traitement

Traitement

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Ensuite, je suis passé au traitement du modèle d’exploration de données au niveau de l’onglet Modèles d’exploration de données (Mining Model) dans BIDS en cliquant sur le bouton Traiter (Process) dans l’angle supérieur gauche. Lorsque la fenêtre Process s’ouvre, il suffit de cliquer sur Run et, une fois le traitement

Traitement

terminé, je ferme la fenêtre et visualise les résultats. Dans la visionneuse de modèle d’exploration de données (Mining Model Viewer), j’ai vu l’arbre de décision (Decision Tree) dérivé.

Il s’agissait d’un résultat simple car les valeurs Discret et Text ont empêché l’algorithme d’effectuer de nombreux calculs sur les numéros. Mon objectif simple pour le modèle était de fournir six numéros. Sur la figure 4, vous pouvez voir la vue arborescente pour la valeur prédictible N1, ainsi que les cas le plus élevé et le plus bas concernant chaque numéro 1 à 53. Les valeurs de probabilité apparaissent également, ainsi qu’un histogramme.

A ce stade, j’ai décidé de créer une requête DMX pour sélectionner mes six numéros avant de passer à l’intégration du modèle Clusters Microsoft à la même structure, puis de comparer les différences. Sous l’onglet Prévision de modèle d’exploration de données (Mining Model Prediction), j’ai trouvé un minuscule bouton qui m’a conduit à la requête singleton. Ce type de requête est appréciable lorsque vous souhaitez passer manuellement en entrée les valeurs prédictibles sans les extraire d’une table d’entrée qui stocke les valeurs. L’objectif était de voir les numéros retournés par le modèle pour le tirage du 31 mai 2006. Il s’avérait également que cette date était un mercredi.

La figure 5 montre la requête singleton graphique. Comme N1 à N6 étaient les seules valeurs que j’ai utilisées comme Predict, elles étaient les seules sélectionnables. Toutefois, j’ai ajouté une fonction Prediction concernant la probabilité pour N1. Le listing 2 présente la requête DMX résultante. Conformément à l’algorithme MDT, 15, 11, 26, 35, 41 et 48 devaient être les numéros gagnants pour le 31 mai 2006. Sous le second onglet du projet, j’ai cliqué sur Add Related Model, j’ai spécifié Microsoft Clustering (Clusters Microsoft) et nommé le nouveau modèle Lottery_Cluster. Les nouveaux modèles ajoutés à la structure d’exploration de données de base héritent des types de contenu et de données de la structure.

Par conséquent, après l’ajout du modèle Microsoft Clustering, il ne me restait plus qu’à effectuer un nouveau traitement. J’ai alors pu analyser les résultats du nouveau modèle sous l’onglet Visionneuse de modèle d’exploration de données, comme l’illustre la figure 6 et j’ai pu employer le même type de requête DMX pour prédire les six numéros basés sur les variables d’entrée date. Les résultats du modèle Lottery_Cluster ont été 2, 13, 22, 30, 34 et 53, avec une probabilité de 5,71 pour N1. Ce n’est peut-être pas mirobolant, mais le nombre indique que le modèle a trouvé un schéma légèrement plus performant qu’un choix des numéros au hasard.

Téléchargez cette ressource

Préparer l’entreprise aux technologies interconnectées

Préparer l’entreprise aux technologies interconnectées

Avec la « quatrième révolution industrielle », les environnements hyperconnectés entraînent de nouveaux risques en matière de sécurité. Découvrez, dans ce guide Kaspersky, comment faire face à cette nouvelle ère de vulnérabilité.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010