> Tech > Traitement

Traitement

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Ensuite, je suis passé au traitement du modèle d’exploration de données au niveau de l’onglet Modèles d’exploration de données (Mining Model) dans BIDS en cliquant sur le bouton Traiter (Process) dans l’angle supérieur gauche. Lorsque la fenêtre Process s’ouvre, il suffit de cliquer sur Run et, une fois le traitement

Traitement

terminé, je ferme la fenêtre et visualise les résultats. Dans la visionneuse de modèle d’exploration de données (Mining Model Viewer), j’ai vu l’arbre de décision (Decision Tree) dérivé.

Il s’agissait d’un résultat simple car les valeurs Discret et Text ont empêché l’algorithme d’effectuer de nombreux calculs sur les numéros. Mon objectif simple pour le modèle était de fournir six numéros. Sur la figure 4, vous pouvez voir la vue arborescente pour la valeur prédictible N1, ainsi que les cas le plus élevé et le plus bas concernant chaque numéro 1 à 53. Les valeurs de probabilité apparaissent également, ainsi qu’un histogramme.

A ce stade, j’ai décidé de créer une requête DMX pour sélectionner mes six numéros avant de passer à l’intégration du modèle Clusters Microsoft à la même structure, puis de comparer les différences. Sous l’onglet Prévision de modèle d’exploration de données (Mining Model Prediction), j’ai trouvé un minuscule bouton qui m’a conduit à la requête singleton. Ce type de requête est appréciable lorsque vous souhaitez passer manuellement en entrée les valeurs prédictibles sans les extraire d’une table d’entrée qui stocke les valeurs. L’objectif était de voir les numéros retournés par le modèle pour le tirage du 31 mai 2006. Il s’avérait également que cette date était un mercredi.

La figure 5 montre la requête singleton graphique. Comme N1 à N6 étaient les seules valeurs que j’ai utilisées comme Predict, elles étaient les seules sélectionnables. Toutefois, j’ai ajouté une fonction Prediction concernant la probabilité pour N1. Le listing 2 présente la requête DMX résultante. Conformément à l’algorithme MDT, 15, 11, 26, 35, 41 et 48 devaient être les numéros gagnants pour le 31 mai 2006. Sous le second onglet du projet, j’ai cliqué sur Add Related Model, j’ai spécifié Microsoft Clustering (Clusters Microsoft) et nommé le nouveau modèle Lottery_Cluster. Les nouveaux modèles ajoutés à la structure d’exploration de données de base héritent des types de contenu et de données de la structure.

Par conséquent, après l’ajout du modèle Microsoft Clustering, il ne me restait plus qu’à effectuer un nouveau traitement. J’ai alors pu analyser les résultats du nouveau modèle sous l’onglet Visionneuse de modèle d’exploration de données, comme l’illustre la figure 6 et j’ai pu employer le même type de requête DMX pour prédire les six numéros basés sur les variables d’entrée date. Les résultats du modèle Lottery_Cluster ont été 2, 13, 22, 30, 34 et 53, avec une probabilité de 5,71 pour N1. Ce n’est peut-être pas mirobolant, mais le nombre indique que le modèle a trouvé un schéma légèrement plus performant qu’un choix des numéros au hasard.

Téléchargez cette ressource

Rapport Forrester sur les solutions de sécurité des charges de travail cloud (CWS)

Rapport Forrester sur les solutions de sécurité des charges de travail cloud (CWS)

Dans cette évaluation, basée sur 21 critères, Forrester Consulting étudie, analyse et note les fournisseurs de solutions de sécurité des charges de travail cloud (CWS). Ce rapport détaille le positionnement de chacun de ces fournisseurs pour aider les professionnels de la sécurité et de la gestion des risques (S&R) à adopter les solutions adaptées à leurs besoins.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010