Créer le modèle de mining

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

La requête précédente crée une base de données Microsoft Access. Pour analyser une source de données relationnelle (y compris Access), il faut d'abord la publier comme une source de données dans l'environnement Windows 2000 ou Windows NT, en établissant un DSN (Data Source Name). Pour plus de détails sur la

manière de
configurer Access comme une source de données, voir l’encadré « Utiliser
Access comme une source de données
».

Vous voilà donc prêt à créer un modèle
de mining pour traiter et analyser
les données. Commençons par utiliser
l’algorithme Microsoft Decision Trees
(Arbres de décision) pour créer un modèle
prédictif qui trouvera les clients
susceptibles de répondre à une offre
promotionnelle. Commencez par définir
un modèle de mining dans le data
mart analytique en démarrant Analysis
Manager (sous le menu Start, sélectionnez
Programs, Microsoft SQL
Server, Analysis Services, Analysis
Manager). Dans Analysis Manager, allez
à la vue arborescente et agrandissez
Analysis Services. Double-cliquez sur le
nom de votre serveur pour établir une
connexion avec l’Analysis Server. Pour
établir une nouvelle base de données,
faites un clic droit sur le nom de votre
serveur puis cliquez sur New Database.
Dans la boîte de dialogue Database, entrez
ConfCorp (ou tout autre nom que
vous avez choisi dans votre source de
données) dans la boîte de dialogue
Database Name et cliquez sur OK.

Par défaut, la nouvelle base de données
(dans ce cas, ConfCorp) que cette
opération crée contient cinq noeuds :
Data Sources, Cubes, Shared
Dimensions, Mining Models et
Database Roles. Ces noeuds apparaissent
dans une hiérarchie de type
Windows Explorer. La hiérarchie
montre que – jusqu’à ce point du processus
– les opérations impliquée dans
la création d’un modèle de mining
sont les mêmes que celles impliquées
dans la création d’une vue dimensionnelle
des données en utilisant les opérations
du modèle SQL Server OLAP
standard. Cette symétrie entre la création
d’un modèle dimensionnel de
type OLAP et un modèle de type datamining
est maintenue tout au long
d’Analysis Services et est l’une des
principales contributions de SQL
Server 2000 à l’intégration de ces deux
méthodes vis-à -vis de la BI (business
intelligence).

Pour commencer le datamining,
faites un clic droit sur le dossier Mining
Models puis sélectionnez New Mining
Model dans le menu raccourci pour afficher
le Mining Model Wizard. Ensuite
cliquez sur Next dans la fenêtre Select
source type, sélectionnez Relational
Data et cliquez sur Next à nouveau.
Dans la fenêtre Select case tables, sélectionnez
la base de données
ConfCorp (ou tout autre DSN que vous
avez établi) et cliquez sur Next.

Dès que vous avez sélectionné la
base de données, les tables et vues associées
deviennent disponibles,
comme le montre la figure 2.
Sélectionnons la vue JavaResults, qui
montre les clients ayant répondu à
l’offre d’assistance à la conférence Java.
Ensuite, le wizard vous demande de sélectionner
la technique de datamining
à utiliser. Dans la fenêtre Select Data-
Mining Technique, sélectionnez
Microsoft Decision Trees. Cliquez sur
Next.

Ensuite, vous devez identifier la
base de cas (ou unité d’analyse) pour la
tâche de modélisation. La vue
JavaResults a un champ appelé ID qui
représente l’ID client et qui garantit
que la base de cas ne contient pas d’enregistrements
client redondants. Le
Mining Model Wizard vous demande
ce nom dans l’étape Select key column.
Sélectionnez ID pour la colonne case
key et cliquez sur Next.

La dernière étape d’établissement
de la tâche d’analyse consiste à sélectionner le résultat ou la cible de
l’analyse. Dans la vue JavaResults, j’ai
créé le champ Outcome à cet effet.
Dans le wizard, sélectionnez Outcome
sous Predictable columns. Le wizard
présente aussi les entrées, ou prédicteurs,
que vous pouvez sélectionner
dans le modèle. Vous pouvez sélectionner
des champs comme Tenure,
Gender, Size of Firm et PromoDate
comme entrées. Ces champs vous donnent
des indicateurs de toutes les dimensions
d’analyse pour ce modèle :
caractéristiques personnelles et de la
société, caractéristiques de comportement
du client, et caractéristiques de
promotion.

Sauvegardez le modèle comme
PromoResults. Si vous sélectionnez
l’option Save and Process Now, le modèle
commence à triturer les données
pour trouver un bon modèle prédictif
fondé sur un arbre de décision. Cette option déclenche l’exécution des algorithmes
de datamining d’Analysis
Services.

La vue d’exécution du modèle
montre la progression de l’algorithme
de datamining et vous indique que celui-
ci a trouvé le meilleur modèle, en
affichant un message Finish dans la fenêtre.
En sélectionnant Done, on affiche
les résultats sur l’écran illustré figure
3. L’affichage de l’arbre de
décision a trois zones principales : l’affichage
principal, qui donne une vue
détaillée de l’arbre ; un Content
Navigator, qui montre une vue résumée
de haut niveau ; et un navigateur
de résultat Attributes, qui fournit un
résumé statistique du noeud en évidence
courant.

Téléchargez cette ressource

Rapport mondial 2025 sur la réponse à incident

Dans ce nouveau rapport, les experts de Palo Alto Networks, Unit 42 livrent la synthèse des attaques ayant le plus impacté l'activité des entreprises au niveau mondial. Quel est visage actuel de la réponse aux incidents ? Quelles sont les tendances majeures qui redessinent le champ des menaces ? Quels sont les défis auxquels doivent faire face les entreprises ? Découvrez les top priorités des équipes de sécurité en 2025.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

Les articles les plus consultés