> Tech > Créer des modèles de Datamining

Créer des modèles de Datamining

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Pour créer un modèle de datamining, il faut définir la structure et les propriétés du modèle. Selon l'API OLE DB for Data Mining, vous créez un nouveau modèle de datamining en utilisant l'instruction CREATE MINING MODEL. Dans des bases de données relationnelles, l'instruction CREATE TABLE définit la structure et les

Créer des modèles de Datamining

propriétés d’une
table relationnelle, y compris les noms
de colonnes et les types de données,
les contraintes et les options de stockage.
De même, l’instruction CREATE
MINING MODEL définit les clés et les
colonnes d’un modèle et l’algorithme
et paramètres à  utiliser dans l’opération
de formation.

On crée un modèle de datamining
en utilisant le Mining Model Wizard
dans Analysis Manager. Après avoir sélectionné
l’algorithme de datamining,
défini la table d’entrée et spécifié les
colonnes d’entrée et prévisibles, le
Mining Model Wizard engendre automatiquement
les instructions CREATE
MINING MODEL. Nous avons utilisé
l’algorithme MDT pour créer un modèle
de datamining chargé de résoudre
le premier problème de la table 2 parce
que c’est un problème de prédiction.
Nous avons choisi CustomerID comme
colonne de clé de cas, qui est la colonne
de clé d’identité de la table de
cas et qui identifie un cas de manière
unique. Comme on le voit figure 4,
nous avons sélectionné toute l’information
démographique comme des
colonnes d’entrée et la colonne
Churn_Yes_No comme l’attribut de
sortie que nous voulions prédire. Dans
l’étape finale du wizard, nous avons
nommé ce modèle Model1_MDT_
NonNested.

Dès que vous cliquez sur Finish, le
wizard génère une instruction CREATE
MINING MODEL fondée sur la syntaxe
de OLE DB for Data Mining, puis l’envoie
au fournisseur de Microsoft Data
Mining. La syntaxe CREATE MINING
MODEL générée est semblable à  l’instruction
CREATE TABLE de SQL standard.
Dans la figure 5, par exemple, les
mots-clés LONG, DOUBLE et TEXT définissent
les types de données des colonnes
et sont semblables à  int, float, et
varchar de T-SQL. Toutefois, l’instruction
comporte quelques extensions dont T-SQL est démuni. Ainsi, le motclé
KEY désigne une colonne (ou plusieurs
colonnes) de type de contenu
qui identifie de manière unique une ligne dans le modèle de datamining.
Les mots-clés CONTINUOUS et DISCRETE
sont deux valeurs possibles
pour le type de contenu Attribute, indiquant
un type de colonne continu ou
discret. Le mot-clé PREDICT indique la
colonne prévisible du modèle de datamining,
qui est la colonne cible sur laquelle
l’utilisateur veut trouver des
profils.

Téléchargez cette ressource

Comment sécuriser une PME avec l’approche par les risques ?

Comment sécuriser une PME avec l’approche par les risques ?

Disposant de moyens financiers et humains contraints, les PME éprouvent des difficultés à mettre en place une véritable stratégie de cybersécurité. Opérateur de services et d’infrastructures, Naitways leur propose une approche pragmatique de sécurité « by design » en priorisant les risques auxquelles elles sont confrontées.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010