Pour créer un modèle de datamining, il faut définir la structure et les propriétés du modèle. Selon l'API OLE DB for Data Mining, vous créez un nouveau modèle de datamining en utilisant l'instruction CREATE MINING MODEL. Dans des bases de données relationnelles, l'instruction CREATE TABLE définit la structure et les
Créer des modèles de Datamining

propriétés d’une
table relationnelle, y compris les noms
de colonnes et les types de données,
les contraintes et les options de stockage.
De même, l’instruction CREATE
MINING MODEL définit les clés et les
colonnes d’un modèle et l’algorithme
et paramètres à utiliser dans l’opération
de formation.
On crée un modèle de datamining
en utilisant le Mining Model Wizard
dans Analysis Manager. Après avoir sélectionné
l’algorithme de datamining,
défini la table d’entrée et spécifié les
colonnes d’entrée et prévisibles, le
Mining Model Wizard engendre automatiquement
les instructions CREATE
MINING MODEL. Nous avons utilisé
l’algorithme MDT pour créer un modèle
de datamining chargé de résoudre
le premier problème de la table 2 parce
que c’est un problème de prédiction.
Nous avons choisi CustomerID comme
colonne de clé de cas, qui est la colonne
de clé d’identité de la table de
cas et qui identifie un cas de manière
unique. Comme on le voit figure 4,
nous avons sélectionné toute l’information
démographique comme des
colonnes d’entrée et la colonne
Churn_Yes_No comme l’attribut de
sortie que nous voulions prédire. Dans
l’étape finale du wizard, nous avons
nommé ce modèle Model1_MDT_
NonNested.
Dès que vous cliquez sur Finish, le
wizard génère une instruction CREATE
MINING MODEL fondée sur la syntaxe
de OLE DB for Data Mining, puis l’envoie
au fournisseur de Microsoft Data
Mining. La syntaxe CREATE MINING
MODEL générée est semblable à l’instruction
CREATE TABLE de SQL standard.
Dans la figure 5, par exemple, les
mots-clés LONG, DOUBLE et TEXT définissent
les types de données des colonnes
et sont semblables à int, float, et
varchar de T-SQL. Toutefois, l’instruction
comporte quelques extensions dont T-SQL est démuni. Ainsi, le motclé
KEY désigne une colonne (ou plusieurs
colonnes) de type de contenu
qui identifie de manière unique une ligne dans le modèle de datamining.
Les mots-clés CONTINUOUS et DISCRETE
sont deux valeurs possibles
pour le type de contenu Attribute, indiquant
un type de colonne continu ou
discret. Le mot-clé PREDICT indique la
colonne prévisible du modèle de datamining,
qui est la colonne cible sur laquelle
l’utilisateur veut trouver des
profils.
Téléchargez cette ressource

Rapport mondial 2025 sur la réponse à incident
Dans ce nouveau rapport, les experts de Palo Alto Networks, Unit 42 livrent la synthèse des attaques ayant le plus impacté l'activité des entreprises au niveau mondial. Quel est visage actuel de la réponse aux incidents ? Quelles sont les tendances majeures qui redessinent le champ des menaces ? Quels sont les défis auxquels doivent faire face les entreprises ? Découvrez les top priorités des équipes de sécurité en 2025.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Ransomware : persistance des cyberattaques à l’échelle mondiale
- Cybersécurité : l’IA générative rebat les cartes du cybercrime
- Le World Cyber Ranking, 1er classement mondial de la cybersécurité des entreprises
- Comment le Quarter Plan permet d’aligner IT et Métiers pour délivrer
- Explosion des attaques d’ingénierie sociale en 2025
