> Tech > Utiliser le Clustering Algorithm avec une table imbriquée

Utiliser le Clustering Algorithm avec une table imbriquée

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Après avoir vu le principe de fonctionnement de l'algorithme MDT, voyons comment utiliser Microsoft Clustering en datamining. Pour résoudre le problème de la table 2, c'est-à -dire grouper les clients d'après les produits bancaires auxquels ils souscrivent, nous avons utilisé une table imbriquée pour construire un modèle de clustering. Il faut

Utiliser le Clustering Algorithm avec une table imbriquée

une table imbriquée pour modéliser
ce problème de gestion parce que
les produits qu’un client a achetés sont
imbriqués sous lui (c’est-à -dire qu’un
cas client inclut un ensemble de produits).
Après avoir démarré le Mining
Model Wizard, nous avons sélectionné
les tables Customer et Purchases dans
la base de données relationnelle, puis
avons sélectionné l’algorithme
Microsoft Clustering. Nous avons
choisi CustomerID comme colonne clé
de cas dans la table Customer, puis sélectionné
toute l’information démographique
comme colonnes d’entrée à 
partir de Customer et toute l’information
d’achat comme entrée provenant
de la table Purchases. Après avoir créé
le modèle, nous l’avons modifié dans
le Relational Mining Model Editor. Par
exemple, le wizard supposait que
Puchases est une table de consultation,
donc il a fait initialement de la table
Customer le côté « many » de la relation.
Mais comme nous voulions utiliser
Purchases comme une table imbriquée,
nous avons cliqué sur le lien
entre ces tables dans l’éditeur et inversé
la relation. La figure 8 présente le
modèle imbriqué modifié. Après avoir
traité ce modèle de datamining, en utilisant
l’instruction INSERT INTO que le
wizard a générée, le modèle formé se
présentait comme celui de la figure 9.

Après examen du contenu du modèle
dans le navigateur du cluster,
nous avons fait les observations suivantes
avec l’aide de la description
dans la section chemin de noeud :

• Les clients de Cluster 1 présentent
les caractéristiques suivantes : la
plupart ont environ 50 ans, un revenu
moyen de 79.000 dollars, n’ont
pas de source de revenu supplémentaire,
et beaucoup d’entre eux ont un
haut niveau d’éducation. Ils possèdent
de nombreux titres de dépôt,
de marché monétaire ou de comptes
d’épargne, et autres.

• Cluster 2 comprend les clients qui
ont, en moyenne, 40 ans, un revenu
moyen de 56.000 dollars et un revenu
supplémentaire moyen d’environ
42.000 dollars. Les clients présents
dans ce cluster possèdent de
nombreux titres de comptes de dépôt
et d’épargne, mais un petit
nombre de cartes de crédit.

• Cluster 3 inclut les clients dont l’âge
moyen est de 65 ans, ayant un revenu
moyen de 56.347 dollars et une
source de revenu supplémentaire
moyenne de 42.645 dollars. Les
clients de ce cluster possèdent de
multiples cartes de crédit et comptes
du marché monétaire.

Ainsi éclairé, le service marketing
de la banque peut envoyer des mailings
pour différents produits à  différents
clusters de clients. Le taux de réponse
à  ces mailings sera
probablement bien plus élevé que si
on avait ciblé une partie de la base de
clientèle sélectionnée au hasard.

Le contenu de cet article n’est absolument
pas exhaustif. Il veut simplement
donner un aperçu des concepts
du datamining. En explorant les techniques
que cet article présente, vous
pouvez commencer à  voir comment
les fonctions de datamining de SQL
Server 2000 Analysis Services peuvent
aider votre entreprise à  trouver les profils
et les règles permettant d’améliorer
le marketing, les ventes, l’assistance
client, et de mieux connaître ses
clients.

Téléchargez cette ressource

Guide de Sécurité IA et IoT

Guide de Sécurité IA et IoT

Compte tenu de l'ampleur des changements que l'IA est susceptible d'entraîner, les organisations doivent élaborer une stratégie pour se préparer à adopter et à sécuriser l'IA. Découvrez dans ce Livre blanc Kaspersky quatre stratégies efficaces pour sécuriser l'IA et l'IoT.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010