> Tech > Utiliser le clustering pour créer des segments

Utiliser le clustering pour créer des segments

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

Un autre algorithme de datamining, Cluster Analysis, vous permet de segmenter la population cible reflétée dans la base de données d'après des similitudes partagées entre plusieurs attributs. Avec des clusters, contrairement aux arbres de décision, il n'est pas nécessaire de préciser un résultat particulier pour l'algorithme à utiliser pour déterminer

diverses classes, discriminateurs et prédicteurs.
Indiquez plutôt quels champs vous
voulez que l’algorithme de clustering
utilise quand il évalue la similitude ou
la non-similitude des cas qu’il envisage
d’attribuer aux divers clusters.

Pour commencer la tâche de modélisation
du datamining pour l’analyse
en cluster, il faut indiquer les données
source. Comme avec l’arbre de
décision, vous pouvez pointer le
Mining Model Wizard sur la source de
données Conferences.mdb et utiliser
la table Customers comme cible de
l’analyse. Dans ce cas, l’algorithme se
concentrera sur les clients, évaluant
leurs similitudes partagées d’après divers
attributs pour déterminer à quel
cluster ils appartiennent.

Une fois que vous avez sélectionné
la table de données cible, le wizard
vous demande d’indiquer la technique
de datamining. On procède comme
avec l’arbre de décision, mais dans ce
cas, sélectionnez Clustering comme
méthode de datamining.

Comme dans tous les modèles de
datamining, le wizard vous demande
d’indiquer l’unité d’analyse en sélectionnant
la clé de cas pour l’analyse.
Comme avec l’arbre de décision, la
base de cas, ou unité d’analyse, doit
être le niveau client, indiquez l’ID
client comme le champ clé. Comme le
montre la figure 7, le wizard d’analyse
vous demande ensuite d’indiquer les
champs à utiliser pour former les clusters.
L’algorithme utilisera ces champs
pour estimer collectivement les similitudes
et non-similitudes entre les cas
pour former les clusters de clients.

Après avoir sélectionné les
champs, vous pouvez exécuter le modèle
cluster. Le traitement aboutit au
résultat de la figure 8. Les zones
Content Detail et Content Navigator
utilisent la couleur pour représenter la
densité du nombre d’observations (enregistrements
client dans chaque cluster).
Vous pouvez examiner les
résultats Attributes pour voir les caractéristiques
des divers clusters. Par défaut,
l’algorithme de datamining en clustering place arbitrairement les clusters
en 10 groupes homogènes distincts.
Toutefois, si vous voulez comprendre
les caractéristiques des
groupes, vous pourriez choisir de régler
le moteur de clustering pour produire
moins de clusters. Pour cet
exemple, choisissons trois clusters.
Pour changer le nombre de clusters
que l’algorithme génère, allez à la boîte
de dialogue Properties dans le Mining
Model Editor et changez la valeur de
Cluster Count de 10 à 3. Ce changement
ordonne à Analysis Manager de
recalculer les attributs et les membres
du cluster en essayant d’identifier 3
clusters au lieu des 10 par défaut. Pour
compléter ce recalcul, vous devez retraiter
le modèle datamining. Vous
pourrez ensuite examiner le modèle
pour voir les nouveaux résultats.

Téléchargez cette ressource

Microsoft 365 Tenant Resilience

Face aux failles de résilience des tenants M365 (configurations, privilèges, sauvegarde). Découvrez 5 piliers pour durcir, segmenter et surveiller vos environnements afin de limiter l’impact des attaques. Prioriser vos chantiers cyber et améliorer la résilience de vos tenants Microsoft 365.

Les articles les plus consultés

A travers cette chaîne

A travers ITPro

Les plus consultés sur iTPro.fr

Articles les + lus

Couchbase lance AI Data Plane pour industrialiser l’IA agentique

Windows 11 : Microsoft généralise le point-in-time restore pour accélérer la remise en service des PC

Computex 2026 : 5 signaux forts à retenir

La chaîne d’approvisionnement, point de rupture récurent du SI

Microsoft Build 2026 : contre-offensive des modèles maison face à OpenAI et Anthropic

A lire aussi sur le site

Au-delà du polling: pourquoi la surveillance des systèmes hérités devient un risque pour l’entreprise

Pendant des années, la surveillance des réseaux d'entreprise s'est appuyée sur un principe simple : collecter périodiquement des instantanés de l'activité réseau (le polling SNMP) afin d’évaluer l'état général de ce dernier. Cette approche fonctionnait plutôt bien lorsque les infrastructures étaient stables et prévisibles.

À la une de la chaîne Tech

Sécuriser sa téléphonie IP : 5 failles critiques à anticiper

Sécuriser sa téléphonie IP n’est plus une option. Avec la généralisation de la téléphonie cloud et des infrastructures VoIP, la voix circule désormais sur les mêmes réseaux que les données stratégiques de l’entreprise.

A la Une des Ressources IT

Inscrivez-vous !

Actualités, Dossiers et Ressources IT Professionnelles - mardi 28 juillet 2026

Utiliser le clustering pour créer des segments

Téléchargez cette ressource

Microsoft 365 Tenant Resilience

Les articles les plus consultés

Les plus consultés sur iTPro.fr

Articles les + lus

A lire aussi sur le site

Au-delà du polling: pourquoi la surveillance des systèmes hérités devient un risque pour l’entreprise

À la une de la chaîne Tech

Sécuriser sa téléphonie IP : 5 failles critiques à anticiper

A la Une des Ressources IT

Sécuriser Microsoft 365 avec une appr...

Microsoft 365 Tenant Resilience

Mac en entreprise : le levier d’un po...

Plan de sécurité Microsoft 365

Guide de Threat Intelligence contextu...

Utiliser le clustering pour créer des segments

Téléchargez cette ressource

Microsoft 365 Tenant Resilience

Les articles les plus consultés

Les plus consultés sur iTPro.fr

Articles les + lus

A lire aussi sur le site

Au-delà du polling: pourquoi la surveillance des systèmes hérités devient un risque pour l’entreprise

À la une de la chaîne Tech

Sécuriser sa téléphonie IP : 5 failles critiques à anticiper

A la Une des Ressources IT

Sécuriser Microsoft 365 avec une appr...

Microsoft 365 Tenant Resilience

Mac en entreprise : le levier d’un po...

Plan de sécurité Microsoft 365

Guide de Threat Intelligence contextu...

Sécuriser Microsoft 365 avec une appr...