> Tech > Le navigateur de l’arbre

Le navigateur de l’arbre

Tech - Par iTPro - Publié le 24 juin 2010
email

Vous pouvez naviguer dans le Content Navigator pour examiner les résultats de l'algorithme de datamining. Le Content Navigator vous permet d'examiner la totalité de l'arbre (qui peut être très grand) pour détecter la zone que vous voulez visualiser plus en détail. Comme le montre la figure 3, les noeuds de

l’arbre sont représentés
sous forme de boîtes. Les couleurs
dans les boîtes indiquent la densité du
résultat – une couleur plus dense indique
une plus grande proportion de
réponses.

Le navigateur de résultats
Attributes vous permet de mettre en
évidence n’importe quel noeud de
l’arbre pour produire un résumé statistique
des résultats qu’il contient. Dans
cet exemple, la réponse – présence à 
une conférence Java – représente 10 %
des cas dans l’analyse. La fenêtre
Attributes montre que, parmi les 14
589 cas sélectionnés pour cette analyse,
1 467 ont répondu à  l’offre promotionnelle.
Soit un taux de présence
à  la conférence d’environ 10 % (1 467
sur 14 589).

Les organisateurs de la conférence
ont utilisé la méthode de l’arbre de décision
pour voir comment cette présence
varie d’après certaines caractéristiques
client. Ils veulent aussi
développer une règle de décision qui
aiderait à  distinguer les participants à 
faible probabilité des participants à 
forte probabilité. Il suffira ensuite de
ne viser que les clients à  forte probabilité
pour, à  l’aide de ces règles de décision,
augmenter la probabilité de succès
des offres de conférences futures.

Au plus haut niveau de l’arbre de
décision de la figure 3, on voit que l’algorithme
a identifié tenure (c’est-à dire,
la longévité comme client)
comme la caractéristique distinctive la
plus importante qui indique une réponse
probable à  une offre de conférence.
(L’importance est une mesure
statistique de force que les algorithmes
de datamining établissent.) Dans le
panneau Attributes, on voit que, si la
longévité est inférieure ou égale à 
0,125 années (environ 45 jours), la probabilité
de réponse grimpe de la
moyenne de 10 % à  23,51 %. Par conséquent,
la plus forte probabilité de réponse
à  une promotion vient des
clients de très fraîche date – probablement
pour l’offre spécifique de cette
campagne.

Le résultat Attributes pour le noeud
le plus bas (Tenure > 0,125), que
montre la figure 4, affiche les résultats
pour les cas de plus forte tenure dans
la base de données (c’est-à -dire, ceux
qui ont été clients pendant plus de 45
jours). Parmi les clients high-tenure
(grande longévité), la probabilité de
réponse chute à  environ 2 %. Vous
commencez aussi à  manquer de données
pour ce groupe à  faible réponse :
vous ne disposez que de 201 cas – c’est
bien peu. Au fur et à  mesure que le nombre de cas d’un groupe commence
à  chuter, la précision statistique
des résultats tend à  diminuer.

Vous pouvez utiliser l’algorithme
de l’arbre de décision de Microsoft
pour analyser les données plus en profondeur.
Cet algorithme permet d’analyser
chaque noeud de l’arbre à  tour de
rôle. Ainsi, la figure 5 montre un affichage
plus profond des clients high-tenure
(> 0,125). L’affichage montre que
si la tenure est élevée et si le client est
du genre féminin, la probabilité de réponse
chute encore davantage. Parmi
les 20 femmes high-tenure dans la base
de données, le taux de présence
moyen est de 1,18 %. A noter aussi le
noeud de données de faible densité
pour les cas où le champ Gender est
manquant. Dans ce noeud, le taux de
présence est de zéro, laissant penser
que la faible qualité des données reflète
une faible loyauté des clients dans
cette partie des données client.

Parmi les 181 hommes au niveau
de l’arbre que montre la figure 5, le
taux de présence est de 2,46 % – donc,
les hommes ont à  peu près deux fois
plus de chance d’assister à  un événement
promu que les femmes. La figure
6 montre que les hommes qui ont une
grande longévité (>= 2,125 années) et
qui viennent de firmes relativement
petites (<= 0,25 sur une échelle de 0 à  10) - ou à  l'autre extrémité, de très grandes firmes (> 1,75) – sont plus
susceptibles d’être présents : 7,6 %.
Cette statistique situe ce groupe environ
au même niveau que le taux de
présence moyen de 10 % et indique
que ces gens peuvent être ciblés dans
le but d’augmenter la fidélité et la longévité.

Les femmes qui viennent de firmes
avec un chiffre de ventes annuel relativement
bas et de firmes de taille
moyenne (> 1,75 et <= 3,25) constituent aussi de bonnes cibles. Ce groupe avait un taux de présence de 14,85 %. Toutefois, ce noeud n'a que 14 occurrences « positives » de présences. C'est un nombre relativement petit pour servir de base, mais les résultats sont néanmoins statistiquement valides d'un point de vue théorique. Mais il vaudra mieux vérifier ces résultats par rapport à  un exemple concret ou à  une base de données de validation pour voir s'ils peuvent généraliser de manière réaliste une nouvelle population cible pour le marketing.

En regardant de près les résultats
de l’arbre, on peut voir que le meilleur
prédicteur de réponse – la durée en
tant que client – bien qu’apparemment
utile – révèle un problème. Les clients
récents sont les plus susceptibles de
répondre aux campagnes, donc il
semble que la fidélité dans la base de
clients existante soit faible. Mais le datamining
peut s’avérer utile pour explorer
et cultiver les clients les plus
loyaux afin d’accroître leur longévité. Il
s’avère que les clients les plus fidèles
sont des hommes venant de très petites
ou de très grandes firmes. Alors
que le taux de réponse à  long terme
global est très bas, (1 %), les hommes
dans la catégorie des petites ou des
grandes firmes répondent avec un taux
de 8 %. Donc, Conference Corp peut
augmenter le taux de réponses et stimuler
la fidélité des clients en ciblant
davantage de personnes dans ce segment
du marché.

Le modèle de datamining révèle
également les clés pour augmenter le
taux de réponse parmi les femmes. Les
femmes dans les firmes de taille
moyenne (ni petites, ni grandes) avec
un revenu modéré sont les meilleures
cibles. Parmi ces clients, le taux de réponses
monte à  environ 15 %.

Téléchargez gratuitement cette ressource

Comment sécuriser la Digital Workplace ?

Comment sécuriser la Digital Workplace ?

Avec le recours généralisé au télétravail, les entreprises ont ouvert davantage leur SI. En dépit des précautions prises, elles ont mécaniquement élargi leur surface d’exposition aux risques. Découvrez 5 axes à ne pas négliger dans ce Top 5 Sécurité du Télétravail.

Tech - Par iTPro - Publié le 24 juin 2010