Une nouvelle fonctionnalité des algorithmes de clustering de Microsoft est leur capacité à trouver un nombre de clusters approprié pour votre modèle sur la base des propriétés des données d’apprentissage. Le nombre de clusters doit être suffisamment petit pour être gérable, mais un modèle de clusters doit avoir un pouvoir
Clustering et clustering de séquence
de prédiction relativement élevé. Vous pouvez demander à chacun des algorithmes de clustering de sélectionner un nombre de clusters basé sur un équilibre entre ces deux objectifs.
Le clustering de séquence (Sequence Clustering) de Microsoft est un nouvel algorithme pouvant être considéré comme un clustering sensible à l’ordre des éléments. Souvent, l’ordre des éléments dans un enregistrement n’a pas d’importance (par exemple, le panier de la ménagère), mais dans certaines circonstances il est crucial (par ex., des vols vers une certaine destination ou des lettres dans un code ADN). Dès que les données contiennent des séquences d’éléments, les fréquences globales de ceux-ci ne sont pas aussi importantes que l’ordre de début et de fin de chaque séquence, ainsi que toutes les transitions entre les deux. Notre exemple préféré pour illustrer les avantages du clustering de séquence est l’analyse de données de mode de navigation (littéralement « flux de clics »). La figure 7 présente un exemple de graphique de navigation d’un certain groupe de visiteurs sur un site Web. A chaque flèche vers un noeud de page Web est associée une étiquette indiquant la probabilité selon laquelle un visiteur passera à cette page Web à partir du point de départ de la flèche. Dans l’exemple de clusters, les pages de départ les plus probables du visiteur sont news (actualité) et home (page d’accueil) (notez la flèche arrivant sur le noeud news avec une probabilité de 0.40 et celle arrivant sur le noeud home avec une probabilité de 0.32). La probabilité selon laquelle un visiteur de la page news continuera de naviguer sur cette page au prochain clic est de 62 pour cent (notez la flèche avec une probabilité de 0.62 pointant du noeud news sur lui-même), mais les visiteurs commençant à partir de la page home passeront probablement à la page local, sport ou weather. Un graphique de transition, tel que celui de la figure 7, est le composant principal de chaque cluster de séquence et ce type de cluster peut contenir en plus tout ce que peut proposer un cluster normal.
Téléchargez cette ressource
Microsoft 365 Tenant Resilience
Face aux failles de résilience des tenants M365 (configurations, privilèges, sauvegarde). Découvrez 5 piliers pour durcir, segmenter et surveiller vos environnements afin de limiter l’impact des attaques. Prioriser vos chantiers cyber et améliorer la résilience de vos tenants Microsoft 365.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Fraude par identité synthétique : comment l’IA peut redonner confiance aux entreprises et à leurs clients
- VirtualBrowser protège la navigation web à la source
- Innovation et performance : le rôle clé du consulting dans la transformation numérique
- Sekoia.io : l’alternative européenne qui s’impose dans la cybersécurité
Articles les + lus
Moderniser le développement logiciel : de la fragmentation à l’intégration
Analyse Patch Tuesday Mars 2026
Une nouvelle ère de la modernisation du mainframe
Communes, entreprises ? Non, face au RGAA 5, l’IA seule ne rendra pas vos sites accessibles
DevX Summit EMEA : les développeurs au cœur de la révolution de l’IA
À la une de la chaîne Tech
- Moderniser le développement logiciel : de la fragmentation à l’intégration
- Analyse Patch Tuesday Mars 2026
- Une nouvelle ère de la modernisation du mainframe
- Communes, entreprises ? Non, face au RGAA 5, l’IA seule ne rendra pas vos sites accessibles
- DevX Summit EMEA : les développeurs au cœur de la révolution de l’IA
