> Tech > Modèles de Naïve-Bayes et réseaux de neurones

Modèles de Naïve-Bayes et réseaux de neurones

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Ces algorithmes créent deux types de modèles prédictifs. L’algorithme Naïve- Bayes est la méthode la plus rapide, bien que légèrement limitée, pour trier des relations entre des colonnes de données. Il est basé sur l’hypothèse simplificatrice selon laquelle lorsque vous évaluez la colonne A en tant que prédicteur pour les

Modèles de Naïve-Bayes et réseaux de neurones

colonnes cible B1, B2, etc., vous pouvez ignorer les dépendances entre ces colonnes cible. Ainsi, afin de créer un modèle Naïve-Bayes, vous avez seulement besoin d’apprendre les dépendances dans chaque paire (prédicteur, cible). Pour cela, l’algorithme Naïve-Bayes calcule un ensemble de probabilités conditionnelles, telles que la probabilité suivante, issue des données de recensement :

Probability ( Marital = "single" _ Military = "On Active Duty" ) = 0.921

Cette formule montre que la probabilité pour une personne d’être célibataire (single) pendant son service actif à l’armée diffère fortement de la probabilité globale d’être célibataire à l’échelle de la population (qui est approximativement de 0.4). Par conséquent, vous pouvez en conclure que la situation militaire constitue un bon prédicteur du statut marital.

La méthodologie des réseaux de neurones est probablement le type de modélisation le plus ancien et peut-être le plus dur à décrire en quelques mots. Imaginez que les valeurs dans les colonnes de données à prédire sont issues (sorties) d’une « boîte noire » et que les valeurs dans les colonnes de données servant de prédicteur potentiel constituent les entrées de la même boîte noire. A l’intérieur de la boîte se trouvent plusieurs couches de « neurones » virtuels interconnectés et reliés également aux fils d’entrée et de sortie.

L’algorithme de réseau de neurones est conçu pour déterminer ce qu’il y a à l’intérieur de la boîte, au vu des entrées et des sorties correspondantes déjà enregistrées dans vos tables de données. Une fois que vous avez appris la structure interne à partir des données, vous pouvez prédire les valeurs de sortie (c.-à-d. les valeurs dans les colonnes cible) lorsque vous avez les valeurs en entrée.

Téléchargez cette ressource

Percer le brouillard des rançongiciels

Percer le brouillard des rançongiciels

Explorez les méandres d’une investigation de ransomware, avec les experts de Palo Alto Networks et Unit 42 pour faire la lumière dans la nébuleuse des rançongiciels. Plongez au cœur de l’enquête pour comprendre les méthodes, les outils et les tactiques utilisés par les acteurs de la menace. Découvrez comment prévenir les attaques, les contrer et minimiser leur impact. Des enseignements indispensables aux équipes cyber.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010