> Tech > Modèles de Naïve-Bayes et réseaux de neurones

Modèles de Naïve-Bayes et réseaux de neurones

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Ces algorithmes créent deux types de modèles prédictifs. L’algorithme Naïve- Bayes est la méthode la plus rapide, bien que légèrement limitée, pour trier des relations entre des colonnes de données. Il est basé sur l’hypothèse simplificatrice selon laquelle lorsque vous évaluez la colonne A en tant que prédicteur pour les

Modèles de Naïve-Bayes et réseaux de neurones

colonnes cible B1, B2, etc., vous pouvez ignorer les dépendances entre ces colonnes cible. Ainsi, afin de créer un modèle Naïve-Bayes, vous avez seulement besoin d’apprendre les dépendances dans chaque paire (prédicteur, cible). Pour cela, l’algorithme Naïve-Bayes calcule un ensemble de probabilités conditionnelles, telles que la probabilité suivante, issue des données de recensement :

Probability ( Marital = "single" _ Military = "On Active Duty" ) = 0.921

Cette formule montre que la probabilité pour une personne d’être célibataire (single) pendant son service actif à l’armée diffère fortement de la probabilité globale d’être célibataire à l’échelle de la population (qui est approximativement de 0.4). Par conséquent, vous pouvez en conclure que la situation militaire constitue un bon prédicteur du statut marital.

La méthodologie des réseaux de neurones est probablement le type de modélisation le plus ancien et peut-être le plus dur à décrire en quelques mots. Imaginez que les valeurs dans les colonnes de données à prédire sont issues (sorties) d’une « boîte noire » et que les valeurs dans les colonnes de données servant de prédicteur potentiel constituent les entrées de la même boîte noire. A l’intérieur de la boîte se trouvent plusieurs couches de « neurones » virtuels interconnectés et reliés également aux fils d’entrée et de sortie.

L’algorithme de réseau de neurones est conçu pour déterminer ce qu’il y a à l’intérieur de la boîte, au vu des entrées et des sorties correspondantes déjà enregistrées dans vos tables de données. Une fois que vous avez appris la structure interne à partir des données, vous pouvez prédire les valeurs de sortie (c.-à-d. les valeurs dans les colonnes cible) lorsque vous avez les valeurs en entrée.

Téléchargez cette ressource

Les mégatendances cybersécurité et cyber protection 2024

Les mégatendances cybersécurité et cyber protection 2024

L'évolution du paysage des menaces et les conséquences sur votre infrastructure, vos outils de contrôles de sécurité IT existants. EPP, XDR, EDR, IA, découvrez la synthèse des conseils et recommandations à appliquer dans votre organisation.

Tech - Par Renaud ROSSET - Publié le 24 juin 2010