ANALYSE DISCRIMINANTE
Cours : ANALYSE DISCRIMINANTE. Recherche parmi 300 000+ dissertationsPar Ichrak Nasseri • 26 Février 2017 • Cours • 459 Mots (2 Pages) • 1 094 Vues
ANALYSE DISCRIMINANTE (Synthèse)
C’est un problème de classement qui pour Buts :
1. maximiser la séparation entre deux ou plusieurs groupes définis à priori.
2. prédire l'appartenance à des groupes prédéfinis d'individus indéterminés : Prédiction.
Théorème de Bayes
Probabilité conditionnelle
On doit calculer la probabilité a posteriori d’appartenance à la classe Gi sachant X (connaissant les caractéristiques de Y) Pour classer un nouvelle élément dans la population pour laquelle la valeur de P(Gi/X) est la plus grande.
P (Gi/X) = P (Gi/X) = [pic 3][pic 1][pic 2]
Puisque le dénominateur reste identique quel que soit la classe on ne calcule que :[pic 4]
P (Gi/X) = [pic 5]
Vu que la transformation log est monotone on calcule pour faciliter notre tâche. [pic 6]
Procédure d’une analyse discriminante
Etape 1 : Recueillir les données
C’est données ont des groupes d’appartenances connu. On sait alors à quelle population appartient
Chaque sujet.
Etape 2 : Probabilité a priori
Pi représente la proportion de Gi dans la population : [pic 7]
Etape 3 : Test de Bartlett
Pour déterminer si les matrices de variance-covariance sont homogènes ou pas, pour déterminer s’il faut utiliser l’analyse discriminante linéaire si les matrices de variance-covariance sont homogènes sinon utiliser l’analyse discriminante quadratique.
Etape 4 : Estimer les paramètres des fonctions de densité conditionnelle [pic 8]
Vecteur de moyenne commun µ, matrice de variance-covariance commune , indépendance, normalité.[pic 9]
Etape 5 : Calcul des fonctions discriminantes
Etape 6 : Validation croisée pour estimer les probabilités de classement erroné
On utilise la validation croisée pour évaluer l’efficacité de l’analyse discriminante.
Ou on supprime une observation des données et on utilise les observations restantes pour calculer la fonction discriminante, ainsi on utilise cette nouvelle fonction discriminante pour classer l’observation supprimée. Ensuite on répète cela pour toutes les observations.
Etape 7 : Classer des observations avec des appartenances de classes inconnues
Analyse Discriminante Linéaire
Nous classons dans la population pour laquelle P (Gi/X) est maximale, ce qui implique selon le théorème de Bayes que est maximale ainsi que .[pic 10][pic 11]
Après tous les calculs, on obtient la fonction de score linéaire S : [pic 12]
Afin de calculer cette fonction S on a besoin de :
Probabilités antérieures [pic 13]
Moyens de population qui peut être estimé par la moyenne de l’échantillon [pic 14][pic 15]
Matrice de variance-covariance Σ qui peut être estimé par la matrice de variance-covariance regroupée [pic 16]
...