LaDissertation.com - Dissertations, fiches de lectures, exemples du BAC
Recherche

Analyse en composante principale

Compte rendu : Analyse en composante principale. Recherche parmi 300 000+ dissertations

Par   •  23 Janvier 2020  •  Compte rendu  •  658 Mots (3 Pages)  •  667 Vues

Page 1 sur 3

[pic 1]

   On remarque que les valeurs propres sont relativement proches et décroissent lentement, ce qui peut signifier que toutes les composantes ont une part non négligeable de l’information. Ce résultat est prévisible car d’après ce qui précède (matrice de corrélation) les variables sont faiblement corrélées entre elles. On constate que les valeurs propres des trois premiers axes sont supérieures à la moyenne (qui vaut 1 en ACP normée). On peut alors se contenter de choisir ces trois dimensions et on trace donc trois cercles de corrélation.

[pic 2][pic 3][pic 4]

 La lecture pour chacun des facteurs retenus des corrélations avec les 8 variables permet de déterminer leur signification concrète. Dans notre exemple, on voit sur le cercle des corrélations entre les deux premières composantes principales et les 8 variables que le facteur 1 représente le niveau de vie des couples ainsi que le niveau intellectuel des femmes. En effet, en projetant orthogonalement les vecteurs sur cet axe 1, on constate des corrélations positives avec les indicateurs des salaires des couples et les années de scolarité des femmes.

 On remarque également que les variables age, exper sont corrélées positivement avec le deuxième axe et la variable kidsge6 est corrélée négativement avec ce même axe. On peut donc estimer que le deuxième axe (Dim2) représente le niveau d’expérience de la femme et son évolution d’âge.

 En effet, d’après l’analyse générale qui précède la femme américaine n’intègre le marché de travail qu’à partir d’un âge un peu élevé ceci peut expliquer le fait qu’elle a un nombre faible de petits enfants. De plus, le fait que notre base de données prend seulement en considération les enfants ayant moins de 18 ans, il est logique que les femmes les plus âgées aient moins d’enfants de cet âge.

[pic 5]

En projetant les variables dans le plan factoriel représentant les dimensions 2 et 3, on constate qu’une majorité de ces variables sont mal représentées. En fait , les variables age , kidsge , exp et hours sont très proches du centre et donc elles ne sont pas du tout explicatives contrairement aux variables hushrs, educ, wage et huswage qui sont proches de cercle de corrélation ,néanmoins , ces dernières ne permettent pas d’expliquer la signification des dimensions puisqu’elles sont situées loin des axes.

[pic 6]

 Au niveau de ce plan factoriel, les variables educ, wage, hours et huswage sont mal représentées alors que les variables huhrs,  kidsge6 exp et age sont bien représentées. On remarque aussi que les variables exper et age sont corrélées positivement avec la dimension 3 et la variable kid est corrélée négativement avec cette dimension et donc on peut donner expliquer la dimension 3 de la même manière que la dimension 2.

On peut dire que malgré le choix des 3 premières dimensions on n’a pas pu vraiment tirer de la valeur de cette analyse en composantes multiples puisque les deux derniers cercles de corrélations ne permettent pas vraiment d’expliquer les dimensions. De plus, le fait qu’il s’agit d’une base de donnée réelle et que les plans factoriels ne sont pas très représentatifs ne permet pas de réduire la dimension du problème.

...

Télécharger au format  txt (4.3 Kb)   pdf (286 Kb)   docx (62.2 Kb)  
Voir 2 pages de plus »
Uniquement disponible sur LaDissertation.com