Fiche analyse de tableaux croisés et test de khi deux
Fiche : Fiche analyse de tableaux croisés et test de khi deux. Recherche parmi 300 000+ dissertationsPar inconnu810 • 6 Mai 2019 • Fiche • 1 199 Mots (5 Pages) • 674 Vues
1 ERE METHODE DE DISTINGUER UN LIEN NETRE LES VARIABLES[pic 1]
1. La distinction variable explicative variable expliquée
Variable explicative : sexe => Modalité de sexe : Homme/Femme
a)Qu'est ce qu'un tableau de Contingence :
+14[pic 2][pic 3]
Ceci est un tableau de contingence :
Un tableau de contingence est une Representation Schematique d'Ensemble. Avec des individus au croisement.
contient des effectifs qui répondent à la réponse modalité x (afrique du nord par ex )et réponse modalité y
(près des facultés)
Effet de dépendance (ou effet de liaison): Possibilité de juger si les variables sont liées : => Un effectif important dans une case monterait que les deux modalités de réponses sont associées chez les personnes et donc => Le comportement depend des variables et les deux variables sont dépendantes
Il existe un autre effet : tailles des modalités : si on a plus d'étudiants dans une modalités qu'une autre => Perturbation.
Solution : travailler en pourcentage pour éliminer l'effet taille et retenir l'effet dépendance.
Probleme : pourcentages peuvent se faire en taille et en colonne.
b) • Distinction variable expliquée / variable explicative :
exemple : Variable expliquée (décomposée) : "Lieu logement"
Dans un cas de pourcentage en ligne : : c'est la distribution sous la condition qu'ils logent à la périhérie <=> SACHANT qu'il logent à la périphérie
Variable expliquée = variable "sachant que"
Ex : Sachant que je suis dans un quartier peripherique ; si j'interroge un etidiant au hasard il y a plus de chance que l'etudiant appartienne au 1er groupe que au 2eme
Pourcentages en ligne aussi appelés : profils en ligne / distribution onditionnelles (quand on fait un cours de stat)
[pic 4]
A partir de là : Deux choses :
- Utilisaton de ces profils pour juger de l'independnace de ces variables.
Si deux variables sont idependantes la distribuion conditionnelle deverait être identique à la distribution marginale. (pas le cas ici)
1ERE DEFINITION :
[pic 5]
ex 3 façon de dire[pic 6]
: P(A sachant B) = P(A)
Si pas indépendance : Une répartition du groupe dans un quartier qui n'est pas la même que dans l'échantilon.
=> CEST LA REGLE QU ON VA UTILISER.
[pic 7]
Il y'a toujurs une regle : toujours etre sous la forme variable expliquée : variable explicative.[pic 8]
Ex : :"pres des facultés : quoi en terme d'etudiants".-> Pres des facultés il ya une sur representatin des etudiant dorigine sub saharienneCar variable expliquée = toujours l avariable "sachant que"
Mais si : pourcentage en colonne : Variable expliquée = variable explicative => "groupe d'etudiant : où est ce qu'il habitent. "
Quel type de représentation choisir ? Dépend de la problématique : ex 1er pour Maire, 2eme pour Crous
2 EME METHODE POUR IDENTIFIER UN LIEN ENTRE DEUX VARIABLES QUI CONDUIT AU TEST DE KHI DEUX.
2. Une autre façon de distinguer la liaison : Comparaison avec un tableau sous hypothèse d'indépendance
DEFINITION 2 :[pic 9]
[pic 10]
On est sur des distriutions partielles qu'on rapporte au total.
Rappelle le théorème : P(A et B) = P(A) . P(B)
[pic 11]
On contruit tableau qui représente situation où valeur sont indépendantes. Et on compare avec tableau observé (donc frequence partielle) => Si presques identiques = variables independantes.
...