Statistique
Cours : Statistique. Recherche parmi 300 000+ dissertationsPar alain houzet • 17 Juin 2023 • Cours • 2 925 Mots (12 Pages) • 194 Vues
[pic 1]
En général on étudie une population, des individus (185 employés), on étudie un caractère (salaire mensuel) et ce caractère peut être qualitatif et quantitatif :
Qualitatif : ne prend pas de valeur numérique (couleur des yeux)
Quantitatif : prend une valeur numérique
C’est quoi un effectif cumulé croissant : nombre de personnes ayant un salaire inférieur ou égal à 1870 € par exemple, donc : 40+15+81+35=171
Je peux le calculer pour toutes colonnes et on remarquera qu’il suffit d’ajouter l’effectif ni au précèdent effectif cumulé croissant soit le premier étant 40, donc 40+15=55, 55+81=136,…..
Le mode ou la classe modale est la valeur la plus fréquente dans la série, soit celle qui a le plus gros effectif. Dans notre entreprise, le plus gros effectif est 81 personnes ayant un salaire égal à 1554
Donc le mode ou Mo=1554
La moyenne : notée x d’une série statistique est le quotient de la somme de toutes les valeurs de cette série par son effectif total :
Pour n =185
40*1405 + 15*1480 + …. + 5*4215
x = ---------------------------------------------- = 1705,14
185
Le salaire moyen de l’entreprise est de 1705
La médiane, notée Med d’une série statistique de n valeurs discrètes et rangées par ordre croissant, est la valeur partageant la population en deux groupes de même effectif
[pic 2]
Nous avons n=185 soit n/2= 185/2= 92,5 c’est-à-dire impair
On aura donc |--------------------|*|-------------------|
92 92
93 valeur est la médiane
Je prends mon tableau avec les effectifs cumulés croissants et je regarde ou se situe la 93 personne.
Nous voyons que la 93ieme personne se situe dans le paquet des personnes gagnant 1554 €
Donc Med = 1554, cela veut dire que la moitié des employés de cette entreprise a un salaire inférieur ou égal à 1554€ ou a un salaire supérieur ou égal à 1554€
Prenons un « n » pair dans notre exemple, soit n=184 ainsi n/2 = 184/2 = 92
Donc, je prends la valeur de la 92 personne (1554) et la valeur de la 93 personne (1554) que j’ajoute et divise par deux : (1554+1554)/2 = 1554 🡺 Med = 1554
Les quartiles : noté Q1 pour le premier et Q3 pour le troisième, est le plus petit élément des valeurs de la série ordonnée par ordre croissant tel que au moins 25% (et 75% pour Q3) de ces valeurs soient inférieures ou égales à Q1 (ou Q3)
Ici, on a n=185
Or ¼*n = ¼ *185 = 46,25 🡺 il nous faut au moins ¼ des valeurs donc on arrondi supérieur, soit 47iéme personne. D’où Q1= 1480 à partir des ECC
Et ¾*n = ¾*185= 138,75 🡺 il nous faut au moins ¾ des valeurs donc on arrondi supérieur, soit 139 personne. D’où Q3 = 1870 à partir de ECC
Cela veut dire qu’un quart des employés de cette entreprise a un salaire inférieur à 1480€ ou trois quarts des employés ont un salaire inférieur ou égal à 1870€
Les fréquences :
Fréquence = Effectif / Effectif total
Fréquence cumulées croissantes = fréquence précédente + fréquence suivante
[pic 3]
Peut être également exprimé en % :
[pic 4]
Ainsi pour vérifier les quartiles, Q1 étant le premier quart soit 25%, dans la ligne Fcc la valeur de 25% se situe dans la colonne 1480, donc 25% ou ¼ des employés a un salaire inférieur à 1480€
De même pour Q3 ou 75%, donnant la valeur 1870€
s
Les indicateurs de dispersion :
Reprenons le même exemple avec les 185 employés de l’entreprise :
[pic 5]
L’étendue d’une série statistique, noté « e » est la différence entre la plus grande et la plus petite valeur de la série.
Donc e = Max – Min
Ex : e = 4215 – 1405 = 2810 €
L’ écart interquartile est la différence de Q3 – Q1
Ex : Q3 – Q1 = 1870 – 1480 = 390 €
L’intervalle interquartile est l’intervalle [Q1 ; Q3]
Ex : l’intervalle interquartile est [ Q1 ; Q3 ] = [1480 ; 1870 ] 🡺 cela veut dire 50% des salaires sont compris entre 1480 et 1870 €
La variance : Elle va permettre de comparer deux ou plusieurs listes d’une série statistique simple ayant la même moyenne. Ainsi, plus la variance est petite, plus les valeurs de la série statistique sont proches de la moyenne et si la variance est grande nous avons une grande dispersion des valeurs.
Exemple :
Soit une série de note pour 10 élèves :
Classe A : (07, 08, 10, 11, 11, 13, 13,14,15,18) 🡺 la moyenne est 12
Classe B : (03, 04, 04, 07, 07, 17, 19, 19, 20, 20= 🡺 la moyenne est 12
Classe C : (11, 11, 12, 12, 12, 12, 12, 12, 13, 13) 🡺 la moyenne est 12
Nous devons calculer l’écart entre la moyenne et la note soit pour les classes A, B et C
[pic 6]
Formule de la variance :
[pic 7]
[pic 8]
Var (X) = 9,8
A partir de notre exemple :
[pic 9]
Autre formule plus simple de la variance issue de Konig :
...