Analyse et interprétation statistiques des résultats de mesure
Résumé : Analyse et interprétation statistiques des résultats de mesure. Recherche parmi 300 000+ dissertationsPar kratawi • 29 Septembre 2021 • Résumé • 1 263 Mots (6 Pages) • 493 Vues
[pic 1]
Analyse et interprétation statistiques des résultats de mesure
Antoine clément, Edouard Butin, Léonard Le Ludec, Chloé Floch, Jeremy Moualek
Année préparatoire MSC
Introduction sur l’étude :
Les deux ensembles de données sont liés aux variantes rouges et blanches du vin portugais "Vinho Verde". Seules les variables physico-chimiques (entrées) et sensorielles (sortieS) sont disponibles (par exemple, il n'y a pas de données sur les types de raisin, la marque de vin, le prix de vente du vin, etc.). Ces ensembles de données peuvent être considérés comme des tâches de classification ou de régression. Les classes sont ordonnées et non équilibrées (par exemple il y a beaucoup plus de vins normaux que d'excellents ou de mauvais).
Deux ensembles de données sont disponibles, dont un sur le vin rouge qui comportent 1599 variétés différentes et l’autre sur le vin blanc comportant 4898 variétés. Tous les vins sont produits dans une région particulière du Portugal. Les données sont collectées sur 12 propriétés différentes des vins, dont la qualité, basée sur des données sensorielles, et les autres sur les propriétés chimiques des vins, notamment la densité, l'acidité, la teneur en alcool, etc. Toutes les propriétés chimiques des vins sont des variables continues. La qualité est une variable ordinale avec un classement possible de 1 (pire) à 10 (meilleur). Chaque cépage est dégusté par trois dégustateurs indépendants et le classement final attribué est le classement médian donné par les dégustateurs.
Notre analyse va se porter sur la variable d’entrée : le degré d’alcool. Nous allons étudier cette variable et la comparer au travers des deux types de vins. Le degré d’alcoolique correspond à la mesure d’éthanol d’une boisson alcoolisé. Dans le vin, il constitue donc un paramètre de qualité et c’est pour cela que nous souhaitons mettre en valeur cette variable.
Introduction aux statistiques :
Mesure de position | ||
Vin rouge | Vin blanc | |
Effectif | 1599 | 4898 |
Médiane | 10.20 | 10.40 |
Moyenne | 10.42 | 10.51 |
1er quartile | 9.50 | 9.50 |
3ième quartile | 11.10 | 11.40 |
Maximum | 14.90 | 14.20 |
Minimum | 8.40 | 8.00 |
Mesures de Variabilité | ||
Etendue | 6.50 | 6.20 |
Ecart interquartile | 1.60 | 1.90 |
Ecart-type | 1.065 | 1.23 |
Variance | 1.13 | 1.51 |
Coefficient de variation | 0.10 | 0.12 |
Classification des données extraites de R :
Compréhension des indicateurs
Les mesures de position estiment la tendance centrale d’une population. Dans notre étude statistique nous avons choisi d’étudier sept mesures de position, cités ci-dessous :
- La moyenne : est égale à la somme des échantillons divisée par leur nombre. En moyenne, il y a 10.42 degrés dans le vin rouge comparé à 10.51 degrés dans le vin blanc.
- La médiane : c’est la valeur qui permet de couper l’ensemble des valeurs en deux parties égales dans une série statistique. C’est-à-dire qu’il y aura autant de valeurs supérieures ou égales à la médiane que de valeurs inférieures ou égales à cette même médiane. En ce qui concerne les vins rouges, la médiane est égale à 10.20. Cela signifie que la première moitié des échantillons contient un taux d’alcool inférieur ou égal à 10.20, et que la deuxième moitié des échantillons contient un taux d’alcool supérieur ou égal à 10.20. En ce qui concerne les vins blancs, la médiane est égale à 10.40. Cela signifie que la première moitié des échantillons contient un taux d’alcool inférieur ou égal à 10.40 degrés, et que la deuxième moitié des échantillons contient un taux d’alcool ou égal à 10.40.
- Les quartiles : le premier quartile (Q1) est la plus petite valeur de la série telle qu'au moins 25% des valeurs sont inférieures ou égales à Q1. Dans notre cas Q1 est égal à 9.5 pour le vin rouge comme pour le vin blanc. Ainsi, 25% des échantillons de vin rouge comme blanc possèdent un taux d’alcool inférieur à 9.5. En ce qui concerne le troisième quartile Q3, c’est la valeur au-dessous desquelles se situent 75 % des valeurs. Ici, Q3 étant égal à 11.10 pour le vin rouge et 11.40 pour le vin blanc, nous pouvons donc affirmer que 75% des échantillons de vin rouge possèdent un taux d’alcool inférieur à 11.10 et 75% des échantillons de vin blanc possèdent un taux d’alcool inférieur à 11.40.
- Le maximum : c’est la plus grande valeur de la série statistique. Le volume d’alcool maximum pour le vin rouge est de 14.90 degrés. Le volume d’alcool maximum pour le vin blanc est de 14.20.
- Le minimum : c’est la plus petite valeur de la série statistique. Le volume d’alcool minimum pour le vin rouge est de 8.40 degrés. Le volume d’alcool minimum pour le vin blanc est de 8 degrés.
Les variables de dispersion servent à caractériser l’étalement des valeurs présentes autour de la moyenne. C’est-à-dire que, plus les mesures de variabilité sont élevées, plus la dispersion autour de la moyenne est grande, et inversement, plus les mesures de variabilité sont basses, plus les valeurs se concentrent autour de la moyenne. Pour établir la dispersion des différentes amplitudes de sucres résiduels dans nos échantillons de vin blanc et de vin rouge nous avons utilisés cinq mesures de variabilité, cités ci-dessous :
...