Etude fumeurs
Étude de cas : Etude fumeurs. Recherche parmi 300 000+ dissertationsPar romyk • 12 Juin 2019 • Étude de cas • 3 066 Mots (13 Pages) • 535 Vues
[pic 2]
[pic 3]
Sommaire
Sommaire 1
Exercice I 2
I. Estimons la probabilité de fumer 2
II. Différence entre les probabilités de fumer chez les salariés qui ne peuvent pas fumer au travail et ceux qui peuvent 3
III. Estimons des modèles logit et probit en considérant smoker comme variable dépendante et les régresseurs suivants : smkban, female, age, age2, hsdrop, hsgrad, colsome,colgrad 5
IV. Testons l’hypothèse que la probabilité d’être fumeur ne dépend pas dans la régression (3) du niveau d’études. La probabilité d’être fumeur croît-elle ou décroît-elle avec le niveau d’étude ? 8
V. En nous basant sur la régression (3), vérifiez qu’il existe une relation non-linéaire entre age et la probabilité d’être fumeur 8
VI. Reprenons la question (3) sans le carré de l’âge. Déduisons le meilleur modèle 9
VII. Evaluation de la qualité du modèle choisi 11
VIII. Quelle conclusion pouvez-vous tirer ? Utiliser le modèle logit et calculer les odds ratios. 13
Exercice 2 13
I. Probit multinomial avec erreurs indépendantes et régresseurs invariants 13
II. Probit multinomial avec erreurs non structurées lorsque la modalité ‘’charter’’ est supprimée 14
III. Probabilités prédites et effet marginal des variations de prix 16
IV. Même estimateur sans option structurelle 17
V. Comparaison avec logit conditionnel 19
Exercice I
L’objectif de cet exercice est d’examiner l’effet de l’interdiction de fumer au travail sur la consommation de tabac aux Etats-Unis. Nous disposons d’une base de données « Smoking » contenant 10 000 individus et 10 variables dont la description est donnée dans le tableau suivant :
Tableau 1: présentation des variables
Variables | Description |
Smoker | Prend la valeur 1 si le salarié est fumeur |
smkban | Prend la valeur 1 si interdiction de fumer sur le lieu de travail et 0 sinon |
age | Age du salarié |
hsdrop | |
hsgrad | Prend la valeur 1 si diplômé du secondaire et 0 sinon |
colsome | |
colgrad | Prend la valeur 1 si diplômé de l’université et 0 sinon |
black | Prend la valeur 1 si individu de couleur noir et 0 sinon |
hispanic | Prend la valeur 1 si individu hispanique et 0 sinon |
female | Prend la valeur 1 si le salarié est de sexe féminin et 0 sinon |
Estimons la probabilité de fumer
Pour tous les salariés
D’après le graphique 1 ci-dessous, la probabilité de fumer est de 24,23%. Ainsi , près d’un salarié sur quatre est fumeur.
Tableau 2: Probabilité de fumer dans l'ensemble des salariés
[pic 4]
Source : Nos calculs à partir de la base Smoking
Pour les salariés soumis à une interdiction de fumer sur le lieu de travail
La probabilité de fumer chez les salariés soumis à une interdiction de fumer sur le lieu de travail est 21,2%.
Tableau 3: Probabilité de fumer chez les salariés soumis à une interdiction de fumer sur le lieu de travail
[pic 5]
Source : Nos calculs à partir de la base Smoking
Pour les salariés qui peuvent fumer sur le lieu de travail
La probabilité de fumer chez les salariés qui peuvent fumer sur le lieu de travail est 28,96%.
Tableau 4: Probabilité de fumer chez les salariés qui peuvent fumer sur le lieu de travail
[pic 6]
Source : Nos calculs à partir de la base Smoking
Différence entre les probabilités de fumer chez les salariés qui ne peuvent pas fumer au travail et ceux qui peuvent
Le test de comparaison des proportions réalisé tel que présenté dans le tableau ci-dessous laisse entrevoir une différence significative entre ces probabilités (pvalue=0.000). Mieux encore la probabilité de fumer chez les salariés qui ne peuvent pas fumer au travail est inférieure à celle de ceux qui peuvent fumer au travail.
Tableau 5: test de proportion
[pic 7]
Source : Nos calculs à partir de la base Smoking
Utilisons les modèles probit et logit pour déterminer si cette différence est statistiquement significative
Le modèle probit est globalement significatif (p-value=0.000). De plus tous les coefficients sont significatifs et en l’occurrence celui entre le fait d’être fumeur et celle de pouvoir fumer ou pas sur le lieu du travail. Ainsi, il existe une différence significative entre ces deux probabilités.
Tableau 6: modèle probit de détermination de la différence
[pic 8]
Source : Nos calculs à partir de la base Smoking
Tout comme précédemment, le modèle logit est globalement significatif (pvalue=0.000). De plus tous les coefficients sont significatifs et en l’occurrence celui entre le fait d’être fumeur et celle de pouvoir fumer ou pas sur le lieu du travail. Ainsi, il existe une différence significative entre ces deux probabilités.
...