LaDissertation.com - Dissertations, fiches de lectures, exemples du BAC
Recherche

Régression Simple

Compte rendu : Régression Simple. Recherche parmi 300 000+ dissertations

Par   •  9 Mars 2020  •  Compte rendu  •  4 814 Mots (20 Pages)  •  447 Vues

Page 1 sur 20

                                                                         

Régression Simple

Exercice 1

        Aujourd’hui nous allons nous intéresser à la relation entre les dépenses en logement et le revenu mensuel net pour 250 individus.  Notre modelé sera donc un modèle linéaire de type : Y=β0+β1X+ἐ. Où β0 correspond à notre constante, β1 a notre coefficient directeur, ἐ a notre résidu, Y a notre variable dépendante et X a notre variable explicative. Pour étudier cette relation linéaire nous avons à notre disposition deux jeux de données en euro (€) les revenus mensuels nets et les dépenses en logement pour 250 individus. Pour étudier cette relation nous allons dans un premier temps regarder et commenter les caractéristiques de nos données (ordre de grandeurs, dispersion, histogramme, densité) ainsi que le nuage de point de notre relation. Par la suite nous estimerons notre modèle autrement dit les valeurs de nos coefficients β0 et β1 qui nous permettrons de discuter de l’effet marginal de X sur Y. Dans un second temps en plus de refaire la même procédure en rajoutant le logarithme : ln(Y)=β0+β1ln(X)+ἐ. Ce qui nous permettra de discuter de l’élasticité entre nos deux variables. Nous réaliserons un graphique avec les prévisions et les deux intervalles de confiances. Notre dernière partie consistera à scinder en deux notre effectif de base selon leur revenu, un groupes d’individus dont les revenus sont strictement inferieur à la médiane des revenus et un autre groupe ou les revenues sont supérieurs ou égale à la médiane des revenus. Pour ces deux groupes nous referons la même démarche que pour notre ensemble de base. En conclusion nous comparerons et commenterons l’élasticité de nos différents cas entre eux.

Première Partie :

Commençons donc par analyser les caractéristiques de nos données, d’abord celles des revenus ensuite celles des dépenses. Ci-dessous se trouve le tableau récapitulatif des données statistiques de nos revenus :

[pic 1]

Nous pouvons observer que la moyenne est égale à 5332..9€, ce qui nous donne un ordre de grandeur du revenu net moyen des individus par mois. Concernant la dispersion de notre jeu de données nous avons réalisé une « boite à moustache » qui comporte, la médiane, nos quartiles d’ordre 1 et 3, la valeur du revenu minimum et maximum. On note aussi qu’il n’y a pas « d’outliar ».

                                             [pic 2]  [pic 3][pic 4][pic 5][pic 6][pic 7][pic 8]

Le Skewnesse autrement dit le paramètre d’asymétrie est ici compris entre -0.5 et 0.5 (asymétrie=0.06) on peut donc dire que notre jeu de données est presque symétrique. Nous pouvons observer cette plus ou moins symétrie sur l’histogramme ainsi que la courbe des densités empiriques des revenues.

[pic 9][pic 10]

Concernant maintenant les dépenses nous avons ci-dessous le même tableau de données statistique mais cette fois ci concernant les dépenses :

[pic 11]

Nous remarquons que la moyenne est égale à 906.60€. Ce qui nous donne un ordre de grandeur concernant les dépenses moyennes en logement des individus par mois. Concernant la dispersion nous avons également réaliser une « boite a moustache », cette fois ci en revanche nous notons qu’il y a la présence de valeur aberrante ou autrement dit « d’outliar ».

                                               [pic 12][pic 13][pic 14][pic 15][pic 16][pic 17][pic 18]

Concernant l’asymétrie des dépenses nous remarquons que le paramètre d’asymétrie (=0.26) est bel et bien compris entre -0.5 et 0.5 on peut donc dire que nos données sont presque symétrique. Ce que nous pouvons de même observer en regardant l’histogramme ainsi que la courbe des densités empiriques.

[pic 19]  [pic 20]

Pour finir avec les caractéristiques de nos données nous avons dressé le nuage de points entre nos deux variables : sur l’axe des ordonnés nous avons notre variable dépendantes (les dépenses) et sur l’axe des abscisse notre variable explicative (les revenues).

[pic 21]

Nous pouvons observer que le sens de la relation est croissant, qu’il n’y a pas de forme courbes on a pu donc résumer le graphique par une droite : Y=183+0.136X. Où Y= Dépenses et X= Revenue. Nous notons aussi que l’épaisseur du nuage de points et plus ou moins condensée ce qui indique que la relation entre le revenu mensuel net et les dépenses en logement est plus ou moins forte. Finalement nous observons qu’il n’y a pas « d’outliar », pas de points aberrants.

Maintenant que nous avons étudier les caractéristiques statistiques de ces deux séries, nous allons pouvoir estimer la relation linéaire entre ces deux séries et commenter les résultats obtenus. Rappelons que notre relation est la suivante : Y=β0+β1X+ἐ. Où β0 correspond à notre constante, β1 à notre coefficient directeur, ἐ à notre résidu, Y aux dépenses en logement et X au revenue mensuel net.  Pour estimer cette relation nous allons utiliser le modèle des MCO autrement dit les « Moindres Carrés Ordinaires » (Ordinary Least Squares en anglais). Ce modèle nous donne les résultats suivants :

[pic 22]

Première chose à effectuer sur ce modèle est un test de significativité. Cela revient à tester deux hypothèses, est ce que notre constante est significative ainsi que notre coefficient directeur :

-H0 : β0= 0                                                                    -H0 : β1= 0

-Ha : β0 diffèrent de 0                                                 -Ha : β1 diffèrent de 0

Pour cela on regarde la p.critique,ci celle-ci est inferieur a 5% ⬄ 0.05 et bien on rejette H0 ce qui veut dire que notre valeur est bien significative. Pour notre constante p.critique =1.27e-0.16 et pour notre coefficient directeur p.critique= 1.20e-082. Autrement dit nos deux valeurs sont significatives.

...

Télécharger au format  txt (25 Kb)   pdf (1.3 Mb)   docx (878.4 Kb)  
Voir 19 pages de plus »
Uniquement disponible sur LaDissertation.com