Régression multiple linéaire
TD : Régression multiple linéaire. Recherche parmi 300 000+ dissertationsPar Él Mahdii Mâamri • 11 Juin 2017 • TD • 2 346 Mots (10 Pages) • 903 Vues
Sommaire:
Introduction : 2
1.Présentation de l’étude : 3
2. Régression Linéaire Multiple : 5
❖ Signification globale du modèle : 5
❖ Estimation des paramètres du Modèle : 6
❖ Interprétation des estimateurs de l’Analyse : 7
❖ Matrice de corrélations : 8
❖ Résidus : 8
❖ Multi colinéarité : 9
3-Sélection par régression pas à pas (Stepwise) : 10
Conclusion : 13
Introduction :
Dans ce le présent travail nous allons essayer d’appliquer une régression multiple linéaire qui va nous permettre d’analyser les liens entre une variable dépendante quantitative à expliquer et plusieurs variables quantitatives explicatives indépendantes. Ainsi que la méthode pas à pas pour construire le modèle qui permet de trouver le meilleur groupe (sous-ensemble) de variables prédictives permettant de prévoir de la manière la plus adéquate les réponses de notre variable dépendante, sur une base de données de cinq variables explicatives et 60 observations.
1.Présentation de l’étude :
L’étude a été effectuée sur les oignions dans la région d’EL hajeb.
Elle avait pour but d’identifier les facteurs intervenant dans la production de ces oignions, et de de répondre à un certain nombre de questions en relation avec la production d’oignon.
La contribution moyenne de chaque facteur de production dans sa fonction de production ainsi que ceux les plus limitant.
Et voir comment on pourrait améliorer le rendement dans cette région.
- Base de données :
Dans ce travail on va essayer d’estimer la fonction de production de l’oignon ( rdt en T/ha) , afin de voir la meilleure combinaison de facteurs de production à utiliser, à savoir :
- La dose de semis à l’hectare en kg/ha.
- La quantité totale de fertilisants kg/ha.
- Le nombre total de traitements.
- La quantité d’eau apportée en irrigation en m3 par hectare.
- Le nombre d’heures de travail du sol.
Dans le but d’atteindre la quantité maximale d’outputs ‘le rendement’ étant données les contraintes naturelles et artificielles.
Tableau n°1 : Base de données.[pic 1]
2. Régression Linéaire Multiple :
- Modèle de régression multiple :
RDT = C (1) + C (2) X DOSE_SEMIS + C (3) X FERTILISANTS + C (4) X TRAITEMENTS+ C (5) X EAU+ C (6) X TRAVAIL_SOL + Ԑi
- C (1) ; C (2) ; C (3) ; C (4) ; C (5) ; C (6) : les coefficients à estimer du modèle
- Ԑi : erreur de spécification due aux facteurs non pris en considération dans le modèle.
D’autres facteurs sur lesquels on ne dispose d’aucune information peuvent également influencer le rendement.
- A vérifier avant de procéder à la régression : conditions sur le modèle :
Les conditions citées dessous doivent être remplies avant de pouvoir procéder à notre régression et pouvoir utiliser d’une part les tests statistiques d’appréciation la régression, et d’une autre part valider le modèle ajusté pour des besoins d’estimation.
H1 : Les variables explicatives sont sans erreurs et indépendantes.
H2 : La moyenne des résidus est égale à 0.
H3 : Les résidus sont indépendants (Absence de corrélation entre les résidus).
H4 : Les résidus ont une variance constante.
H5 : La covariance entre les variables explicatives et les termes d’erreur est égale à 0.
H6 : Les Résidus suivent la loi de normalité.
Signification globale du modèle :
Le Test de signification globale du modèle ‘’Test de Fisher’’, a pour objet de savoir si les variables explicatives considérées simultanément, dans le cas de notre étude de la production d’oignon, ont une liaison significative avec le ‘’Rendement’’.
Afin de tester la signification entre la variable dépendante et les variables explicatives, le test Fisher a été réalisé pour vérifier l’hypothèse nulle :
H0 : C (1) = C (2) = C (3) = C (4) = C (5) = C (6) = 0
H1 : ∃ C (1) et/ou C (2) et/ou C (3) et/ou C (4) et/ou C (5) et/ou C (6) ≠ 0
En utilisant E-VIEWS on obtient directement de la sortie de régression, le F de Fisher et sa significativité :
Tableau n°2 : Tableau de variance :
Source | DDL | Somme des carrés | Moyenne des carrés | F | Pr > F |
Modèle | 5 | 16434,545 | 3286,909 | 143,800 | < 0,0001 |
Erreur | 54 | 1234,305 | 22,858 | ||
Total corrigé | 59 | 17668,850 |
|
|
|
La variance obtenue nous informe sur la subdivision de la variation totale de la variable ‘’Rendement’’ en une part attribuée à l’inclusion de l’ensemble des variables explicatives et une autre part attribuée aux erreurs qui correspondent à la somme des carrés de déviations du ‘’Rdt ’’ par rapport à la meilleure droite (variation résiduelle).
Tableau n°3 : F-stat :
...