Projet économétrique, cas des Etats-Unis
Étude de cas : Projet économétrique, cas des Etats-Unis. Recherche parmi 300 000+ dissertationsPar Bafetimbi • 12 Janvier 2017 • Étude de cas • 3 443 Mots (14 Pages) • 854 Vues
Université de Strasbourg M2 APE
UFR Economie et Gestion
Evolution des hiérarchies urbaines et modèle de Zipf : cas des Etats-Unis
9 janvier 2017 HILLION - ABUALHAIGA
2
Sommaire
Introduction du modèle de Zipf ............................................................. 4
Estimation des paramètres du modèle de Zipf ...................................... 5
Interprétation des paramètres ................................................................ 6
Evolution des paramètres....................................................................... 9
Les limites du modèle de Zipf : le modèle de Rosen et Resnick ........ 10
Comparaison des modèles ................................................................... 12
Test de significativité du paramètre .................................................. 12
Conclusion ........................................................................................... 13
Validation empirique de la loi de Zipf :
cas des Etats-Unis[pic 1]
Introduction du modèle de Zipf
La loi de Zipf, du nom de son auteur, est une observation empirique concernant la fréquence des mots dans un texte. Cette loi prévoit que dans un texte donné, la fréquence d’occurrence d’un mot est liée à son rang dans
l’ordre d’occurrence par une relation de la forme avec une constante positive. De nombreux auteurs du XXème siècle se sont demandé si l’on pouvait[pic 2]
réadapter cette loi à d’autres sujets, notamment aux hiérarchies urbaines et leurs
évolutions. Autrement dit, existe-il une relation inverse entre le nombre d’habitants d’une ville et son rang en termes de taille dans son pays? Nous y répondrons empiriquement en examinant le cas particulier des 100 plus grandes villes des Etats-Unis en 1990, 2000 et 2010.
Graphique A. Taille des 100 plus grandes villes des Etats-Unis en fonction de leur rang en 1990, 2000 et 2010
9000000
8000000
7000000
6000000
Taille en 1990 Taille en 2000 Taille en 2010
[pic 3][pic 4]
5000000
4000000
3000000
2000000
1000000
0
0 10 20 30 40 50 60 70 80 90 100
Source : Citypopulation
Graphiquement, on observe dans le cas des Etats-Unis une relation inverse entre la taille des 100 plus grandes villes et leur rang en 1990, 2000 et 2010 (cf. graphique A). On peut ainsi supposer que pour chacune des 3 dates observées t :[pic 5]
, Ri
i[pic 6][pic 7]
avec villes i parmi les 100 plus grandes des Etats-Unis à la date t :
- Ri le rang (entier positif) de la ville i ;
- Ti la taille en nombre d’habitants (entier positif) de la ville i.
En passant au logarithme népérien cette relation, on établit à chacune des trois années t le modèle de régression simple de Zipf suivant :
, ln( R ) ln( ) ln(T )
i i i
avec
( i )1i 100 perturbations vérifiant les hypothèses classiques de la régression :
- , E(i)=0;
- , Var(i)=2 (variance résiduelle du modèle) ;
- Cov(i,j)=0;
- , i (0,2).
Estimation des paramètres du modèle de Zipf
Il s’agit d’estimer les trois paramètres du modèle : Les deux premiers sont estimés par la méthode des moindres carrés ordinaires (MCO) i.e en minimisant la somme des erreurs au carré entre les log des rangs observés des villes et ceux estimés par le modèle de Zipf. En notant, pour
chaque année t,
ln( ) et les estimateurs de et on a :
...