Séries chronologiques et problèmes de stationnarité
Analyse sectorielle : Séries chronologiques et problèmes de stationnarité. Recherche parmi 300 000+ dissertationsPar manelC • 27 Avril 2015 • Analyse sectorielle • 5 241 Mots (21 Pages) • 688 Vues
Séries chronologiques et problèmes de stationnarité
Un exemple introductif
Soient deux séries aléatoires yt et xt définies comme suit :
yt = 10 + 0,37.t + t
xt = 1 + xt-1 + ’t avec x0 = 0
Pour t allant de 1 à 100 et où t et ’t sont deux séries d’aléas normaux, centrés, homoscédastiques d’écarts-type égaux à 1, indépendants entre les périodes et indépendantes entre elles.
Pour une simulation, ou réalisation particulière, des deux séries d’aléas indépendantes, on obtient les chroniques y et x figurées ci-dessous :
tandis que la régression de y sur x par les MCO donne les résultats suivants :
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 11394 11394 4908.14 <.0001
Error 98 227.49867 2.32142
Corrected Total 99 11621
Root MSE 1.52362 R-Square 0.9804
Dependent Mean 28.71548 Adj R-Sq 0.9802
Coeff Var 5.30591
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 11.23797 0.29232 38.44 <.0001
x 1 0.32590 0.00465 70.06 <.0001
Selon les critères traditionnels : très fort R2, excellent test F et surtout excellents tests de Student, on serait conduit à juger cette régression très bonne et le modèle sous-jacent envisagé très probant, alors même que les séries ont été créées de manière totalement autonome et indépendante, sans la moindre liaison a priori.
Ce phénomène fâcheux, dit de régression illusoire, ou fallacieuse (spurious regression) est dû ici à la présence d’une tendance de forme linéaire commune, et plus généralement à l’emploi de séries dites non-stationnaires.
Remarque : on comprend néanmoins mieux la liaison apparente en exprimant xt en fonction des aléas, par élimination répétée de xt-1, xt-2, etc. jusqu’à x0 ici supposé nul :
xt = x0 + t + (’1 + ’2 + … + ’t-1 + ’t) = t + (’1 + ’2 + … + ’t-1 + ’t)
Suites stationnaires
Définitions
On appelle suite aléatoire, processus aléatoire, ou encore processus stochastique, une suite temporelle de variables aléatoires : zt.
De même qu'on considérait la réalisation d'une va, ayant perdu son caractère aléatoire et utilisée notamment via les échantillons pour l'estimation concrète, on parle de réalisation ou de trajectoire pour désigner une suite d'observations ou chronique associées à un processus stochastique.
Une suite aléatoires zt est stationnaire (au sens faible, ou stationnaire tout court), si toutes les va ont même espérance E(zt) = E(zt’) = E(z), même variance 2(zt) = 2(zt’) = 2(z), et si les autocorrélations ne dépendent pas du temps, mais simplement de l’écart k entre les périodes considérées : corr(zt, zt+k) = corr(zt’, zt’+k) = k. En un mot, cela signifie que les caractéristiques probabilistes sont stables et inchangées au cours du temps.
Les quantités précédentes : espérance, variance, autocorrélations, lorsqu’elles existent, sont estimées par les quantités empiriques correspondantes (moyenne, variance, etc.) calculées sur une série d’observations de longueur suffisante de la chronique observée.
Remarque : plus largement une série aléatoire est asymptotiquement stationnaire, si les propriétés indiquées sont vérifiées asymptotiquement. Lorsque ce sera le cas, on supposera la stabilisation approximativement réalisée et on négligera désormais cette nuance.
Modèles autorégressifs, marches aléatoires, processus explosifs
Modèles de base
Les modèles autorégressifs (c’est à dire expliquant une variable par son passé, et éventuellement par d’autres variables) les plus simples sont ceux de la forme :
(1) xt = .xt-1 + t (où || < 1)
où l’on suppose que t est une suite de va normales centrées de même variance 2(et indépendantes (on dit encore que les aléas et sont normaux et identiquement et indépendamment distribués : iid, ou que leur suite aléatoire est un bruit blanc).
De la relation (1) découlent par éliminations successives :
xt = .xt-2 + (t-1+ t)
…
(1.1) xt = tx0 + (t1+ t2 … + t-1 + t)
Un tel processus autorégressif avec un seul retard exprimé est appelé processus AR(1) dans la terminologie des séries chronologiques.
Dans la décomposition de xt, on qualifie fréquemment le terme retardé : .xt-1, de part mémorisée et le terme t d’innovation.
Il est important de comprendre que xt dépend de tout le passé : x0, x1, … , xt-2, xt-1, mais cette mémoire de l’ensemble du passé est totalement transmise via l’observation immédiatement précédente xt-1.
On montre que la série xt est alors stationnaire (ou plutôt asymptotiquement stationnaire, et stationnaire
...