On suppose que l’on dispose de deux suites finies d’observations (xi) (1 ≤ i ≤ n) et (yi) (1 ≤ i ≤ n), on cherche à expliquer les yi par les xi. Plus précisément on souhaiterait établir une relation linéaire où les variations des xi provoquent les variations de yi, mais d’autres facteurs, ou des erreurs, vont perturber cette relation qui ne sera qu’approchée. Au lieu de se contenter de déterminer la droite d’ajustement linéaire, on va modéliser l’erreur ou l’écart. On écrit alors yi = a xi + b + εi 1 ≤ i ≤ n. où εi est une variable aléatoire réelle (dite erreur, résidu,….).
Comme a, b sont déterministes et les εi sont aléatoires, les yi sont aussi des variables aléatoires. On écrira yi,obs pour l’observation numérique des yi .
Généralement l’indice est le temps en économétrie c’est pour cela qu’on adoptera en définitive la notation suivante du modèle.
yt = axt + b + εt 1 ≤ t ≤ n
Lire Aussi: Leadership Theories
Exemple 1.
On cherche à établir une relation entre consommation et revenu :
xt = Rt revenu de la période t
Lire Aussi: L'Impact de la Motivation des Salariés sur la Performance de l'Entreprise
yt = Ct consommation de la période t
Rt | 85 | 92 | 99 | 1088 | 116 |
Ct | 82 | 88 | 93 | 102 | 110 |
Définition 1. Dans le modèle yt = axt + b + εt 1 ≤ t ≤ n. xt : est la variable explicative, ou exogène (mesurée sans erreur c’est une variable certaine).
yt : est la variable expliquée, ou endogène. C’est une variable aléatoire.
Lire Aussi: Audit of Production Processes: Optimizing Operational Efficiency
εt : est la perturbation, le résidu ou l’erreur (attribuée à l’ensemble des facteurs non prise en compte).
a,b : sont des paramètres, ou des coefficients.
Toutes ces grandeurs ont des statuts différents, qu’on résume dans le tableau suivant :
aléatoire non aléatoire observable yt xt non observable εt a,b
Le but de l’étude du modèle linéaire simple est d’obtenir des informations sur la relation entre les yt et les xt, donc sur a et b c.à.d. ( estimation et tests sur a et b).
Remarque 1.
L’utilisation ici du modèle linéaire simple n’est pas dû à un hasard, bien au contraire, c’est quelque chose qui est imposé. En effet la modélisation mathématique la plus simple de Y = f(X) est une fonction affine , toute autre formes et il en existe, quadratique, exponentielle ou logarithmique seront très difficile à modéliser.
Estimation de a et b par la méthode des moindres carrés ordinaire (MCO)
On va estimer a et b (qui jouent le rôle de θ dans la théorie de l’estimation) par la méthode des MCO.
on cherche â, les estimateurs de a et b qui minimisent la somme des carrés des résidus.
Proposition 1. Les estimateurs de a et b par la MOC sont données par :
Preuve 1. Il s’agit de minimiser la fonction Q(a, b), comme c’est une fonction de deux variables a et b nous devons chercher les équations normales c.à.d., les dérivées partielles par rapport à a et par rapport à b, et chercher après les points critiques. Les équations normales sont donc :
On vérifie bien qu’il s’agit d’un minimum en calculant le déterminant de la matrice Hessienne tel que :
Exemple 2. Il s’agit de reprendre le tableau de l’exemple 1 sur la consommation et le revenu on a le tableau suivant :
Rt 85 92 99 1088 116 Ct 82 88 93 102 110