statistique

Le modèle linéaire simple

On suppose que l’on dispose de deux suites finies d’observations (x_i) (1 ≤ i ≤ n) et (y_i) (1 ≤ i ≤ n), on cherche à expliquer les yi par les x_i. Plus précisément on souhaiterait établir une relation linéaire où les variations des xi provoquent les variations de yi, mais d’autres facteurs, ou des erreurs, vont perturber cette relation qui ne sera qu’approchée. Au lieu de se contenter de déterminer la droite d’ajustement linéaire, on va modéliser l’erreur ou l’écart. On écrit alors y_i = a x_i + b + εi 1 ≤ i ≤ n. où εi est une variable aléatoire réelle (dite erreur, résidu,….).

Comme a, b sont déterministes et les ε_i sont aléatoires, les y_i sont aussi des variables aléatoires. On écrira y_i,obs pour l’observation numérique des y_i .

Généralement l’indice est le temps en économétrie c’est pour cela qu’on adoptera en définitive la notation suivante du modèle.

y_t = ax_t + b + ε_t 1 ≤ t ≤ n

Exemple 1.

On cherche à établir une relation entre consommation et revenu :

x_t = R_t revenu de la période t

Lire Aussi: Le modèle COSO contrôle interne

y_t = C_t consommation de la période t

R_t	85	92	99	1088	116
C_t	82	88	93	102	110

Définition 1. Dans le modèle y_t = axt + b + ε_t 1 ≤ t ≤ n. x_t : est la variable explicative, ou exogène (mesurée sans erreur c’est une variable certaine).

y_t : est la variable expliquée, ou endogène. C’est une variable aléatoire.

ε_t : est la perturbation, le résidu ou l’erreur (attribuée à l’ensemble des facteurs non prise en compte).

a,b : sont des paramètres, ou des coefficients.

Toutes ces grandeurs ont des statuts différents, qu’on résume dans le tableau suivant :

	aléatoire	non aléatoire
observable	y_t	x_t
non observable	ε_t	a,b

Le but de l’étude du modèle linéaire simple est d’obtenir des informations sur la relation entre les y_t et les x_t, donc sur a et b c.à.d. ( estimation et tests sur a et b).

Remarque 1.

L’utilisation ici du modèle linéaire simple n’est pas dû à un hasard, bien au contraire, c’est quelque chose qui est imposé. En effet la modélisation mathématique la plus simple de Y = f(X) est une fonction affine , toute autre formes et il en existe, quadratique, exponentielle ou logarithmique seront très difficile à modéliser.

Estimation de a et b par la méthode des moindres carrés ordinaire (MCO)

On va estimer a et b (qui jouent le rôle de θ dans la théorie de l’estimation) par la méthode des MCO.

on cherche â, les estimateurs de a et b qui minimisent la somme des carrés des résidus.

Proposition 1. Les estimateurs de a et b par la MOC sont données par :

la méthode des moindres carrés ordinaire

Preuve 1. Il s’agit de minimiser la fonction Q(a, b), comme c’est une fonction de deux variables a et b nous devons chercher les équations normales c.à.d., les dérivées partielles par rapport à a et par rapport à b, et chercher après les points critiques. Les équations normales sont donc :