Le modèle linéaire simple

Photo of author

Auteur

On suppose que l’on dispose de deux suites finies d’observations (xi) (1 ≤ i ≤ n) et (yi) (1 ≤ i ≤ n), on cherche à expliquer les yi par les xi. Plus précisément on souhaiterait établir une relation linéaire où les variations des xi provoquent les variations de yi, mais d’autres facteurs, ou des erreurs, vont perturber cette relation qui ne sera qu’approchée. Au lieu de se contenter de déterminer la droite d’ajustement linéaire, on va modéliser l’erreur ou l’écart. On écrit alors yi = a xi + b + εi 1 ≤ i ≤ n. où εi est une variable aléatoire réelle (dite erreur, résidu,….).

Comme a, b sont déterministes et les εi sont aléatoires, les yi sont aussi des variables aléatoires. On écrira yi,obs pour l’observation numérique des yi .

Généralement l’indice est le temps en économétrie c’est pour cela qu’on adoptera en définitive la notation suivante du modèle.

Lire Aussi: La série chronologique statistique : cours avec exemples

yt = axt + b + εt 1 ≤ t ≤ n

Exemple 1.

On cherche à établir une relation entre consommation et revenu :

Lire Aussi: Loi hypergéométrique

xt = Rt revenu de la période t

yt = Ct consommation de la période t

Rt8592991088116
Ct828893102110

Définition 1. Dans le modèle yt = axt + b + εt 1 ≤ t ≤ n. xt : est la variable explicative, ou exogène (mesurée sans erreur c’est une variable certaine).

Lire Aussi: Les variables aléatoires

yt : est la variable expliquée, ou endogène. C’est une variable aléatoire.

εt : est la perturbation, le résidu ou l’erreur (attribuée à l’ensemble des facteurs non prise en compte).

a,b : sont des paramètres, ou des coefficients.

Toutes ces grandeurs ont des statuts différents, qu’on résume dans le tableau suivant :

aléatoirenon aléatoire
observable yt xt
non observable εta,b

Le but de l’étude du modèle linéaire simple est d’obtenir des informations sur la relation entre les yt et les xt, donc sur a et b c.à.d. ( estimation et tests sur a et b).

Remarque 1.

L’utilisation ici du modèle linéaire simple n’est pas dû à un hasard, bien au contraire, c’est quelque chose qui est imposé. En effet la modélisation mathématique la plus simple de Y = f(X) est une fonction affine , toute autre formes et il en existe, quadratique, exponentielle ou logarithmique seront très difficile à modéliser.

Estimation de a et b par la méthode des moindres carrés ordinaire (MCO)

On va estimer a et b (qui jouent le rôle de θ dans la théorie de l’estimation) par la méthode des MCO.

on cherche â, les estimateurs de a et b qui minimisent la somme des carrés des résidus.

la méthode des moindres carrés ordinaire (MCO)

Proposition 1. Les estimateurs de a et b par la MOC sont données par :

la méthode des moindres carrés ordinaire

Preuve 1. Il s’agit de minimiser la fonction Q(a, b), comme c’est une fonction de deux variables a et b nous devons chercher les équations normales c.à.d., les dérivées partielles par rapport à a et par rapport à b, et chercher après les points critiques. Les équations normales sont donc :

modèle linéaire simple
formule modèle linéaire

On vérifie bien qu’il s’agit d’un minimum en calculant le déterminant de la matrice Hessienne tel que :

Le modèle HessQ

Exemple 2. Il s’agit de reprendre le tableau de l’exemple 1 sur la consommation et le revenu on a le tableau suivant :

Rt8592991088116
Ct828893102110
Le modèle linéaire

Laisser un commentaire