Une variable aléatoire X est une variable associée à une expérience ou à un groupe d’expériences aléatoires et servant à caractériser le résultat de cette expérience ou de ce groupe d’expériences.
On distingue les variables aléatoires discontinues ou discrètes et les variables aléatoires continues.
Table de matières
variables aléatoires discontinues
Définition d’une variable aléatoire discontinue
Une variable aléatoire est discrète si elle varie de façon discontinue, la variable ne peut prendre que des valeurs entières.
Lire Aussi: Loi hypergéométrique
Exemple :
- Soit X la variable aléatoire qui caractérise le résultat de l’expérience aléatoire « jet d’un dé homogène ».
X est une variable aléatoire discrète, elle peut prendre les valeurs entières 1, 2, 3, 4, 5, et 6.
- Soit X la variable aléatoire qui caractérise le nombre de garçons dans une famille de quatre enfants.
X est une variable aléatoire discrète, elle peut prendre les valeurs entières 0, 1, 2, 3, et 4.
Lire Aussi: Les indices statistiques (indices simples et indices synthétiques)
Distribution de probabilité
À chacune des valeurs x que peut prendre une variable aléatoire X, correspond une probabilité p(x), c’est la probabilité que la variable aléatoire X prenne la valeur x :
p(x) = p(X = x)
L’ensemble des valeurs admissibles x et des probabilités correspondantes p(x) constitue une distribution de probabilité discontinue. La relation entre x et p(x) est appelée loi de probabilité.
Lire Aussi: Le modèle linéaire simple
Pour toutes les distributions de probabilités dont les valeurs x correspondent à des événements complémentaires, le total des probabilités est égal à 1.
Σ p(x) = 1
La distribution cumulée des probabilités est appelée fonction de répartition :
Lire Aussi: La série chronologique statistique : cours avec exemples
Exemple :
Soit X la variable aléatoire qui caractérise le résultat de l’expérience aléatoire « jet d’un dé homogène ».
X est une variable aléatoire discrète, elle peut prendre les valeurs entières 1, 2, 3, 4, 5, et 6 avec la probabilité constante 1/6.
Lire Aussi: Loi binomiale – cours avec exemples applicatifs
Distribution de probabilité de X
x p(x) F(x) 1
2
3
4
5
61/6
1/6
1/6
1/6
1/6
1/6 1/6
2/6
3/6
4/6
5/6
6/6Total 1
Les variables aléatoires continues
Une variable aléatoire est continue si elle prend n’importe quelle valeur réelle appartenant à un intervalle donné.
Exemple :
- Le poids est une variable aléatoire continue.
- La taille est une variable aléatoire continue.
Un intervalle continu contient une infinité de valeurs. La probabilité d’obtenir exactement un résultat donné est généralement nulle, bien que ce résultat ne soit pas strictement impossible.
p(X = x) ≈ 0
La notion de distribution de probabilité n’a donc plus de sens dans le cas continu. Par contre la fonction de répartition conserve toute sa signification.
Pour une variable aléatoire continue, on calcule la probabilité d’observer une valeur comprise dans un intervalle donné [x ; x+∆x].
p(x ≤ X ≤ x+∆x) = p(X ≤ x+∆x) – p(X ≤ x) = F(x+∆x) – F(x)
Cette probabilité tend vers p(x) quand ∆x tend vers 0.
La fonction f(x), dérivée de la fonction de répartition F(x), est appelée fonction de densité de probabilité.
L’ensemble des valeurs admissibles pour une variable aléatoire continue et la fonction de densité de probabilité correspondante définissent une distribution de probabilité théorique continue.
Le produit f(x)dx est appelé élément de probabilité, c’est l’équivalent de la probabilité p(x) pour une variable aléatoire discontinue.
Pour une variable aléatoire continue, le cumul de la fonction de densité de probabilité est égal à 1 :
Exemple :
Soit une variable aléatoire continue X définie par la fonction de densité de probabilité :
Pour déterminer la constante k, il faut :
On en déduit par intégration la fonction de répartition F(x) :
III- Caractéristiques d’une variable aléatoire
1- Espérance mathématique
Définition d’une espérance mathématique
On appelle espérance mathématique la valeur moyenne de la variable, elle remplace la moyenne arithmétique dans le cas d’une variable statistique.
Exemple :
Soit X la variable aléatoire qui caractérise le nombre de garçons dans une famille de quatre enfants.
Distribution de probabilité de X
x p(x) F(x) 0
1
2
3
40,0625
0,2500
0,3750
0,2500
0,06250,0625
0,3125
0,6875
0,9375
1Total 1
E(X ) = Σx × p(x) = 0 × 0,0625 + 1 × 0,25 + 2 × 0,375 + 3 × 0,25 + 4 × 0,0625
E(X ) = 2
Dans une famille de quatre enfants on doit s’attendre à avoir deux garçons.
Exemple :
Soit une variable aléatoire continue X définie par la fonction de densité de probabilité :
Propriétés
L’espérance d’une fonction d’une variable X est :
- L’espérance d’une constante est la constante : E(a) = a
- L’espérance d’une transformation linéaire est la transformation linéaire de l’espérance :
E (ax + b) = Σ (ax × b) × p(x) = Σaxp (x) + Σbp(x)
E (ax + b) = aΣ xp(x) +bΣ p(x)
E (ax + b) = aE(x) + b
- L’espérance d’une somme est la somme des espérances :
E(X + Y) = E(X) + E(Y)
- L’espérance d’une différence est la différence des espérances :
E(X – Y) = E(X) – E(Y)
- L’espérance d’un produit est le produit des espérances si les variables sont indépendantes :
E(X × Y) = E(X) × E(Y)
Variance et écart type d’une variable aléatoire
Définition
Comme pour la moyenne, la variance d’une variable aléatoire conserve la même définition que la variance d’une variable statistique. C’est l’espérance mathématique des carrés des écarts par rapport à l’espérance.
L’écart type est égal à la racine carrée de la variance :
σ = √( V(X ))
La variance est calculée à partir de la formule développée suivante :
V(X) = E[(X – E(X))²] = E[X² – 2XE(X) + E(X)²]
V(X) = E(X²) – 2 E(X) E(X) + E(X)²
V(X) = E(X²) – E(X)²
La variance est donc égale à la différence entre l’espérance mathématique des carrés et le
carré de l’espérance mathématique.
Exemple :
Soit X la variable aléatoire qui caractérise le nombre de garçons dans une famille de quatre enfants.
Distribution de probabilité de X
x p(x) F(x) 0
1
2
3
40,0625
0,2500
0,3750
0,2500
0,06250,0625
0,3125
0,6875
0,9375
1Total 1
E(X ) = Σx × p(x) = 0 × 0,0625 + 1 × 0,25 + 2 × 0,375 + 3 × 0,25 + 4 × 0,0625 = 2
E(X²) = Σx2 × p(x) = 0² × 0,0625 + 1² × 0,25 + 2² × 0,375 + 3² × 0,25 + 4² × 0,0625 = 5
V(X) = E(X²) – E(X)² = 5 – 2² = 1
écart type est la racine carrée de 1 :
σ = √1 = 1
Exemple :
Soit une variable aléatoire continue X définie par la fonction de densité de probabilité :
Propriétés
- La variance d’une constante est nulle : V(a) = 0
- La variance d’une transformation linéaire est :
V (aX + b) = E[((aX + b) – E(aX + b))²]
V (aX + b) = E[(aX + b – aEX – b)²]
V (aX + b) = E[a²(X – E(X))²]
V (aX + b) = a²V (X)
- La variance d’une somme est la somme des variances si les variables sont indépendantes :
V(X + Y) = E[((X + Y) – E(X+Y))²]
V(X + Y) = E[(X + Y – E(X) – E(Y))²]
V(X + Y) = E[((X-E(X)) + (Y-E(Y)))²]
V(X + Y) = E[(X-E(X))² + 2 (X-E(X)) (Y-E(Y)) + (Y-E(Y))²]
V(X + Y) = E[(X-E(X))²] + 2 E[(X-E(X)) (Y-E(Y))] + E[(Y-E(Y))²]
Si X et Y sont indépendantes, on peut écrire :
E[(X-E(X)) (Y-E(Y))] = E(X-E(X)) E(Y-E(Y)) = 0
V(X + Y) = E[(X-E(X))²] + E[(Y-E(Y))²]
V(X + Y) = V(X) + V(Y)
- La variance d’une différence est la somme des variances si les variables sont indépendantes :
V(X – Y) = E[((X – Y) – E(X-Y))²]
V(X – Y) = E[(X – Y – E(X) + E(Y))²]
V(X – Y) = E[((X-E(X)) – (Y-E(Y)))²]
V(X – Y) = E[(X-E(X))² – 2 (X-E(X)) (Y-E(Y)) + (Y-E(Y))²]
V(X – Y) = E[(X-E(X))²] – 2 E[(X-E(X)) (Y-E(Y))] + E[(Y-E(Y))²]
Si X et Y sont indépendantes, on peut écrire :
E[(X-E(X)) (Y-E(Y))] = E(X-E(X)) E(Y-E(Y)) = 0
V(X – Y) = E[(X-E(X))²] + E[(Y-E(Y))²]
V(X – Y) = V(X) + V(Y)
- Variable centrée réduite
Une variable aléatoire est dite centrée si son espérance mathématique est nulle, elle est dite réduite si son écart-type est égal à 1.
Toute variable aléatoire peut être transformée en une variable centrée réduite par le changement de variable
Convergence en probabilité
On dit qu’une variable aléatoire Xn converge en probabilité vers une constante a si :
Ceci signifie que l’écart entre le paramètre calculé à partir de l’échantillon et la vraie valeur du paramètre de la population est très faible quand la taille de l’échantillon est grande. Cet écart peut être mesuré par la variance. Ainsi on parle de convergence en probabilité si :
Exemple 1 :
Soit Xn une variable aléatoire qui désigne le nombre de succès obtenus lors de n prélèvements dans une population finie de taille N et dont la proportion de succès est p.
Désignons par Fn = Xn / n la fréquence relative (pourcentage) des succès.
- Cas des prélèvements sans remise :
Dans ce cas la variable aléatoire Xn suit une loi hypergéométrique de paramètre N, n et p.
On sait que :
On démontre :
La fréquence relative Fn
converge en probabilité vers p.
- Cas des prélèvements avec remise :
Dans ce cas la variable aléatoire Xn suit une loi binomiale de paramètre n et p.
On sait que :
E(Xn) = n p et V(Xn) = n p q
On démontre :
La fréquence relative Fn converge en probabilité vers p.
Exemple 2 :
Soient Xi (i=1 à n) n variables aléatoires indépendantes et ayant la même loi de probabilité.
E(Xi) = m et V(Xi) = σ²
Désignons par :
la moyenne calculée à partir d’un échantillon de taille n.
- Cas des prélèvements sans remise :
On démontre :
La moyenne calculée à partir d’un échantillon de taille n converge en probabilité vers m.
- Cas des prélèvements avec remise :
On démontre :
La moyenne
calculée à partir d’un échantillon de taille n converge en probabilité vers m.
Inégalité de Biénaymé Tchebycheff
Cette inégalité concerne des probabilités relatives à des écarts par rapport à l’espérance mathématique supérieurs à k fois écart type, c’est à dire à des écarts centrés réduits (X- E(X)) / σ
Quelle que soit la variable aléatoire X, la probabilité d’un intervalle [E(X)-kσ , E(X)+kσ] a pour borne inférieure 1 – 1/k²
Si on pose k = ∈ / σ
l’inégalité peut être écrite :
Démonstration :
V (X ) = Σ(x – E(X ))² p(x)
On peut décomposer la variance en trois sommes :
V (X) = S1 + S2 + S3
avec :
L’inégalité de Biénaymé Tchebycheff est donc :