Le but des lois théoriques est la description des phénomènes statistiques dont le but de calculer la probabilité de certains événements et donc d’avoir une certaine représentation de l’avenir.
Nous étudierons au cours de cet article la loi hypergéométrique.
Table de matières
Définition de la loi hypergéométrique
La loi hypergéométrique intervient dans le cas de plusieurs expériences aléatoires dépendantes aux quelles on associe un caractère étudié quelconque.
La probabilité de succès varie d’une expérience aléatoire à l’autre. C’est le cas des prélèvements d’individus au hasard dans une population finie, lorsque les individus ne sont pas remis en place au fur et à mesure des prélèvements.
Désignons par N l’effectif total de la population dans laquelle on prélève au hasard et sans remise n individus. La population est composée d’individus qui possèdent le caractère étudié, le nombre de ces individus sera désigné par n1. n2 désigne le nombre d’individus de la population qui ne possèdent pas le caractère étudié.
N = n1 + n2
La variable aléatoire X, qui caractérise le nombre d’individus prélevés qui possèdent le caractère étudié, est appelée variable hypergéométrique, elle prend les valeurs entières de 0 à
n.
La probabilité d’obtenir x individus possédant le caractère étudié parmi les n individus prélevés et donc (n-x) individus ne possédant pas le caractère étudié est, pour x = 0, 1, …, n :
La loi hypergéométrique dépend de trois paramètres :
- N = effectif total de la population ;
- n1 = nombre d’individus de la population qui possèdent le caractère étudié ;
- n = nombre d’individus prélevés sans remise.
Une variable aléatoire X qui sui une loi hypergéométrique de paramètres N, n1, et n est
désignée par :
X = H(N, n1 , n)
Caractéristiques d’une variable hypergéométrique
Les distributions hypergéométriques possèdent des propriétés semblables à celles des distributions binomiales.
La proportion des individus de la population qui possèdent le caractère étudié est :
p = n1/N
La proportion des individus de la population qui ne possèdent pas le caractère étudié est :
q = n2/N
- Espérance mathématique :
E(X) = np
- Variance et écart-type :
Exemple :
Dans une population de 40 personnes, dont 6 personnes sont originaires du Sud, 14 du Nord, 12 de l’Est et 8 de l’Ouest, on choisit au hasard un échantillon de 4 personnes.
La variable aléatoire X désigne le nombre d’individus de l’échantillon qui sont originaire du Nord.
La population étant finie et les prélèvements s’effectuent sans remise, la variable X suit donc une loi hypergéométrique de paramètres :
- N = effectif total de la population = 40
- n1 = nombre d’individus de la population qui sont originaires du Nord = 14
- n = nombre d’individus prélevés sans remise = 4
X = H(40, 14, 4)
La distribution de cette variable est telle que, pour x = 0, 1, 2, 3, 4 :
Distribution de probabilité de X
x | p(x) |
0 1 2 3 4 | 0,1636 0,3983 0,3236 0,1036 0,0110 |
Total | 1 |
La proportion des individus de la population qui sont originaires du Nord est :
p = 14/40 = 0,35
La proportion des individus de la population qui ne sont pas originaires du Nord est :
q = 26/40 = 0,65
- Espérance mathématique :
E(X) = np = 4 × 0,35 = 1,4
- Variance et écart-type :
V(X) = [ (N-n)/N-1] npq = [ (40-4)/40-1] 4 × 0,35 × 0,65 = 0,84
- Ecart type :
σ = √0,84 = 0,92
Approximation de la loi hypergéométrique par la loi binomiale
Dès que l’effectif N de la population devient important, le calcul de
devient fastidieux. On peut démonter dans ce cas que lorsque l’effectif de la population (N) tend vers l’infini et la proportion des individus possédant le caractère étudié (p) est constante ou tend vers une constante, la loi hypergéométrique tend vers une loi binomiale de paramètre n et p.
On peut dans ce cas effectuer les calculs de probabilités de façon approximatives à l’aide de la formule de la loi binomiale. En pratique, l’approximation est satisfaisante dés que la proportion des individus prélevés est inférieure à 5 %.
n/N < 0,05 ou N > 20 n
Exemple :
Soit la variable hypergéométrique H(100, 30, 4)
La distribution de cette variable est telle que, pour x = 0, 1, 2, 3, 4 :
Distribution de probabilité de X = H(100, 30, 4)
x | p(x) |
0 1 2 3 4 | 0,2338 0,4188 0,2679 0,0725 0,0070 |
Total | 1 |
La distribution de cette variable peut être calculée à l’aide de l’approximation par la loi binomiale de paramètres 4 et 0,3. Les probabilités approximatives sont telle que, pour x = 0,
1, 2, 3, 4 :
Distribution de probabilité de X = B(4 ; 0,3)
x | p(x) |
0 1 2 3 4 | 0,2401 0,4116 0,2646 0,0756 0,0081 |
Total | 1 |
On constate que l’approximation est satisfaisante.