Loi hypergéométrique

Photo of author

Auteur

Le but des lois théoriques est la description des phénomènes statistiques dont le but de calculer la probabilité de certains événements et donc d’avoir une certaine représentation de l’avenir.

Nous étudierons au cours de cet article la loi hypergéométrique.

Définition de la loi hypergéométrique

La loi hypergéométrique intervient dans le cas de plusieurs expériences aléatoires dépendantes aux quelles on associe un caractère étudié quelconque.

Lire Aussi: Généralités sur la statistique

La probabilité de succès varie d’une expérience aléatoire à l’autre. C’est le cas des prélèvements d’individus au hasard dans une population finie, lorsque les individus ne sont pas remis en place au fur et à mesure des prélèvements.

Désignons par N l’effectif total de la population dans laquelle on prélève au hasard et sans remise n individus. La population est composée d’individus qui possèdent le caractère étudié, le nombre de ces individus sera désigné par n1. n2 désigne le nombre d’individus de la population qui ne possèdent pas le caractère étudié.

N = n1 + n2

Lire Aussi: La série chronologique statistique : cours avec exemples

La variable aléatoire X, qui caractérise le nombre d’individus prélevés qui possèdent le caractère étudié, est appelée variable hypergéométrique, elle prend les valeurs entières de 0 à
n.

La probabilité d’obtenir x individus possédant le caractère étudié parmi les n individus prélevés et donc (n-x) individus ne possédant pas le caractère étudié est, pour x = 0, 1, …, n :

Définition de la loi hypergéométrique

La loi hypergéométrique dépend de trois paramètres :

Lire Aussi: Le modèle linéaire simple

  • N = effectif total de la population ;
  • n1 = nombre d’individus de la population qui possèdent le caractère étudié ;
  • n = nombre d’individus prélevés sans remise.

Une variable aléatoire X qui sui une loi hypergéométrique de paramètres N, n1, et n est
désignée par :

X = H(N, n1 , n)

Caractéristiques d’une variable hypergéométrique

Les distributions hypergéométriques possèdent des propriétés semblables à celles des distributions binomiales.

La proportion des individus de la population qui possèdent le caractère étudié est :

p = n1/N

La proportion des individus de la population qui ne possèdent pas le caractère étudié est :

q = n2/N

  • Espérance mathématique :

E(X) = np

  • Variance et écart-type :
formule de la loi hypergéométrique

Exemple :

Dans une population de 40 personnes, dont 6 personnes sont originaires du Sud, 14 du Nord, 12 de l’Est et 8 de l’Ouest, on choisit au hasard un échantillon de 4 personnes.

La variable aléatoire X désigne le nombre d’individus de l’échantillon qui sont originaire du Nord.

La population étant finie et les prélèvements s’effectuent sans remise, la variable X suit donc une loi hypergéométrique de paramètres :

  • N = effectif total de la population = 40
  • n1 = nombre d’individus de la population qui sont originaires du Nord = 14
  • n = nombre d’individus prélevés sans remise = 4

X = H(40, 14, 4)

La distribution de cette variable est telle que, pour x = 0, 1, 2, 3, 4 :

exemple de la loi hypergéométrique

Distribution de probabilité de X

xp(x)
0
1
2
3
4
0,1636
0,3983
0,3236
0,1036
0,0110
Total1

La proportion des individus de la population qui sont originaires du Nord est :

p = 14/40 = 0,35

La proportion des individus de la population qui ne sont pas originaires du Nord est :

q = 26/40 = 0,65

  • Espérance mathématique :

E(X) = np = 4 × 0,35 = 1,4

  • Variance et écart-type :

V(X) = [ (N-n)/N-1] npq = [ (40-4)/40-1] 4 × 0,35 × 0,65 = 0,84

  • Ecart type :

σ = √0,84 = 0,92

Approximation de la loi hypergéométrique par la loi binomiale

Dès que l’effectif N de la population devient important, le calcul de

Approximation de la loi hypergéométrique par la loi binomiale

devient fastidieux. On peut démonter dans ce cas que lorsque l’effectif de la population (N) tend vers l’infini et la proportion des individus possédant le caractère étudié (p) est constante ou tend vers une constante, la loi hypergéométrique tend vers une loi binomiale de paramètre n et p.

On peut dans ce cas effectuer les calculs de probabilités de façon approximatives à l’aide de la formule de la loi binomiale. En pratique, l’approximation est satisfaisante dés que la proportion des individus prélevés est inférieure à 5 %.

n/N < 0,05 ou N > 20 n

Exemple :

Soit la variable hypergéométrique H(100, 30, 4)

La distribution de cette variable est telle que, pour x = 0, 1, 2, 3, 4 :

Approximation de la loi hypergéométrique par la loi binomiale exemple

Distribution de probabilité de X = H(100, 30, 4)

xp(x)
0
1
2
3
4
0,2338
0,4188
0,2679
0,0725
0,0070
Total1

La distribution de cette variable peut être calculée à l’aide de l’approximation par la loi binomiale de paramètres 4 et 0,3. Les probabilités approximatives sont telle que, pour x = 0,
1, 2, 3, 4 :

la variable hypergéométrique

Distribution de probabilité de X = B(4 ; 0,3)

xp(x)
0
1
2
3
4
0,2401
0,4116
0,2646
0,0756
0,0081
Total1

On constate que l’approximation est satisfaisante.

Laisser un commentaire