On considère une population telle que pour le caractère
observé la proportion p d'une certaine catégorie est inconnue.
On souhaite estimer cette proportion p de cette classe population à
partir d'un échantillon de taille n dont la fréquence de
la catégorie étudiée est f.
Soit F la variable aléatoire qui à chaque échantillon
de taille n associe la fréquence du nombre d'élément
qui appartiennent à la catégorie choisie.
On sait que F suit approximativement une loi N( p
; = )
avec pour n suffisamment grand ( n > 30 ) ( voir
loi d'échantillonnage )
est l'écart type associé à la fréquence f
de l'échantillon de taille n
On se sert de l'estimation ponctuelle de
puisque p est inconnue :
Donc la variable aléatoire T définie par :
suit approximativement une loi normale centrée réduite N(0
; 1) ( voir loi normale )
On cherche un intervalle de confiance de la fréquence p, c'est
à dire un intervalle tel que la probabilité que la fréquence
p appartienne à cet intervalle soit égale à
où
[0 ; 1]. On appelle cet intervalle de confiance avec le coefficient de
confiance ou avec
le risque 1 - .
Le risque que l'on prend à dire que p appartient à cet intervalle
est donc de 1 - .
Déterminons cet intervalle de confiance :
Soit t le nombre
réel positif tel que P( - t
T
t ) =
on a donc 2 (t
) - 1 =
d'où t
est tel que (t
) = 1 - /2
et :
L'intervalle de confiance de la fréquence p avec un coefficient
de confiance de est
: