Intervalles de confiance
Un article de IMSP - Formation continue.
Ce chapitre est très inspiré par les chapitres 6 et 7 de Kirkwood et Sterne (2003), un modèle de clarté et de concision dans le domaine.
A l'intérieur d'un intervalle de confiance à p% on a p% de chances de trouver la valeur réelle d'une variable estimée. On peut encore le comprendre comme une l'ensemble de valeurs raisonnablement compatibles avec le résultat observé compte tenu des erreurs d'échantillonnage.
Le principe général est le même, le calcul de l'erreur standard est différent selon le cas:
Un seul échantillon
Soient μ la moyenne d'un échantillon aléatoire d'effectif n, p le seuil de probabilité souhaitée de l'intervalle de confiance (ex: 95% , 99%), σ l'écart-type de la population (lorsqu'il est connu) et SEM =
l'erreur standard de la moyenne.
L'intervalle de confiance au seuil p est estimé:
|
|
où score(p) est le score normalisé (rapporté à la loi normale ou à la distribution t de Student selon la taille de l'échantillon) correspondant à la probabilité p dans la distribution qui modélise le mieux l'erreur.
Dans le cas habituel où l'écart-type σ de la population n'est pas connu, il est remplacé par son estimateur, l'écart-type s de l'échantillon.
Image (inspirée par Norman et Streiner 2003): Intervalle de confiance à 95% autour de la moyenne observée μ. En bleu et en rouge: distributions normales de moyenne
et
correspondant aux deux extrêmes de la famille de distributions susceptibles de contenir la moyenne vraie pour cet intervalle.
s.e.: erreur standard
Ne pas confondre avec l'intervalle de référence
L' intervalle de référence nous informe de la variabilité des observations dans une population, alors que l' intervalle de confiance nous informe des valeurs possibles pour la moyenne de la population, compte tenu de la moyenne de l' échantillon. L'intervalle de confiance est toujours plus étroit que l'intervalle de référence.
L'intervalle de référence se calcule avec l'écart-type σ et la moyenne μ de la population, ainsi qu'avec le z-score z de la probabilité retenue (habituellement 0.05):
Importance de l'effectif d'échantillonnage
Le calcul de l'intervalle de confiance se fait différemment selon l'effectif d'échantillonnage n:
| |
|
Nous reprenons à la suite un tableau synoptique de Kirkwood et Sterne (2002):
μ: moyenne de l'échatillon
- n: effectif de l'échantillon
- σ: écart-type de la population (lorsqu'il est connu)
- s: écart-type de l'échantillon
- z': z-score (loi normale) pour le seuil de probabilité retenu (utilisé lorsque l'effectif des échantillons est important)
- t': t-score d'une distribution de Student avec (n - 1) degrés de liberté pour le seuil de probabilité retenu (utilisé lorsque l'effectif des échantillons est réduit).
z' et t' sont soit consultés dans une table, soit calculés à l'aide d'un logiciel adéquat.
| L'écart-type σ de la population n'est pas connu (cas habituel): | ||
|---|---|---|
| distribution de la population | ||
| taille échantillon n | approx. normale | non normale |
| 60 ou plus | |
|
| moins de 60 | | transformation de l'échelle et/ou re-échantillonnage |
| L'écart-type σ de la population est connu: | ||
| distribution de la population | ||
| taille échantillon n | approx. normale | non normale |
| 60 ou plus | |
|
| moins de 60 | | transformation de l'échelle et/ou re-échantillonnage |
D'autres auteurs (Voir notamment Altman DG 1991) sont d'avis qu'il faut employer la formule avec la distribution de Student dans tous les cas, puisque pour les grands échantillons elle se rapproche de la loi normale.
Intervalle de confiance lors de la comparaison de deux moyennes
Ce qui suit ne concerne pas le traitement des mesures appariées.
Grands effectifs (> 30) ou déviations standard des populations connues
On assume que les deux distributions à comparer suivent la loi normale. Sous cette condition,
- la distribution de la différence des distributions suit elle aussi une loi normale
- la moyenne de la différence des distributions est la différence entre les moyennes de population μ1 − μ0
- l'erreur standard de la différence des moyennes se calcule en combinant les erreurs standard de chacune des moyennes:
Lorsque les écarts-types des populations σ1 et σ0 ne sont pas connus (cas habituel) on les remplace par leur approximation, les écarts-types des échantillons s1 et s0:
Petits effectifs (< 30), déviations standard similaires
Pour les petits échantillons nous utilisons une distribution de Student pour modéliser l'erreur accrue. Il faut prendre en compte les degrés de liberté (-2)
le calcul de la déviation standard se simplifie:
comme l'écart-type de la population n'est pas connu, nous l'estimons à l'aide de s:
et s doit être calculé en combinant les erreurs standard des deux échantillons:
La formule pour l'intervalle de confiance est similaire à celle que l'on utilise pour un seul échantillon de petite taille. Remarquer que les effectifs n1 et n0 s'ajoutent et qu'on y soustrait deux degrées de liberté dans le calcul de t':
Petits effectifs, déviations standard très différentes
Il faut recourir à d'autres options:
- Chercher une transformation adéquate qui rapproche les distributions des données d'une loi normale.
- utiliser des méthodes non-paramétriques
- Recourir à des tests spécialisés
- Utiliser des méthodes de re-échantillonnage et simulation (bootstrap)
Intervalle de confiance pour les Odds Ratio et Risques Relatifs
Il est abordé dans le chapitre consacré au Risque Relatif et Odds Ratio
R
consulter d'abord qnorm() et
help(qnorm) ;
effectif d'échantillonnage important, écart-type de la population inconnu
exemple: calculer les intervalles de confiance à 95% et à 99% de la variable test001$p1ph1 (en assumant qu'elle suit une distribution normale).
La moyenne et l'écart-type de la population sont inconnues, nous allons utiliser l'écart-type de l'échantillon comme estimateur de l'écart-type de la population:
calculer d'abord la moyenne, l'écart-type et l'effectif:
> m <- mean(test001$p1ph1) ; > s <- sd(test001$p1ph1) ; > n <- length(test001$p1ph1) ; > m [1] 34.4 > s [1] 4.09 > n [1] 754
l'effectif est grand, nous allons donc utiliser la loi normale pour estimer l'erreur
calculer l'erreur standard:
> es <- s/sqrt(n) > es [1] 0.149
calcul de z pour le seuil à 95%:
Un seuil à 95% implique 0.25 % sur chaque extrême de la distribution soit p = 1 - ((1 - 0.95)/2) = 0.975
> z95 <- qnorm(0.975) ; > z95 [1] 1.96
calcul de l'intervalle de confiance proprement dit:
> erreur95 <- es * z95 > erreur95 [1] 0.2918 > gauche95 <- m - erreur95 > droite95 <- m + erreur95
intervalle:
> options(digits=5) > m [1] 34.397 > gauche95 [1] 34.105 > droite95 [1] 34.688
calcul de z pour le seuil à 99%: p = 0.995
> z99 <- qnorm(0.995) ; > z99 [1] 2.5758
> erreur99 <- es * z99 > erreur99 [1] 0.38349 > gauche99 <- m - erreur99 > droite99 <- m + erreur99
intervalle de confiance à 99%:
> m [1] 34.397 > gauche99 [1] 34.013 > droite99 [1] 34.78
effectif d'échantillonnage faible, écart-type de la population inconnu
Supposons qu'au lieu de disposer de 754 mesures, pour des raisons de terrain on n'en ait pu effectuer que 7 (les 7 premières de test001$p1ph1 par exemple). Calculer la moyenne et les intervalles de confiance à 95% et à 99%
> peu <- head(test001$p1ph1,7) > peu [1] 34 30 35 45 36 37 35
calculer d'abord la moyenne, l'écart-type et l'effectif:
> m <- mean(peu) > m [1] 36 > s <- sd(peu) > s [1] 4.5461 > n <- length(peu) > n [1] 7
n est faible, nous allons utiliser la distribution de Student pour estimer l'erreur. Consulter cette page, et
help(TDist) ;
calculer l'erreur standard comme dans le cas précédent:
> es <- s / sqrt(n) > es [1] 1.7182
les degrés de liberté:
> df <- n - 1 > df [1] 6
calcul de t pour le seuil à 95% (0.975):
> t95 <- qt(0.975,df=df) ;
On vérifie au passage que t95 (df=6) est beaucoup plus éloigné de la moyenne que z95
> t95 [1] 2.4469
calcul de l'intervalle de confiance proprement dit:
> erreur95 <- t95 * es > erreur95 [1] 4.2044 > gauche95 <- m - erreur95 > droite95 <- m + erreur95
et finalement:
> m [1] 36 > gauche95 [1] 31.796 > droite95 [1] 40.204
calcul de t pour le seuil à 99%:
> t99 <- qt(0.995,df=df) > t99 [1] 3.7074 > erreur99 <- t99 * es > erreur99 [1] 6.3703
l'intervalle de confiance à 99% est donc:
> m [1] 36 > gauche99 [1] 29.63 > droite99 [1] 42.37
L'exemple est caricatural mais illustre bien le degré d'incertitude lié aux petits échantillons.
effectif d'échantillonnage important, écart-type de la population connu
Remarque: La variable test001$p1ph1 étant une mesure d'hématocrite, on pourrait imaginer qu'on dispose de valeurs de référence pour la population générale et les enfants de la région. Ce n'est malheureusement souvent pas le cas en Afrique, où d'après l'avis général [1] [2] les études de référence manquent. On sait pourtant que les valeurs hématologiques de base diffèrent significativement de celle des populations du nord, et qu'en outre elles présentent des fluctuations saisonnières dans les régions affectées par le paludisme. La plupart des valeurs publiées semblent basées sur des échantillons d'assez petite taille.
Pour les besoins de cet exercice, nous allons imaginer que nous disposons de valeurs de référence pour la population d'où provient l'échantillon. On utilisera les valeurs proposées dans [3].
| âge | %Hct (médiane) | intervalle de référence | n |
| 1 à 5 ans | 31.8 | 25.9 - 36.3 | 518 |
| 6 à 12 ans | 34.4 | 29.2-39.4 | 731 |
(nous n'aborderons pas la question de la taille de cette série considérée comme"population" pour les fins de cet exercice).
Nous allons procéder ainsi:
- Calculer les écarts-type des populations 1-5 ans et 6 à 12 ans à partir de la moyenne et l'intervalle de référence à 90% qui nous sont donnés,
- Utiliser ces écarts-type de "population" dans le calcul de l'intervalle de confiance pour nos échantillons.
L'intervalle de référence:
à
donc
= μ − 25.9 = 5.9 pour les 1 à 5 ans et 34.4 - 29.2 = 5.2 pour les 6-12 ans.
la valeur de p qui correspond à un intervalle de confiance de 90% est 0.95 (5% de part et d'autre de la moyenne), on calcule le z-score correspondant:
> z90 <- qnorm(0.95) > z90 [1] 1.6449
> s1a5 <- 5.9 / z90 > s1a5 [1] 3.5869
> s6a12 <- 5.2 / z90 > s6a12 [1] 3.161376
nous avons donc les écart-types pour les deux populations. Nous individualisons nos échantillons correspondants:
> cutvect <- ifelse(test001$p1age < 6, "A", "B") > cutvect <- ifelse(test001$p1age >= 1, cutvect,NA) > cutvect <- ifelse(test001$p1age < 13, cutvect,NA) > cutvect <- as.factor(cutvect) > summary(cutvect) A B NA's 372 376 6 > p1ph1.splitted <- split(test001$p1ph1,cutvect) > plot(density(p1ph1.splitted$A)) > lines(density(p1ph1.splitted$B),col='red',add=T) > lines(density(test001$p1ph1),col='blue',lty=3)
en noir: 1 à 5 ans. En rouge: 6 à 12 ans. En bleu: population d'ensemble. La bimodalité de la courbe de densité d'origine s'explique donc ici:
calculons maintenant l'intervalle de confiance à 95% pour nos échantillons, et en premier lieu l'erreur standard:
> m1 <- mean(p1ph1.splitted$A,na.rm=TRUE) > m2 <- mean(p1ph1.splitted$B,na.rm=TRUE) > m1 [1] 33.24731 > m2 [1] 35.55585 > n1 <-length(na.omit(p1ph1.splitted$A)) > n2 <-length(na.omit(p1ph1.splitted$B)) > es1 <- s1a5 / sqrt(n1) > es2 <- s6a12 / sqrt(n2) > es1 [1] 0.1859745 > es2 [1] 0.1630355
puis l'erreur: es * z95
> z95 <- qnorm(0.975) > erreur95_1 <- es1 * z95 > erreur95_2 <- es2 * z95 > gauche95_1 <- m1 - erreur95_1 > droite95_1 <- m1 + erreur95_1 > gauche95_2 <- m2 - erreur95_2 > droite95_2 <- m2 + erreur95_2
finalement, notre intervalle de confiance à 95% recalculé avec l'écart-type de la "population":
de 1 à 5 ans:
> m1 [1] 33.24731 > gauche95_1 [1] 32.88281 > droite95_1 [1] 33.61182
de 6 à 12 ans:
> m2 [1] 35.55585 > gauche95_2 [1] 35.23631 > droite95_2 [1] 35.87539
Effectif d'échantillonnage réduit, écart-type de la population connu
en construction
Exercice
Ecrire une fonction R qui accepte comme paramètres la moyenne, l'écart-type et l'effectif d'échantillonnage, et calcule les intervalles de confiance aus seuils 95% et 99%. La distribution de référence (loi normale ou distribution de Student) est sélectionnée en fonction de l'effectif (seuil à n=60). Une distribution approximativement normale de la population d'origine est supposée.
STATA
en construction
Lectures recommandées
Références
- Altman DG (1991) Practical statistics for medical research. Chapman & Hall ISBN 0-412-27630-5
- Kirkwood B, Sterne J.A.C. (2003) Essential Medical Statistics, second edition. Blackwell Science. ISBN 0-86542-871-9
- Norman GR, Streiner DL (2003) PDQ Statistics, third edition. BC Decker Inc, Hamilton, Ontario. ISBN 1-55009-207-3
Pour continuer
|
|

.

