Intervalles de confiance

Un article de IMSP - Formation continue.

Ce chapitre est très inspiré par les chapitres 6 et 7 de Kirkwood et Sterne (2003), un modèle de clarté et de concision dans le domaine.


A l'intérieur d'un intervalle de confiance à p% on a p% de chances de trouver la valeur réelle d'une variable estimée. On peut encore le comprendre comme une l'ensemble de valeurs raisonnablement compatibles avec le résultat observé compte tenu des erreurs d'échantillonnage.


Le principe général est le même, le calcul de l'erreur standard est différent selon le cas:

Sommaire

Un seul échantillon

Soient μ la moyenne d'un échantillon aléatoire d'effectif n, p le seuil de probabilité souhaitée de l'intervalle de confiance (ex: 95% , 99%), σ l'écart-type de la population (lorsqu'il est connu) et SEM = \frac{\sigma}{\sqrt{n}}l'erreur standard de la moyenne.

L'intervalle de confiance au seuil p est estimé:

Image:Fiat_lux.png

              \mbox{IC } = \mu -  \left(score(p) \times \frac{\sigma}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left(score(p) \times \frac{\sigma}{\sqrt{n}}\right)

score(p) est le score normalisé (rapporté à la loi normale ou à la distribution t de Student selon la taille de l'échantillon) correspondant à la probabilité p dans la distribution qui modélise le mieux l'erreur.

Dans le cas habituel où l'écart-type σ de la population n'est pas connu, il est remplacé par son estimateur, l'écart-type s de l'échantillon.


Image (inspirée par Norman et Streiner 2003): Intervalle de confiance à 95% autour de la moyenne observée μ. En bleu et en rouge: distributions normales de moyenne \mu - (z \times s.e.) et \mu + (z \times s.e.) correspondant aux deux extrêmes de la famille de distributions susceptibles de contenir la moyenne vraie pour cet intervalle. s.e.: erreur standard \frac{s}{\sqrt(n)}

Ne pas confondre avec l'intervalle de référence

L' intervalle de référence nous informe de la variabilité des observations dans une population, alors que l' intervalle de confiance nous informe des valeurs possibles pour la moyenne de la population, compte tenu de la moyenne de l' échantillon. L'intervalle de confiance est toujours plus étroit que l'intervalle de référence.

L'intervalle de référence se calcule avec l'écart-type σ et la moyenne μ de la population, ainsi qu'avec le z-score z de la probabilité retenue (habituellement 0.05):

IR = (\mu - z_{(p)} \times \sigma)\ \grave{a}\  (\mu + z_{(p)} \times \sigma)


Importance de l'effectif d'échantillonnage

Le calcul de l'intervalle de confiance se fait différemment selon l'effectif d'échantillonnage n:

Image:Fiat_lux.png
  • Pour un effectif n important on présume que la moyenne d'échantillonnage tend vers une loi normale en vertu du théorème de la limite centrale. On assume que l'écart-type de l'échantillon s est un estimateur fidèle de l'écart-type de la population σ, l'erreur standard de la moyenne de l'échantillon \frac{\sigma}{\sqrt{n}} est alors estimée par \frac{s}{\sqrt{n}} .
  • Pour un effectif n faible le calcul fait appel à une distribution de Student avec (n - 1) degrés de liberté. Parmi les particularités intéressantes de la distribution de Student la principale est le fait que son kurtosis varie selon l'effectif de l'échantillon - on parle en fait du nombre de degrés de liberté (n - 1). Pour des grands nombres, la distribution de Student est proche de la distribution normale. Pour des faibles nombres, la distribution de Student est plus "étalée" (bradykurtique) que la loi normale, par conséquent les intervalles calculés à partir d'une distribution de Student sont plus amples.


Nous reprenons à la suite un tableau synoptique de Kirkwood et Sterne (2002):

μ: moyenne de l'échatillon

  • n: effectif de l'échantillon
  • σ: écart-type de la population (lorsqu'il est connu)
  • s: écart-type de l'échantillon
  • z': z-score (loi normale) pour le seuil de probabilité retenu (utilisé lorsque l'effectif des échantillons est important)
  • t': t-score d'une distribution de Student avec (n - 1) degrés de liberté pour le seuil de probabilité retenu (utilisé lorsque l'effectif des échantillons est réduit).

z' et t' sont soit consultés dans une table, soit calculés à l'aide d'un logiciel adéquat.


L'écart-type σ de la population n'est pas connu (cas habituel):
  distribution de la population
taille échantillon n approx. normale non normale
60 ou plus \mu -  \left( z' \times \frac{s}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( z' \times \frac{s}{\sqrt{n}}\right)  \mu -  \left( z' \times \frac{s}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( z' \times \frac{s}{\sqrt{n}}\right)
moins de 60 \mu -  \left( t' \times \frac{s}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( t' \times \frac{s}{\sqrt{n}}\right)  transformation de l'échelle et/ou re-échantillonnage
L'écart-type σ de la population est connu:
  distribution de la population
taille échantillon n approx. normale non normale
60 ou plus \mu -  \left( z' \times \frac{\sigma}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( z' \times \frac{\sigma}{\sqrt{n}}\right)  \mu -  \left( z' \times \frac{\sigma}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( z' \times \frac{\sigma}{\sqrt{n}}\right)
moins de 60 \mu -  \left( t' \times \frac{\sigma}{\sqrt{n}}\right)\ \ \grave{a}\ \  \mu + \left( t' \times \frac{\sigma}{\sqrt{n}}\right)  transformation de l'échelle et/ou re-échantillonnage


D'autres auteurs (Voir notamment Altman DG 1991) sont d'avis qu'il faut employer la formule avec la distribution de Student dans tous les cas, puisque pour les grands échantillons elle se rapproche de la loi normale.

Intervalle de confiance lors de la comparaison de deux moyennes

Ce qui suit ne concerne pas le traitement des mesures appariées.

Grands effectifs (> 30) ou déviations standard des populations connues

On assume que les deux distributions à comparer suivent la loi normale. Sous cette condition,

  • la distribution de la différence des distributions suit elle aussi une loi normale
  • la moyenne de la différence des distributions est la différence entre les moyennes de population μ1 − μ0
  • l'erreur standard de la différence des moyennes se calcule en combinant les erreurs standard de chacune des moyennes:

 erreur\ standard\ = \sqrt{(s.e._1^2 + s.e._2^2)} = \sqrt{\left(\frac{\sigma_1^2}{n_1} + \frac{\sigma_0^2}{n_0} \right)}

Lorsque les écarts-types des populations σ1 et σ0 ne sont pas connus (cas habituel) on les remplace par leur approximation, les écarts-types des échantillons s1 et s0:

 erreur\ standard\ = \sqrt{(s.e._1^2 + s.e._2^2)} = \sqrt{\left(\frac{s_1^2}{n_1} + \frac{s_0^2}{n_0} \right)}

Petits effectifs (< 30), déviations standard similaires

Pour les petits échantillons nous utilisons une distribution de Student pour modéliser l'erreur accrue. Il faut prendre en compte les degrés de liberté (-2)

le calcul de la déviation standard se simplifie:

erreur\ standard\ = \sigma \times \sqrt{\frac{1}{n_1} + \frac{1}{n_0}}


comme l'écart-type de la population n'est pas connu, nous l'estimons à l'aide de s:


erreur\ standard\ = s \times \sqrt{\frac{1}{n_1} + \frac{1}{n_0}}


et s doit être calculé en combinant les erreurs standard des deux échantillons:


s = \sqrt{\left(\frac{(n_1 - 1)s_1^2 + (n_0 - 1)s_0^2}{(n_1 + n_0 - 2)}\right)}


La formule pour l'intervalle de confiance est similaire à celle que l'on utilise pour un seul échantillon de petite taille. Remarquer que les effectifs n1 et n0 s'ajoutent et qu'on y soustrait deux degrées de liberté dans le calcul de t':


Intervalle\ de\ confiance\ = (\bar{x}_1 - \bar{x}_0) - (t' \times e.s.)\ \grave{a}\ (\bar{x}_1 - \bar{x}_0) + (t' \times e.s.)\ ,\ d.l. = (n_1 + n_0 - 2)

Petits effectifs, déviations standard très différentes

Il faut recourir à d'autres options:

  • Chercher une transformation adéquate qui rapproche les distributions des données d'une loi normale.
  • utiliser des méthodes non-paramétriques
  • Recourir à des tests spécialisés
  • Utiliser des méthodes de re-échantillonnage et simulation (bootstrap)

Intervalle de confiance pour les Odds Ratio et Risques Relatifs

Il est abordé dans le chapitre consacré au Risque Relatif et Odds Ratio

R

consulter d'abord qnorm() et

help(qnorm) ;

effectif d'échantillonnage important, écart-type de la population inconnu

exemple: calculer les intervalles de confiance à 95% et à 99% de la variable test001$p1ph1 (en assumant qu'elle suit une distribution normale).

La moyenne et l'écart-type de la population sont inconnues, nous allons utiliser l'écart-type de l'échantillon comme estimateur de l'écart-type de la population:

calculer d'abord la moyenne, l'écart-type et l'effectif:

> m <- mean(test001$p1ph1) ;
> s <- sd(test001$p1ph1) ;
> n <- length(test001$p1ph1) ;
> m
[1] 34.4
> s
[1] 4.09
> n
[1] 754

l'effectif est grand, nous allons donc utiliser la loi normale pour estimer l'erreur

calculer l'erreur standard:

> es <- s/sqrt(n)
> es
[1] 0.149

calcul de z pour le seuil à 95%:

Un seuil à 95% implique 0.25 % sur chaque extrême de la distribution soit p = 1 - ((1 - 0.95)/2) = 0.975

> z95 <- qnorm(0.975) ;
> z95
[1] 1.96

calcul de l'intervalle de confiance proprement dit:

> erreur95 <- es * z95
> erreur95
[1] 0.2918
> gauche95 <- m - erreur95
> droite95 <- m + erreur95

intervalle:

> options(digits=5)
> m
[1] 34.397
> gauche95
[1] 34.105
> droite95
[1] 34.688

calcul de z pour le seuil à 99%: p = 0.995

> z99 <- qnorm(0.995) ;
> z99
[1] 2.5758
> erreur99 <- es * z99
> erreur99
[1] 0.38349
> gauche99 <- m - erreur99
> droite99 <- m + erreur99

intervalle de confiance à 99%:

> m
[1] 34.397
> gauche99
[1] 34.013
> droite99
[1] 34.78

effectif d'échantillonnage faible, écart-type de la population inconnu

Supposons qu'au lieu de disposer de 754 mesures, pour des raisons de terrain on n'en ait pu effectuer que 7 (les 7 premières de test001$p1ph1 par exemple). Calculer la moyenne et les intervalles de confiance à 95% et à 99%

> peu <- head(test001$p1ph1,7)
> peu
[1] 34 30 35 45 36 37 35

calculer d'abord la moyenne, l'écart-type et l'effectif:

> m <- mean(peu)
> m
[1] 36
> s <- sd(peu)
> s
[1] 4.5461
> n <- length(peu)
> n
[1] 7

n est faible, nous allons utiliser la distribution de Student pour estimer l'erreur. Consulter cette page, et

help(TDist) ;

calculer l'erreur standard comme dans le cas précédent:

> es <- s / sqrt(n)
> es
[1] 1.7182

les degrés de liberté:

> df <- n - 1
> df
[1] 6

calcul de t pour le seuil à 95% (0.975):

> t95 <- qt(0.975,df=df) ;

On vérifie au passage que t95 (df=6) est beaucoup plus éloigné de la moyenne que z95

> t95
[1] 2.4469

calcul de l'intervalle de confiance proprement dit:

> erreur95 <- t95 * es
> erreur95
[1] 4.2044
> gauche95 <- m - erreur95
> droite95 <- m + erreur95

et finalement:

> m
[1] 36
> gauche95
[1] 31.796
> droite95
[1] 40.204

calcul de t pour le seuil à 99%:

> t99 <- qt(0.995,df=df)
> t99
[1] 3.7074
> erreur99 <- t99 * es
> erreur99
[1] 6.3703

l'intervalle de confiance à 99% est donc:

> m
[1] 36
> gauche99
[1] 29.63
> droite99
[1] 42.37

L'exemple est caricatural mais illustre bien le degré d'incertitude lié aux petits échantillons.

effectif d'échantillonnage important, écart-type de la population connu

Remarque: La variable test001$p1ph1 étant une mesure d'hématocrite, on pourrait imaginer qu'on dispose de valeurs de référence pour la population générale et les enfants de la région. Ce n'est malheureusement souvent pas le cas en Afrique, où d'après l'avis général [1] [2] les études de référence manquent. On sait pourtant que les valeurs hématologiques de base diffèrent significativement de celle des populations du nord, et qu'en outre elles présentent des fluctuations saisonnières dans les régions affectées par le paludisme. La plupart des valeurs publiées semblent basées sur des échantillons d'assez petite taille.

Pour les besoins de cet exercice, nous allons imaginer que nous disposons de valeurs de référence pour la population d'où provient l'échantillon. On utilisera les valeurs proposées dans [3].

âge  %Hct (médiane) intervalle de référence n
1 à 5 ans 31.8 25.9 - 36.3 518
6 à 12 ans 34.4 29.2-39.4 731

(nous n'aborderons pas la question de la taille de cette série considérée comme"population" pour les fins de cet exercice).

Nous allons procéder ainsi:

  1. Calculer les écarts-type des populations 1-5 ans et 6 à 12 ans à partir de la moyenne et l'intervalle de référence à 90% qui nous sont donnés,
  2. Utiliser ces écarts-type de "population" dans le calcul de l'intervalle de confiance pour nos échantillons.

L'intervalle de référence: \mu - (s \times z_{(p)}) à \mu + (s \times z_{(p)})

donc s \times z_{(p)} = μ − 25.9 = 5.9 pour les 1 à 5 ans et 34.4 - 29.2 = 5.2 pour les 6-12 ans.

la valeur de p qui correspond à un intervalle de confiance de 90% est 0.95 (5% de part et d'autre de la moyenne), on calcule le z-score correspondant:

> z90 <- qnorm(0.95)
> z90
[1] 1.6449


> s1a5 <-  5.9 / z90
> s1a5
[1] 3.5869
> s6a12 <- 5.2 / z90
> s6a12
[1] 3.161376

nous avons donc les écart-types pour les deux populations. Nous individualisons nos échantillons correspondants:

> cutvect <- ifelse(test001$p1age < 6, "A", "B")
> cutvect <- ifelse(test001$p1age >= 1, cutvect,NA)
> cutvect <- ifelse(test001$p1age < 13, cutvect,NA)
> cutvect <- as.factor(cutvect)
> summary(cutvect)
   A    B NA's
 372  376    6
> p1ph1.splitted <- split(test001$p1ph1,cutvect)
> plot(density(p1ph1.splitted$A))
> lines(density(p1ph1.splitted$B),col='red',add=T)
> lines(density(test001$p1ph1),col='blue',lty=3)

en noir: 1 à 5 ans. En rouge: 6 à 12 ans. En bleu: population d'ensemble. La bimodalité de la courbe de densité d'origine s'explique donc ici:


calculons maintenant l'intervalle de confiance à 95% pour nos échantillons, et en premier lieu l'erreur standard:

> m1 <- mean(p1ph1.splitted$A,na.rm=TRUE)
> m2 <- mean(p1ph1.splitted$B,na.rm=TRUE)
> m1
[1] 33.24731
> m2
[1] 35.55585
 
> n1 <-length(na.omit(p1ph1.splitted$A))
> n2 <-length(na.omit(p1ph1.splitted$B))
 
> es1 <- s1a5 / sqrt(n1)
> es2 <- s6a12 / sqrt(n2)
> es1
[1] 0.1859745
> es2
[1] 0.1630355


puis l'erreur: es * z95

> z95 <- qnorm(0.975)
> erreur95_1 <- es1 * z95
> erreur95_2 <- es2 * z95
 
> gauche95_1 <- m1 - erreur95_1
> droite95_1 <- m1 + erreur95_1
> gauche95_2 <- m2 - erreur95_2
> droite95_2 <- m2 + erreur95_2

finalement, notre intervalle de confiance à 95% recalculé avec l'écart-type de la "population":

de 1 à 5 ans:

> m1
[1] 33.24731
> gauche95_1
[1] 32.88281
> droite95_1
[1] 33.61182

de 6 à 12 ans:

> m2
[1] 35.55585
> gauche95_2
[1] 35.23631
> droite95_2
[1] 35.87539

Effectif d'échantillonnage réduit, écart-type de la population connu

en construction

Exercice

Ecrire une fonction R qui accepte comme paramètres la moyenne, l'écart-type et l'effectif d'échantillonnage, et calcule les intervalles de confiance aus seuils 95% et 99%. La distribution de référence (loi normale ou distribution de Student) est sélectionnée en fonction de l'effectif (seuil à n=60). Une distribution approximativement normale de la population d'origine est supposée.

STATA

en construction

Lectures recommandées

Altman DG (1996) Intervalles de confiance : indications du degré de certitude des résultats de recherches. EBM Journal 4

Références

  • Altman DG (1991) Practical statistics for medical research. Chapman & Hall ISBN 0-412-27630-5
  • Kirkwood B, Sterne J.A.C. (2003) Essential Medical Statistics, second edition. Blackwell Science. ISBN 0-86542-871-9
  • Norman GR, Streiner DL (2003) PDQ Statistics, third edition. BC Decker Inc, Hamilton, Ontario. ISBN 1-55009-207-3

Pour continuer

Notions de base

  • Introduction
  1. Pourquoi R?
  2. Prise en main de R
  • Statistiques descriptives en pratique
  1. Analyse préliminaire avec R et STATA
  2. Analyse graphique avec R et STATA
  3. Préparation des données
  4. Automatiser le traitement des données
  5. Tabulations
  • Caractérisation des observations
  1. Les mesures de tendance centrale
  2. Les mesures de dispersion
  3. Tests de normalité
  4. Loi normale
  5. Les scores
  1. Intervalles de confiance
  2. La distribution de Khi-deux
  3. La distribution de Student
  4. Hypothèses et types d'erreur
  5. Valeurs de p
  6. Comparer deux moyennes
  7. Mesures appariées
  • Épidémiologie
  1. Les mesures de fréquence en épidémiologie
  2. Risque Relatif et Odds Ratio avec intervalles de confiance
  3. Test de khi-carré pour une table 2 x 2
  4. Test exact de Fisher
  5. Examens de dépistage, sensibilité, spécificité, valeur prédictive
  6. Mesures d'impact pour une exposition
  7. Épidémiologie des maladies transmissibles
  8. Confusion et modification d'effet
  9. Les types d'études
  10. Courbes de survie