Hypothèses et types d'erreur

Un article de IMSP - Formation continue.

Sommaire

Aspects généraux

Soit un monde objectif composé de faits. Pour chaque fait (F) il existe deux possibilités mutuellement exclusives, il est (F1) ou il n'est pas (F0).

Nous percevons le monde au moyen d'observations sur les faits, mais nous savons que nos sens (ou nos instruments de mesure) peuvent nous tromper. Nous cherchons à connaître le monde en proposant des hypothèses sur l'existence ou l'inexistence des faits.

Nous disposons de deux types d'hypothèses, mutuellement exclusives, "F n'est pas" (H0, hypothèse nulle) et "F est" (H1, hypothèse alternative). Selon l'état réel du monde, nos hypothèses peuvent s'avérer vraies ou fausses:

  • Si nous postulons "F n'est pas" (H0) et que F n'est pas dans le monde (F0), notre proposition est vraie.
  • Si nous postulons "F est" (H1) et que F est dans le monde (F1), notre proposition est vraie.
  • Si nous postulons "F est" (H1) et que F n'est pas dans le monde (F0), notre proposition est fausse et nous commettons une erreur du premier type, ou de type I.
  • Si nous postulons "F n'est pas" (H0) et que F est dans le monde (F1), notre proposition est fausse et nous commettons une erreur du deuxième type, ou de type II.

Ce qui peut se résumer dans la table suivante:


    État du monde
  F0 F1
notre proposition: nous acceptons H0 vraie erreur de type II (β)
Nous acceptons H1 erreur de type I (α) vraie


Image:Fiat_lux.png Par exemple, un tribunal commet une erreur de type I lorsqu'il condamne un innocent, et une erreur de type II lorsqu'il acquitte un coupable.

Il existe des données empiriques qui tendent à démontrer que psychologiquement, socialement et même du point de vue scientifique on serait plus tolérants envers les erreurs de type II (rejetter un fait pourtant existant) qu'envers les erreurs de type I (affirmer un fait pourtant inexistant). Il existerait en outre une sorte de "parti pris" subjectif pour l'hypothèse nulle, un reflet de notre perception empirique selon laquelle les changements sont rares dans l'état du monde, jusqu'à preuve du contraire. Nous assumons la charge de cette preuve pour rejetter l'hypothèse nulle.

En pratique il est devenu habituel de raisonner en termes de rejet de l'hypothèse nulle: les erreurs des différents types impliquant que l'acceptation de l'hypothèse alternative n'est pas automatiquement vraie en cas de rejet de l'hypothèse nulle. Nous pouvons re-écrire le tableau précédent uniquement en termes de rejet ou de non-rejet de l'hypothèse nulle:


    État du monde
  F0 F1
notre proposition nous ne rejettons pas H0 vraie erreur de type II (β)
Nous rejettons H0 erreur de type I (α) vraie


Image:Fiat_lux.png Selon cette convention, l'erreur de type I (α) consiste à rejetter l'hypothèse nulle alors qu'elle est vraie. (exemple: affirmer qu'il y a une différence d'effet alors qu'il n'y en a pas). L'erreur de type II (β) consiste à ne pas rejetter l'hypothèse nulle alors qu'elle est fausse. (exemple: prétendre qu'il n'y a pas de différence d'effet alors qu'il y en a bien une). On la rencontre typiquement lorsque les effectifs sont trop faibles (pouvoir (1 − β) insuffisant).

Autre formulation possible: Nos observations constituent un échantillon d'une population dont nous connaissons certains aspects. Ce que nous testons en général, c'est si la distribution de notre échantillon appartient ou non à une famille de distributions compatibles avec une population donnée. Le tableau peut encore se formuler ainsi:


    État du monde
  F0 F1
notre proposition l'échantillon pourrait appartenir à une famille de distributions donnée avec une même moyenne
(nous ne rejettons pas H0)
vraie erreur de type II (β)
l'échantillon n'appartient pas à une famille de distributions donnée, mais à une famille avec une moyenne différente
(Nous rejettons H0)
erreur de type I (α) vraie


Niveau de signifiance

Il n'est pas possible de minimiser à la fois le risque d'erreur de type I et le risque d'erreur de type II. Pour tout ensemble de données les erreurs de type I et II présentent une relation inversée. La solution habituelle consiste à fixer un seuil maximal α, appelé niveau de signifiance, pour le risque d'erreur de type I, et d'opérer sur le risque d'erreur de type II (β)

Image:Attention.png Le niveau de signifiance α est la probabilité d'erreur de type I, c'est à dire le risque de rejetter à tort l'hypothèse nulle alors qu'elle est en fait vraie. Le niveau de signifiance est habituellement fixé à 0.05, soit 5%

Pouvoir d'un test

Le pouvoir d'un test mesure sa capacité à rejetter l'hypothèse nulle alors qu'elle est fausse.

Image:Attention.png En d'autres termes, le pouvoir est la probabilité de ne pas commettre une erreur de type II. Il se calcule en soustrayant de 1 le risque β de commettre une erreur de type II: Pouvoir = (1 − β). Idéalement nous voulons un pouvoir aussi proche de 1 que possible. Un intervalle de confiance large indique souvent un pouvoir faible.

Critique

Le formalisme des définitions précédentes semble avoir conduit à une application peu flexible et parfois automatique des méthodes, une situation qui n'est pas sans entraîner plusieurs effets indésirables:

  • Au niveau clinique ou de terrain, il n'est pas rare que des traitements ou interventions qui offrent des chances d'amélioration dans, par exemple, un tiers ou la motié des cas, soient considérés utiles, alors que la possibilité de les rejeter avec un seuil de signifiance à 0.05 est réelle. On aboutit à une dichotomie conflictuelle entre importance clinique et signifiance statistique.
  • L'insistance particulière sur le rejet de l'hypothèse nulle H0 aboutit à un biais de publication qui a été mis en évidence à de nombreuses reprises: les travaux qui démontrent un effet (rejet de H0) ont beaucoup plus de chances d'être publiés que ceux qui n'en démontrent pas: Les études publiées sont une sélection biaisée de l'ensemble des études effectuées (Altman 1991).

R

en construction

STATA

en cosntruction

Références

  • Altman DG (1991) Practical statistics for medical research. Chapman & Hall ISBN 0-412-27630-5

Pour continuer

Notions de base

  • Introduction
  1. Pourquoi R?
  2. Prise en main de R
  • Statistiques descriptives en pratique
  1. Analyse préliminaire avec R et STATA
  2. Analyse graphique avec R et STATA
  3. Préparation des données
  4. Automatiser le traitement des données
  5. Tabulations
  • Caractérisation des observations
  1. Les mesures de tendance centrale
  2. Les mesures de dispersion
  3. Tests de normalité
  4. Loi normale
  5. Les scores
  1. Intervalles de confiance
  2. La distribution de Khi-deux
  3. La distribution de Student
  4. Hypothèses et types d'erreur
  5. Valeurs de p
  6. Comparer deux moyennes
  7. Mesures appariées
  • Épidémiologie
  1. Les mesures de fréquence en épidémiologie
  2. Risque Relatif et Odds Ratio avec intervalles de confiance
  3. Test de khi-carré pour une table 2 x 2
  4. Test exact de Fisher
  5. Examens de dépistage, sensibilité, spécificité, valeur prédictive
  6. Mesures d'impact pour une exposition
  7. Épidémiologie des maladies transmissibles
  8. Confusion et modification d'effet
  9. Les types d'études
  10. Courbes de survie