Les scores

Un article de IMSP - Formation continue.

Sommaire

Le z-score ou score standard

Calcul du z-score d'une population

le z-score exprime la valeur d'une observation provenant d'une population connue en termes de distance à la moyenne mesurée en unités d'écart-type, d'où la notion de "standardisation". On l'obtient en calculant la différence entre l'observation x et la moyenne \overline{X} de la population et en la divisant par l'écart-type σ:

 z = \frac{x - \overline{X}}{\sigma}


Le z-score permet notamment de comparer des scores dans des échelles différentes, ou bien situer une variable par rapport à des valeurs de référence pour la population. Les z-scores peuvent etre transformés en leurs valeurs correspondantes dans la population en inversant le calcul:

x = z \sigma + \overline{X}

Calcul du z-score d'un échantillon et erreur standard

Dans le cas particulier où l'on cherche à comparer la moyenne \overline{x} d'un échantillon de n observations à la moyenne \overline{X} d'une population, le score z se calcule ainsi:

z = \frac{\overline{x} - \overline{X}}{\frac{\sigma}{\sqrt{n}}}

Le quotient de l'écart-type par la racine carrée du nombre d'observations, le rapport \frac{\sigma}{\sqrt{n}} étant connu comme l'erreur standard de la moyenne.

On remarquera que l'emploi du z-score requiert que la distribution de la population (moyenne, déviation standard) soit connue. Si elles ne sont pas connues, sous certaines conditions on peut employer la moyenne et l'écart-type d'un échantillon pris au hasard dans cette population. Si la moyenne de l'échantillon est un estimateur non biaisé de la moyenne de la population, ce n'est pas le cas pour l'écart-type de l'échantillon, qui dépend de la taille de l'échantillon.



La transformation linéaire

en construction

R

en construction

STATA

en construction

Voir aussi

Références

Pour continuer

Notions de base

  • Introduction
  1. Pourquoi R?
  2. Prise en main de R
  • Statistiques descriptives en pratique
  1. Analyse préliminaire avec R et STATA
  2. Analyse graphique avec R et STATA
  3. Préparation des données
  4. Automatiser le traitement des données
  5. Tabulations
  • Caractérisation des observations
  1. Les mesures de tendance centrale
  2. Les mesures de dispersion
  3. Tests de normalité
  4. Loi normale
  5. Les scores
  1. Intervalles de confiance
  2. La distribution de Khi-deux
  3. La distribution de Student
  4. Hypothèses et types d'erreur
  5. Valeurs de p
  6. Comparer deux moyennes
  7. Mesures appariées
  • Épidémiologie
  1. Les mesures de fréquence en épidémiologie
  2. Risque Relatif et Odds Ratio avec intervalles de confiance
  3. Test de khi-carré pour une table 2 x 2
  4. Test exact de Fisher
  5. Examens de dépistage, sensibilité, spécificité, valeur prédictive
  6. Mesures d'impact pour une exposition
  7. Épidémiologie des maladies transmissibles
  8. Confusion et modification d'effet
  9. Les types d'études
  10. Courbes de survie