Les mesures de tendance centrale

Un article de IMSP - Formation continue.

Sommaire

Le mode

Le mode est la (ou les) valeur(s) ayant la plus grande fréquence observée dans une série

La moyenne arithmétique

La moyenne est le quotient de la somme des valeurs d'une série par le nombre de valeurs.

si chacune de n observations a une valeur xi, la valeur de la moyenne arithmétique \bar{x} est:

\bar{x} = \frac{\sum_{i=1}^n{x_i}}{n}

Lorsque l'on a affaire à des distributions de fréquences (discontinues), on peut calculer la moyenne pondérée \bar{x} en prenant pour xi la valeur centrale de l'intervalle de chaque catégorie multipliée par l'effectif fi de cette catégorie:

\bar{x} = \frac{\sum_{i=1}^n{f_i x_i}}{\sum_{i=1}^n{f_i}}

R

mean(objet$variable)

STATA

summ variable  # abbréviation de la commande "summarize"

La médiane

Dans une distribution de valeurs ordonnées d'un caractère statistique quantitatif, la médiane est une valeur telle que le nombre de valeurs qui lui sont inférieures est égal au nombre de valeurs qui lui sont supérieures.

En d'autres termes, la médiane est la valeur du caractère statistique qui divise la population ou série numérique en deux parties de taille égale.

On distingue deux cas de figure:

  • Si le nombre de valeurs n est impair, la médiane est la valeur centrale.
  • si le nombre de valeurs est pair, ls médiane est la moyenne des deux valeurs centrales.

La médiane correspond au deuxième quartile.

Caractéristiques

Image:Fiat_lux.png
  • Une distribution est dite symétrique si les valeurs de la variable sont dispersées de manière symétrique autour de la valuer centrale.
  • Dans une distribution parfaitement symétrique, la moyenne, la médiane et le mode sont égaux. C'est le cas par exemple d'une population dont la distribution suit la loi normale.
  • Contrairement à la moyenne, la médiane n'est pas influencée par les valeurs extrêmes ("outliers") d'une série.

R

median(objet$variable)

STATA

summ variable, detail   # La médiane correspond au 50ème percentile (définition)

Lectures recommandées

Pour continuer

Notions de base

  • Introduction
  1. Pourquoi R?
  2. Prise en main de R
  • Statistiques descriptives en pratique
  1. Analyse préliminaire avec R et STATA
  2. Analyse graphique avec R et STATA
  3. Préparation des données
  4. Automatiser le traitement des données
  5. Tabulations
  • Caractérisation des observations
  1. Les mesures de tendance centrale
  2. Les mesures de dispersion
  3. Tests de normalité
  4. Loi normale
  5. Les scores
  1. Intervalles de confiance
  2. La distribution de Khi-deux
  3. La distribution de Student
  4. Hypothèses et types d'erreur
  5. Valeurs de p
  6. Comparer deux moyennes
  7. Mesures appariées
  • Épidémiologie
  1. Les mesures de fréquence en épidémiologie
  2. Risque Relatif et Odds Ratio avec intervalles de confiance
  3. Test de khi-carré pour une table 2 x 2
  4. Test exact de Fisher
  5. Examens de dépistage, sensibilité, spécificité, valeur prédictive
  6. Mesures d'impact pour une exposition
  7. Épidémiologie des maladies transmissibles
  8. Confusion et modification d'effet
  9. Les types d'études
  10. Courbes de survie