Variable

Un article de IMSP - Formation continue.

Définition

Les données sont collectées à partir d'observations de caractéristiques qui peuvent varier selon les sujets ou cas.

On appelle ces caractéristiques des variables.

Les différents types de variables

Selon leur type, on distingue les variables qualitatives, qui caractérisent une certaine qualité du sujet, aussi connues comme variables catégoriques, et les variables quantitatives, qui représentent une quantité mesurable et sommable, aussi connues comme variables numériques. Les données numériques peuvent être discrètes ou continues.

Les variables quantitatives ou numériques

  • Une variable quantitative continue correspond à un nombre potentiellement infini de valeurs. Les variables quantitatives continues proviennent typiquement de mesures à l'aide d'instruments. Exemples: une longueur, une température, un poids...
  • alors qu'une variable quantitative discrète (ou discontinue) se caractérise par un nombre limité de valeurs possibles. Les variables quantitatves discrètes sont typiquement issues d'un comptage d'évènements, et dans ce cas elles se composent d'entiers positifs.
Pour une variable quantitative, le calcul des moments (somme, moyenne, écart-type, variance.. ) et des quantiles (médiane, quartiles, percentiles...) sont possibles.

Les variabes semi-quantitatives

Lorsque les variables numeriques sont composées par des unités non sommables, on parle de variables semi-quantitatives. La densité par unité de surface par exemple est une variable semi-quantitative (sauf lorsque les surfaces comparées sont identiques), tout comme le rang (position d'une observation donnée lorsqu'on classe sa valeur).

Les variables semi-quantitatives ne sont pas additives.

Pour les variables semi-quantitatives les quantiles sont calculables, mais pas les moments (somme, moyenne, variance... ).

Les variables qualitatives ou catégoriques

Les données catégoriques peuvent être ordinales (ordonnées), nominales (noon ordonnées) ou dichotomiques (deux valeurs possibles).

Les calculs possibles pour les variables qualitatives sont les comptages (comptage relatif et comptage absolu) que l'on regroupe en un tableau d'effectifs: le tri à plat.

Lorsqu'on étudie plusieurs variables qualitatives, on peut procéder à des comptages par couples de modalités: le tableau obtenu se nomme tableau de contingence ou tri croisé.

Image:Comment.pngUn test fréquemment utilisé pour déterminer si deux modalités qualitatives sont indépendantes est le test du chi-deux d'indépendance

Exercice

Examinez la table http://www.santepublique.org/fc/data/test001.csv et consultez la description des données Vous pouvez vous aider des procédures décrites dans analyse préliminaire avec R et STATA et préparation des données

  • pouvez-vous déterminer quelles sont les variables dans cette table?
  • lesquelles sont de nature qualitative?
  • lesquelles sont des variables quantitatives?
  • parmi les variables quantitatives ou numériques, pouvez-vous indiquer quelles sont les variables discrètes et les variables continues?

Résumez ces caractéristiques dans un tableau.

Références

Hunault G: Statistiques, Statistiques et probabilités, etc. (Univ. Angers)

Stockburger D (1996) Introductory statistics: methods, models and applications. Missouri State University

Pour continuer

Notions de base

  • Introduction
  1. Pourquoi R?
  2. Prise en main de R
  • Statistiques descriptives en pratique
  1. Analyse préliminaire avec R et STATA
  2. Analyse graphique avec R et STATA
  3. Préparation des données
  4. Automatiser le traitement des données
  5. Tabulations
  • Caractérisation des observations
  1. Les mesures de tendance centrale
  2. Les mesures de dispersion
  3. Tests de normalité
  4. Loi normale
  5. Les scores
  1. Intervalles de confiance
  2. La distribution de Khi-deux
  3. La distribution de Student
  4. Hypothèses et types d'erreur
  5. Valeurs de p
  6. Comparer deux moyennes
  7. Mesures appariées
  • Épidémiologie
  1. Les mesures de fréquence en épidémiologie
  2. Risque Relatif et Odds Ratio avec intervalles de confiance
  3. Test de khi-carré pour une table 2 x 2
  4. Test exact de Fisher
  5. Examens de dépistage, sensibilité, spécificité, valeur prédictive
  6. Mesures d'impact pour une exposition
  7. Épidémiologie des maladies transmissibles
  8. Confusion et modification d'effet
  9. Les types d'études
  10. Courbes de survie