Variable
Un article de IMSP - Formation continue.
Définition
Les données sont collectées à partir d'observations de caractéristiques qui peuvent varier selon les sujets ou cas.
On appelle ces caractéristiques des variables.
Les différents types de variables
Selon leur type, on distingue les variables qualitatives, qui caractérisent une certaine qualité du sujet, aussi connues comme variables catégoriques, et les variables quantitatives, qui représentent une quantité mesurable et sommable, aussi connues comme variables numériques. Les données numériques peuvent être discrètes ou continues.
Les variables quantitatives ou numériques
- Une variable quantitative continue correspond à un nombre potentiellement infini de valeurs. Les variables quantitatives continues proviennent typiquement de mesures à l'aide d'instruments. Exemples: une longueur, une température, un poids...
- alors qu'une variable quantitative discrète (ou discontinue) se caractérise par un nombre limité de valeurs possibles. Les variables quantitatves discrètes sont typiquement issues d'un comptage d'évènements, et dans ce cas elles se composent d'entiers positifs.
| Pour une variable quantitative, le calcul des moments (somme, moyenne, écart-type, variance.. ) et des quantiles (médiane, quartiles, percentiles...) sont possibles. |
Les variabes semi-quantitatives
Lorsque les variables numeriques sont composées par des unités non sommables, on parle de variables semi-quantitatives. La densité par unité de surface par exemple est une variable semi-quantitative (sauf lorsque les surfaces comparées sont identiques), tout comme le rang (position d'une observation donnée lorsqu'on classe sa valeur).
| Les variables semi-quantitatives ne sont pas additives.
Pour les variables semi-quantitatives les quantiles sont calculables, mais pas les moments (somme, moyenne, variance... ). |
Les variables qualitatives ou catégoriques
Les données catégoriques peuvent être ordinales (ordonnées), nominales (noon ordonnées) ou dichotomiques (deux valeurs possibles).
Les calculs possibles pour les variables qualitatives sont les comptages (comptage relatif et comptage absolu) que l'on regroupe en un tableau d'effectifs: le tri à plat.
Lorsqu'on étudie plusieurs variables qualitatives, on peut procéder à des comptages par couples de modalités: le tableau obtenu se nomme tableau de contingence ou tri croisé.
| Un test fréquemment utilisé pour déterminer si deux modalités qualitatives sont indépendantes est le test du chi-deux d'indépendance |
Exercice
Examinez la table http://www.santepublique.org/fc/data/test001.csv et consultez la description des données Vous pouvez vous aider des procédures décrites dans analyse préliminaire avec R et STATA et préparation des données
- pouvez-vous déterminer quelles sont les variables dans cette table?
- lesquelles sont de nature qualitative?
- lesquelles sont des variables quantitatives?
- parmi les variables quantitatives ou numériques, pouvez-vous indiquer quelles sont les variables discrètes et les variables continues?
Résumez ces caractéristiques dans un tableau.
Références
Hunault G: Statistiques, Statistiques et probabilités, etc. (Univ. Angers)
Pour continuer
|
|
