06 Mar Glossaire
Il est facile de se perdre dans les différents termes statistiques. En créant pvalue.io, nous avons essayé d’harmoniser la terminologie de manière à ne pas complexifier une discipline pouvant paraître déjà bien obscure.
Dictionnaire des termes
Termes liés aux variables
Variable
Il s’agit d’une caractéristique (ou paramètre) démographique, de mode de vie, clinique ou paraclinique d’un patient.
Variable numérique
Variable dont les valeurs sont une quantité et dont on peut calculer une moyenne. Elles s’opposent en ce sens aux variables catégorielles ayant des nombres comme nom de classe. Exemple : l’âge.
Variable numérique continue
Variable pouvant prendre un nombre infini de valeurs.
Variable catégorielle
Variable qui prend pour valeur des modalités, des catégories ou bien des niveaux, par opposition aux variables numérique qui mesurent sur chaque individu une quantité (Wikipedia). Exemple : le sexe.
Classes
Ce sont les différentes modalités que peuvent prendre une variable catégorielle (par exemple masculin et féminin).
Variable à expliquer
Dans une analyse explicative, il s’agit de la variable que l’on souhaite décrire en fonction d’autres variables.
Variable explicative
Dans une analyse explicative, il s’agit d’une variable dont l’effet sur la variable à expliquer est connu ou supposé. C’est une variable dont on souhaite connaître l’influence sur la variable à expliquer.
Variable explicative principale
Variable explicative correspondant à l’hypothèse principale que l’on souhaite tester. Son effet est souvent ajusté par d’autres covariables.
Covariable
C’est une variable introduite dans un modèle statistique ajustant l’effet de la variable explicative (ou prédictive suivant l’objectif de l’analyse) principale sur la variable à expliquer (ou à prédire)
Variable prédictive
Il s’agit d’une variable qui est connue ou supposée avoir une influence sur la variable à prédire dont l’introduction dans le modèle de prédiction permet d’améliorer ses performances.
Variable accessoire
Il s’agit d’une covariable liée statistiquement avec la variable à expliquer ou la variable prédictive, dont l’introduction dans le modèle statistique permet d’améliorer les performances du modèle.
Variable de confusion
Covariable dont la présence a à la fois une influence sur la variable à expliquer/prédire, et sur une variable explicative/prédictive
Termes liés aux modèles statistiques
Modèle statistique
Un modèle statistique est une description mathématique approximative du mécanisme qui a généré les observations (Wikipedia). Les modèles de régression sont les modèles statistiques les plus utilisés en biostatistiques.
Ajustement
Utilisation de covariables dans un modèle statistique pour modifier l’effet de la variable explicative principale sur la variable à expliquer
Régression
Les modèles de régression sont les modèles statistiques les plus utilisés en biostatistiques. Ils permettent d’étudier la relation entre une variable (à expliquer ou à prédire) et une ou plusieurs autres (variable à expliquer principale et covariables ou prédicteurs)
Régression linéaire
Modèle de régression dont la variable à expliquer est numérique continue
Régression logistique
Modèle de régression dont la variable à expliquer est binaire (catégorielle à 2 classes)
Analyse de survie
Type d’analyse statistique dont la variable à expliquer est un évènement irréversible Lien vers la page correspondante. Une analyse de survie permet de produire des courbes de Kaplan-Meier.
Modèle de Cox
Il s’agit d’un modèle de régression de survie très utilisé en médecine.
Autres termes
Biais de confusion
Exemple simplifié tiré d’un exemple réel
Imaginons que l’on souhaite connaître la probabilité de survenue de cancer du poumon chez les buveurs de café. Si on fait un simple test statistique (test du Khi 2 dans ce cas), on s’apercevra qu’il existe une association significative entre les deux. Or, dans ce cas, ne pas ajuster serait une erreur, car il est nécessaire de prendre en compte (entre autres) le tabagisme comme variable de confusion.
L’association significative trouvée par le test du Khi2 serait due à la fois à l’association statistique entre tabagisme et cancer, et à la fréquence de consommation du café plus fréquente chez les fumeurs, constituant donc un fameux biais de confusion.
Synonymes
Variable dépendante
Synonyme de variable à expliquer ou à prédire suivant le type d’analyse
Variable d’ajustement
Synonyme de covariable
Variable indépendante
Synonyme de covariable + variable à expliquer principale ou de variable prédictive
Variable d’exposition
Synonyme de variable explicative principale
Variable qualitative
Synonyme de variable catégorielle
Variable quantitative
Synonyme de variable numérique
Prédicteur
Synonyme de variable prédictive
Aucun commentaire