06 Mar Régressions logistiques
- Lorsque la variable à expliquer est binaire et non censurée, le modèle statistique adapté est la régression logistique;
- Lorsqu’il n’existe qu’une seule variable explicative et que celle-ci est qualitative, la régression logistique donne un résultat similaire à un test du Chi2;
Si par exemple on souhaite expliquer la probabilité de naître du sexe masculin en fonction du régime alimentaire, Y est le sexe masculin, et X le régime alimentaire)
A quoi sert une régression logistique
Comme pour la régression linéaire et les modèles statistiques en général, la régression logistique permet réaliser des analyses multivariables, c’est-à-dire de prendre en compte les facteurs de confusion, contrairement aux tests répandus en médecine (de Student, du Khi2, de Mc Nemmar, etc); ces derniers permettant de réaliser une comparaison de seulement 2 variables entre elles.
Or, il est très fréquent de devoir prendre en compte les facteurs de confusion. Et dans ce cas, un test univariable n’est pas adapté.
Comment réaliser des régressions logistiques avec pvalue.io
La réalisation de régressions logistiques ne devrait vous poser aucun problème avec pvalue.io :
- Choisissez de réaliser une analyse explicative
- Sélectionnez la variable que vous souhaitez expliquer (Y) et les variables connues pour avoir une influence sur la variable à expliquer (X)
- Vérifiez qu’il n’y a pas d’erreurs d’après l’analyse des statistiques descriptives de chaque variable (en observant les graphiques et les tableaux générés)
- Transformez les variables qui ne sont pas liées linéairement à la variable à expliquer
Interprétation des résultats
Par défaut, les logiciels de statistique fournissent pour chaque variable X incluse dans le modèle, un coefficient, l’intervalle de confiance de ce coefficient et un petit p.
Le coefficient et son intervalle de confiance sont compris entre -∞ et + ∞.
Il est d’usage toutefois de présenter non pas le coefficient, mais plutôt son exponentielle; cette valeur se trouve alors bornée entre 0 et +∞.
On peut montrer mathématiquement que l’exponentielle du coefficient lorsque la variable X est catégorielle est l’odds-ratio.
Variables qualitatives
Si Y peut prendre deux valeurs : 0 (la référence) et 1 et que X peut prendre deux valeurs : A et B :
Si l’odds ratio de B vs A est supérieur à 1, la proportion de Y=1 est plus élevé lorsque X=B que lorsque X=A.
Variables quantitatives
L’interprétation des résultats concernant les variables X quantitatives ne peut être appréhendée sans connaître les mathématiques sous-jacents à la régression logistique : il s’agit de l’odds ratio de la moyenne de X+1 vs la moyenne de X.
Pour faire simple, si l’odds ratio est inférieur à 1, la variable X réduit la probabilité que la variable Y=1.
Dans l’exemple suivant, nous voulions savoir si le sexe de l’enfant (0 = féminin) dépendait de la technique utilisée et de l’âge des parents.
Odds Ratio [IC] | p | p global | ||
---|---|---|---|---|
Age madame | 1.00 [0.974, 1.03] | 0.9 | ||
Age monsieur | 0.995 [0.977, 1.01] | 0.6 | ||
Technique | ICSI vs FIV | 0.836 [0.66, 1.06] | 0.1 | 0.2 |
IMSI vs FIV | 0.836 [0.64, 1.09] | 0.2 |
Nous concluons ainsi :
- Ni l’âge de la mère, ni l’âge du père n’ont une influence sur la probabilité que l’enfant soit de sexe masculin (p > 0.05);
- La technique ICSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
- La technique IMSI ne modifie pas statistiquement la probabilité que l’enfant soit de sexe masculin (p > 0.05) par rapport à la FIV
- Globalement, la technique utilisée n’a pas d’influence sur la probabilité que l’enfant soit de sexe masculin (p global > 0.05)
gbané
Posté à 09:55h, 12 juilletParfait, c’est simple et très claire.
Tokpa Sompohi
Posté à 03:50h, 23 janvierje commence à mieux comprendre.