23 Mar Analyses univariables et multivariables
- On peut généralement distinguer trois types d’analyses statistiques : les statistiques descriptives d’une seule variable, les analyses univariables (souvent nommées analyses univariées) et les analyses multivariables (à tort parfois nommées analyses multivariées)
- Les statistiques descriptives d’une seule variable permettent de décrire les données, et sont utiles pour y détecter des problèmes
- Les analyses univariables et multivariables permettent des comparaisons statistiques (obtention d’une p-value), et seules les analyses multivariables permettent de prendre en compte les facteurs de confusion
NB : Les termes univariés et multivariés ne sont plus recommandés[1] mais en pratique encore largement utilisés.
Statistiques descriptives d’une seule variable
Avant de démarrer une analyse statistique, il est nécessaire de bien connaître ses données. Quelle est la proportion de femmes ? Quel âge a le patient le plus âgé ?
Les statistiques descriptives d’une seule variable répondent à ces questions, et ont comme intérêt :
- D’identifier des outliers, c’est-à-dire des patients ayant des valeurs extrêmes.
- De vérifier la distribution des données : sont-elles distribuées suivant une loi normale ?
Imaginez que dans la colonne âge, un patient soit âgé de 182 ans; il est probable (à moins que vous fassiez une étude sur les jedi), qu’il y a eu une erreur quelque part.
Il va donc falloir retrouver l’âge réel de ce patient ou lui attribuer une valeur manquante. Si cette erreur n’est pas détectée et corrigée, alors les analyses statistiques prenant en compte l’âge seront complètement fausses.
Analyser les statistiques descriptives d’une seule variable est donc un préalable à toute analyse statistique, qu’elle soit univariable ou multivariable.
Les graphiques font partie intégrante des statistiques descriptives car elles permettent de visualiser rapidement la structure de vos données.
Une fois que vous avez sélectionné les variables que vous voulez décrire, pvalue.io crée automatiquement un tableau et un graphique.
Si la variable est quantitative, le tableau comporte moyenne, écart-type, médiane, 25ème et 75ème percentile, minimum et maximum; le graphique représente alors la distribution de la variable sous la forme d’un histogramme.
Si la variable est qualitative, le tableau donne l’effectif de chaque classe; le graphique représente la répartition dans chaque classe sous la forme d’un graphique en barre.
Analyses univariables
Les analyses univariables permettent de préciser la relation entre deux variables : la pression artérielle (variable 1) est-elle différente selon le sexe (variable 2) ? La proportion de fumeurs est-elle différente selon la couleur des yeux ? etc.
Le but des analyses univariables est de répondre à la question : la différence observée entre mes patients est-elle une vraie différence ou est-elle due au hasard ? Dans pvalue.io, les analyses univariables reposent sur des tests statistiques, permettant d’obtenir une p-value (qui est la probabilité que la différence observée soit due au hasard). Le choix de ces tests dépend des variables à comparer.
pvalue.io réalisera automatiquement ces tests dans un tableau et générera :
- Une boîtes à moustache si vous croisez une variable numérique avec une variable qualitative
- Un diagramme en barre si vous croisez deux variables qualitatives
- Une courbe de survie si vous réalisez des analyses de survie
- Un nuage de point si vous croisez deux variables numériques, ainsi que le lien linéaire calculé
Attention, les analyses univariables ne permettent pas de prendre en compte les facteurs de confusion. Prenons un échantillon dans lequel les femmes sont plus jeunes que les hommes. On veut savoir si le traitement a un effet différent sur la survie selon le sexe. Si on trouve un p < 0,05, est-ce le fait du sexe ou le fait de l’âge ?
Seul un essai randomisé permet de nous garantir une comparabilité des caractéristiques des patients entre les groupes. Dans ce schéma d’étude et seulement celui-là, les analyses univariables seules sont suffisantes. En dehors d’un essai randomisé, il est nécessaire d’utiliser des variables d’ajustement. C’est le but des analyses multivariables.
Analyses multivariables
Les analyses multivariables permettent d’ajouter des variables d’ajustement. Elles sont donc recommandées lorsqu’on cherche à établir un lien statistique entre plusieurs variables. Les analyses multivariables font appel à des méthodes statistiques plus sophistiquées que les analyses univariables, et sont rarement disponibles dans les logiciels à destination des non statisticiens.
Dans l’exemple précédent, l’ajustement sur l’âge permet de conclure : si les hommes et les femmes de mon échantillon avaient le même âge, alors l’effet du traitement serait (ou non) statistiquement significatif.
On réalise des analyses multivariées à l’aide de modèles statistiques. Les plus souvent mis en œuvre en médecine sont les régressions linéaires et logistiques, ainsi que les modèles de Cox.
Les modèles statistiques permettent d’obtenir des petits p. Ils ont un intérêt supplémentaire non négligeable : ils permettent de mesurer à quel point un facteur agit sur la variable d’intérêt. Ces mesures d’association sont :
- Les Odds Ratio pour les régressions logistiques
- Les Hazard Ratio pour les modèles de Cox
- Les Estimates ou les coefficients pour les régressions linéaires
La p-value renseigne sur la significativité statistique, les mesures d’association quantifient le lien entre deux variables.
La réalisation de modèles statistiques présuppose qu’un certain nombre de conditions de validité soient respectées.
[1] 1. Tsai AC. Achieving Consensus on Terminology Describing Multivariable Analyses. Am J Public Health. 2013;103(6):e1. doi:10.2105/AJPH.2013.301234
Adrien
Posté à 18:28h, 03 févrierj’ai pas bien compris, lorsqu’on travaille sur deux variable, est-ce de l’analyse univariée? Ne dis-t-on pas bivariée?
Kevin
Posté à 14:02h, 19 marsBonjour, c’est une très bonne question.
On peut en effet parler d’analyses bivariées lorsqu’on croise deux variables, mais le test statistique réalisé est alors appelé un test univarié (par contraste avec un test multivarié, la dénomination « tests bivariés » n’existe pas). Afin de simplifier, nous avons fait le choix de parler d’analyses univariées lorsqu’on réalise un test univarié.
Saïd Nourdine Samidine
Posté à 08:27h, 25 maiTrès bonne initiative .Un grand merci au concepteur .
Emmanuelle Albugues
Posté à 17:03h, 01 aoûtBonjour, comment faire pour comparer en univarié 2 sous groupes d’un tableau de recueil grâce à p-value ?
Merci d’avance
Emmanuelle
Kevin
Posté à 15:36h, 31 aoûtBonjour, la vidéo suivante vous montre la marche à suivre : https://fb.watch/7JWtAdqdXe/
emmanuel kapend
Posté à 09:47h, 08 marsbonjour chers tous. j’ai fait mes analyses des mes donnees pour mon memoire de DEA, apres avoir realisé les analyse univariées, je me rend compte que je ne possede que le petit p et non les odds ratio que faire dans ce cas svp.
merci d’avance
Kevin
Posté à 12:12h, 09 marsBonjour, tout à fait, il suffit de choisir : analyse multivariée ou explicative au lieu d’analyse univariée
Guehi
Posté à 22:11h, 09 marsMerci : j’apprends à analyser les articles de recherche selon la méthode IMDR et vous m’avez permis d’eclaircir ses deux notions.
Innocent
Posté à 09:45h, 08 juintrès bonne initiative..
Raphaël Yaradouno
Posté à 15:15h, 09 décembreMerci et merci d’avance !
Bonsoir Dr. mon étude est une CAP.
1-j’ai croisé le niveau de connaissance avec le niveau de pratique des parents en matière de santé bucco-dentaire de leur enfant, puis-je appeler cela analyse univariée ?
2- j’ai croisé le niveau d’instruction des parents avec leur niveau de connaissance, d’attitude et de pratique (j’ai obtenu 3 p value). Est-ce une analyse univariée ou multivariée ?
Kevin
Posté à 09:13h, 07 février1- oui, tout à fait
2- ça dépend si vous avez calculé indépendamment les pvalue
Ignace
Posté à 08:56h, 07 févrierEst-ce qu’une variable qui, au départ n’était pas statistiquement associée à ma variable dépendante peut se retrouver dans le modèle de régression logistique avec une p inférieure 0,05. .
C’est dire qu’en analyse bivarié il n’y a pas d’association mais en multivariée elle est associée .
Kevin
Posté à 09:12h, 07 févrierBonjour, oui, c’est tout à fait possible. L’ajustement modifie les relations entre la variable à expliquer et les variables explicatives.