PMC

L’un des problèmes courants auxquels sont confrontés les lecteurs (et les auteurs !) d’articles médicaux réside dans l’interprétation du mot « signification ». Le terme « signification statistique » est souvent mal interprété comme un résultat « cliniquement important ». La confusion vient du fait que de nombreuses personnes assimilent le terme « signification » à son sens littéral d' »importance », alors qu’en statistique, il a une connotation beaucoup plus restrictive. Cet article explique la notion de signification statistique et la différencie de la pertinence ou de l’importance clinique, qui est un concept entièrement différent. Dans l’article précédent de cette série, nous avons examiné les différentes manières d’exprimer la signification statistique (valeurs « P » par rapport aux intervalles de confiance). Les mesures de la signification statistique quantifient la probabilité que les résultats d’une étude soient dus au hasard. La signification clinique, quant à elle, fait référence à l’ampleur de l’effet réel du traitement (c’est-à-dire la différence entre le groupe d’intervention et le groupe témoin, également appelée « taille de l’effet du traitement »), qui déterminera si les résultats de l’essai sont susceptibles d’avoir un impact sur la pratique médicale actuelle. La valeur « P », fréquemment utilisée pour mesurer la signification statistique, est la probabilité que les résultats de l’étude soient dus au hasard plutôt qu’à un effet réel du traitement. Le seuil conventionnel pour que la valeur « P » soit considérée comme statistiquement significative est de 0,05 (ou 5%). Ce qu’un P < 0,05 implique, c’est que la possibilité que les résultats d’une étude soient dus au hasard est <5%.

En pratique clinique, la « signification clinique » d’un résultat dépend de ses implications sur la pratique existante – la taille de l’effet du traitement étant l’un des facteurs les plus importants qui orientent les décisions de traitement. LeFort suggère que l’importance clinique devrait refléter « l’ampleur du changement, si le changement fait une réelle différence dans la vie des sujets, la durée des effets, l’acceptabilité par le consommateur, le rapport coût-efficacité et la facilité de mise en œuvre ». S’il existe des valeurs établies et traditionnellement acceptées pour les tests de signification statistique, elles font défaut pour évaluer la signification clinique. Le plus souvent, c’est le jugement du clinicien (et du patient) qui décide si un résultat est cliniquement significatif ou non.

La signification statistique dépend fortement de la taille de l’échantillon de l’étude ; avec des échantillons de grande taille, même de petits effets de traitement (qui sont cliniquement sans conséquence) peuvent sembler statistiquement significatifs ; le lecteur doit donc interpréter soigneusement si cette  » signification  » est cliniquement significative. Une étude publiée dans le Journal of Clinical Oncology a comparé la survie globale de 569 patients atteints d’un cancer du pancréas avancé qui ont été randomisés pour recevoir l’erlotinib plus la gemcitabine par rapport à la gemcitabine seule. La survie médiane s’est avérée « significativement » prolongée dans le groupe erlotinib/gemcitabine (6,24 mois contre 5,91 mois, P = 0,038). La valeur P = 0,038 signifie qu’il n’y a que 3,8 % de chances que la différence observée entre les groupes soit due au hasard (ce qui est inférieur au seuil traditionnel de 5 %) et qu’elle est donc statistiquement significative. Dans cet exemple, la pertinence clinique de cette étude « positive » est l' »effet du traitement » ou la différence de survie médiane entre 6,24 et 5,91 mois – soit seulement 10 jours, ce qui, de l’avis de la plupart des oncologues, constitue une « amélioration » cliniquement non pertinente des résultats, surtout si l’on tient compte de la toxicité supplémentaire et des coûts liés à l’association.

La plupart des revues approuvent désormais l’utilisation de la déclaration CONSORT pour le compte rendu des essais randomisés en groupes parallèles, qui souligne la nécessité de rapporter la taille de l’effet estimé et sa précision (comme l’intervalle de confiance à 95 %) pour chaque résultat primaire et secondaire. Les lecteurs doivent garder à l’esprit que l’interprétation des résultats de l’étude doit tenir compte de la signification clinique en examinant l’effet réel du traitement (avec les intervalles de confiance) et ne doit pas seulement être basée sur les valeurs « P » et la signification statistique.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.