Uno dei problemi comuni affrontati dai lettori (e autori!) di articoli medici è l’interpretazione della parola “significatività”. Il termine “significatività statistica” è spesso mal interpretato come un risultato “clinicamente importante”. La confusione deriva dal fatto che molte persone equiparano “significatività” al suo significato letterale di “importanza”, mentre in statistica ha una connotazione molto più restrittiva. Questo articolo spiega l’idea della significatività statistica e la differenzia dalla rilevanza o importanza clinica, che è un concetto completamente diverso. Nell’articolo precedente, in questa serie, abbiamo visto diversi modi di esprimere la significatività statistica (valori “P” contro intervalli di confidenza). Le misure di significatività statistica quantificano la probabilità che i risultati di uno studio siano dovuti al caso. La significatività clinica, d’altra parte, si riferisce alla grandezza dell’effetto di trattamento reale (cioè, la differenza tra l’intervento e i gruppi di controllo, noto anche come “dimensione dell’effetto di trattamento”), che determinerà se i risultati dello studio hanno un impatto sulla pratica medica corrente. Il valore “P”, spesso usato per misurare la significatività statistica, è la probabilità che i risultati dello studio siano dovuti al caso piuttosto che a un reale effetto del trattamento. Il limite convenzionale per il valore “P” per essere considerato statisticamente significativo è di 0,05 (o 5%). Ciò che implica un P < 0,05 è che la possibilità che i risultati di uno studio siano dovuti al caso è <5%.
Nella pratica clinica, la “significatività clinica” di un risultato dipende dalle sue implicazioni sulla pratica esistente – la dimensione dell’effetto del trattamento è uno dei fattori più importanti che guida le decisioni di trattamento. LeFort suggerisce che il significato clinico dovrebbe riflettere “l’estensione del cambiamento, se il cambiamento fa una reale differenza nella vita dei soggetti, quanto durano gli effetti, l’accettabilità da parte del consumatore, il rapporto costo-efficacia e la facilità di implementazione”. Mentre ci sono valori stabiliti e tradizionalmente accettati per i test di significatività statistica, questo manca per valutare la significatività clinica. Più spesso che no, è il giudizio del clinico (e del paziente) che decide se un risultato è clinicamente significativo o no.
La significatività statistica dipende fortemente dalla dimensione del campione dello studio; con grandi dimensioni del campione, anche piccoli effetti di trattamento (che sono clinicamente irrilevanti) possono apparire statisticamente significativi; quindi, il lettore deve interpretare attentamente se questa “significatività” è clinicamente significativa. Uno studio pubblicato sul Journal of Clinical Oncology ha confrontato la sopravvivenza globale in 569 pazienti con cancro pancreatico avanzato che sono stati randomizzati a ricevere erlotinib più gemcitabina rispetto alla sola gemcitabina. La sopravvivenza mediana è risultata “significativamente” prolungata nel braccio erlotinib/gemcitabina (6,24 mesi contro 5,91 mesi, P = 0,038). Il P = 0,038 significa che c’è solo un 3,8% di possibilità che questa differenza osservata tra i gruppi si sia verificata per caso (che è meno del tradizionale cut-off del 5%) e quindi, statisticamente significativa. In questo esempio, la rilevanza clinica di questo studio “positivo” è l'”effetto del trattamento” o la differenza nella sopravvivenza mediana tra 6,24 e 5,91 mesi – solo 10 giorni, che la maggior parte degli oncologi sarebbe d’accordo è un “miglioramento” clinicamente irrilevante nei risultati, soprattutto quando si considera la tossicità aggiunta e i costi coinvolti con la combinazione.
La maggior parte delle riviste ora approva l’uso della dichiarazione CONSORT per la segnalazione di studi randomizzati a gruppi paralleli, che sottolinea la necessità di segnalare la dimensione stimata dell’effetto e la sua precisione (come l’intervallo di confidenza al 95%) per ogni risultato primario e secondario. I lettori dovrebbero tenere a mente che l’interpretazione dei risultati dello studio dovrebbe tenere conto della significatività clinica guardando l’effetto reale del trattamento (con intervalli di confidenza) e non dovrebbe essere basata solo sui valori “P” e sulla significatività statistica.