Jednym z częstych problemów, z jakimi borykają się czytelnicy (i autorzy!) artykułów medycznych, jest interpretacja słowa „istotność”. Termin „istotność statystyczna” jest często błędnie interpretowany jako „klinicznie ważny” wynik. Nieporozumienie wynika z faktu, że wiele osób utożsamia „znaczenie” z jego dosłownym znaczeniem „ważności”, podczas gdy w statystyce ma ono znacznie bardziej restrykcyjne konotacje. Ten artykuł wyjaśnia ideę istotności statystycznej i odróżnia ją od istotności klinicznej, która jest zupełnie innym pojęciem. W poprzednim artykule z tej serii przyjrzeliśmy się różnym sposobom wyrażania istotności statystycznej (wartości „P” w porównaniu z przedziałami ufności). Miary istotności statystycznej określają ilościowo prawdopodobieństwo, że wyniki badania są wynikiem przypadku. Z drugiej strony, istotność kliniczna odnosi się do wielkości rzeczywistego efektu leczenia (tj. różnicy między grupą badaną a kontrolną, zwanej również „wielkością efektu leczenia”), która określa, czy wyniki badania mogą mieć wpływ na bieżącą praktykę medyczną. Wartość „P”, często używana do pomiaru istotności statystycznej, jest prawdopodobieństwem, że wyniki badania wynikają raczej z przypadku niż z rzeczywistego efektu leczenia. Konwencjonalna wartość odcięcia dla wartości „P”, która ma być uznana za statystycznie istotną, wynosi 0,05 (lub 5%). To, co oznacza P < 0,05, to fakt, że możliwość, że wyniki badania są wynikiem przypadku wynosi <5%.
W praktyce klinicznej „znaczenie kliniczne” wyniku zależy od jego wpływu na istniejącą praktykę – wielkość efektu leczenia jest jednym z najważniejszych czynników, które napędzają decyzje dotyczące leczenia. LeFort sugeruje, że znaczenie kliniczne powinno odzwierciedlać „zakres zmiany, to czy zmiana powoduje rzeczywistą różnicę w życiu badanych, jak długo utrzymują się efekty, akceptowalność przez konsumentów, efektywność kosztową i łatwość wdrożenia”. Podczas gdy istnieją ustalone, tradycyjnie akceptowane wartości dla testowania istotności statystycznej, brakuje ich dla oceny istotności klinicznej. Częściej niż nie, to osąd klinicysty (i pacjenta) decyduje o tym, czy wynik jest istotny klinicznie, czy nie.
Statystyczna istotność w dużym stopniu zależy od wielkości próby w badaniu; przy dużej wielkości próby nawet małe efekty leczenia (które są klinicznie nieistotne) mogą wydawać się istotne statystycznie; dlatego czytelnik musi uważnie interpretować, czy ta „istotność” jest istotna klinicznie. W badaniu opublikowanym w Journal of Clinical Oncology porównano całkowite przeżycie u 569 pacjentów z zaawansowanym rakiem trzustki, którzy zostali randomizowani do otrzymywania erlotynibu plus gemcytabiny w porównaniu z samą gemcytabiną. Stwierdzono, że mediana przeżycia była „znacząco” dłuższa w ramieniu erlotynib/gemcytabina (6,24 miesiąca vs. 5,91 miesiąca, P = 0,038). P = 0,038 oznacza, że istnieje tylko 3,8% szans, że ta zaobserwowana różnica między grupami wystąpiła przypadkowo (co jest mniej niż tradycyjny próg odcięcia 5%), a zatem jest istotna statystycznie. W tym przykładzie, kliniczne znaczenie tego „pozytywnego” badania to „efekt leczenia” lub różnica w medianie przeżycia między 6,24 a 5,91 miesiąca – zaledwie 10 dni, co większość onkologów zgodziłaby się, że jest klinicznie nieistotną „poprawą” wyników, zwłaszcza jeśli weźmie się pod uwagę dodatkową toksyczność i koszty związane z kombinacją.
Większość czasopism popiera obecnie stosowanie oświadczenia CONSORT dotyczącego raportowania równoległych grupowych badań randomizowanych, które podkreśla potrzebę raportowania szacowanej wielkości efektu i jego precyzji (takiej jak 95% przedział ufności) dla każdego pierwotnego i wtórnego wyniku. Czytelnicy powinni pamiętać, że interpretacja wyników badania powinna uwzględniać znaczenie kliniczne poprzez spojrzenie na rzeczywisty efekt leczenia (z przedziałami ufności), a nie tylko opierać się na wartościach „P” i istotności statystycznej.
.