Jeden z častých problémů, se kterým se čtenáři (a autoři!) lékařských článků potýkají, je interpretace slova „významnost“. Pojem „statistická významnost“ je často nesprávně interpretován jako „klinicky významný“ výsledek. Zmatek pramení ze skutečnosti, že mnoho lidí ztotožňuje slovo „významnost“ s jeho doslovným významem „důležitost“, zatímco ve statistice má mnohem užší konotaci. Tento článek vysvětluje myšlenku statistické významnosti a odlišuje ji od klinické významnosti nebo důležitosti, což je zcela jiný pojem. V předchozím článku této série jsme se zabývali různými způsoby vyjadřování statistické významnosti (hodnoty „P“ versus intervaly spolehlivosti). Míry statistické významnosti kvantifikují pravděpodobnost, že výsledky studie jsou způsobeny náhodou. Naproti tomu klinická významnost se týká velikosti skutečného léčebného účinku (tj. rozdílu mezi intervenční a kontrolní skupinou, známého také jako „velikost léčebného účinku“), který určí, zda výsledky studie pravděpodobně ovlivní současnou lékařskou praxi. Hodnota „P“, která se často používá k měření statistické významnosti, představuje pravděpodobnost, že výsledky studie jsou způsobeny spíše náhodou než skutečným účinkem léčby. Obvyklá mezní hodnota pro hodnotu „P“, která je považována za statisticky významnou, je 0,05 (nebo 5 %). Z hodnoty P < 0,05 vyplývá, že možnost, že výsledky studie jsou způsobeny náhodou, je <5 %.
V klinické praxi závisí „klinická významnost“ výsledku na jeho důsledcích pro stávající praxi – velikost léčebného efektu je jedním z nejdůležitějších faktorů, které určují rozhodnutí o léčbě. LeFort navrhuje, aby klinický význam odrážel „rozsah změny, zda změna skutečně mění život subjektů, jak dlouho účinky trvají, přijatelnost pro spotřebitele, nákladovou efektivitu a snadnost implementace“. Zatímco pro testování statistické významnosti existují zavedené, tradičně přijímané hodnoty, pro hodnocení klinické významnosti chybí. Častěji je to úsudek lékaře (a pacienta), který rozhoduje o tom, zda je výsledek klinicky významný či nikoli.
Statistická významnost je silně závislá na velikosti vzorku studie; při velké velikosti vzorku se i malé účinky léčby (které jsou klinicky nevýznamné) mohou jevit jako statisticky významné; čtenář proto musí pečlivě interpretovat, zda je tato „významnost“ klinicky významná. Studie publikovaná v časopise Journal of Clinical Oncology srovnávala celkové přežití u 569 pacientů s pokročilým karcinomem pankreatu, kteří byli randomizováni k léčbě erlotinibem plus gemcitabinem oproti samotnému gemcitabinu. Bylo zjištěno, že medián přežití se „významně“ prodloužil v rameni s erlotinibem/gemcitabinem (6,24 měsíce oproti 5,91 měsíce, P = 0,038). P = 0,038 znamená, že existuje pouze 3,8% pravděpodobnost, že tento pozorovaný rozdíl mezi skupinami vznikl náhodou (což je méně než tradiční hranice 5 %), a je tedy statisticky významný. V tomto příkladu je klinickým významem této „pozitivní“ studie „léčebný efekt“ neboli rozdíl v mediánu přežití mezi 6,24 a 5,91 měsíce – pouhých 10 dní, což je, jak by se většina onkologů shodla, klinicky irelevantní „zlepšení“ výsledků, zejména pokud vezmeme v úvahu přidanou toxicitu a náklady spojené s kombinací.
Většina časopisů nyní podporuje používání prohlášení CONSORT pro hlášení randomizovaných studií s paralelními skupinami, které zdůrazňuje potřebu hlášení odhadované velikosti účinku a jeho přesnosti (např. 95% interval spolehlivosti) pro každý primární a sekundární výsledek. Čtenáři by měli mít na paměti, že interpretace výsledků studie by měla brát v úvahu klinický význam při pohledu na skutečný účinek léčby (s intervaly spolehlivosti) a neměla by být založena pouze na hodnotách „P“ a statistické významnosti
.