統計解析のよくある落とし穴臨床的有意性と統計的有意性

医学論文の読者（そして著者！）がよく直面する問題の1つは、”有意 “という言葉の解釈である。統計的有意性」という言葉は、しばしば「臨床的に重要な」結果であると誤解されることがあります。この混乱は、多くの人が「有意性」を文字通りの意味である「重要性」と同一視していることに起因しているが、統計学においては、はるかに限定的な意味合いを持っているのである。この記事では、統計的有意性の考え方を説明し、臨床的関連性や重要性とは全く異なる概念であることを説明する。前回、このシリーズでは、統計的有意性のさまざまな表現方法（「P」値対信頼区間）を見てきました。統計的有意性の指標は、試験結果が偶然によるものである確率を定量的に示すものです。一方、臨床的有意性は、実際の治療効果の大きさ（すなわち、介入群と対照群の差、「治療効果の大きさ」ともいう）を指し、試験の結果が現在の医療行為に影響を与える可能性があるかどうかを決定するものである。統計的有意性を測定するためによく使われる「P」値は、試験結果が実際の治療効果ではなく、偶然によるものである確率を示すものです。統計的に有意とみなされる「P」値は、従来は0.05（または5％）であった。臨床の現場では、結果の「臨床的意義」は、既存の診療に対する影響に左右されます（治療効果の大きさは、治療の決定を左右する最も重要な要因の一つです）。ルフォートは，臨床的意義には「変化の程度，変化が被験者の生活に真の違いをもたらすかどうか，効果がどれくらい持続するか，消費者の受容性，費用対効果，実施の容易さ」などを反映させるべきであると提案している。統計的有意差検定には従来から確立された値が存在するが、臨床的有意性の評価にはこれが欠けている。

統計的有意性は研究のサンプルサイズに大きく依存します。サンプルサイズが大きいと、（臨床的には重要でない）小さな治療効果でさえも統計的に有意に見えることがあるため、この「有意」が臨床的に意味があるかどうかは慎重に解釈する必要があります。 Journal of Clinical Oncology誌に掲載された研究では、エルロチニブ＋ゲムシタビン投与とゲムシタビン単独投与に無作為に割り付けられた進行膵臓癌患者569人の全生存期間が比較された。生存期間中央値は、エルロチニブ／ゲムシタビン群で「有意に」延長することが明らかになった（6.24カ月 vs. 5.91カ月、P = 0.038）。 P = 0.038は、この観察された群間差が偶然に生じた可能性が3.8%しかなく（これは従来のカットオフ値5%より小さい）、したがって統計的に有意であることを意味しています。この例では、この「ポジティブ」な研究の臨床的関連性は、「治療効果」または生存期間中央値が6.24ヶ月と5.91ヶ月の間の差であり、たった10日で、ほとんどの腫瘍学者は、特に併用に伴う毒性の追加やコストを考慮すると、臨床的には無関係な「改善」であると同意することでしょう。

現在、ほとんどのジャーナルが並行群間無作為化試験の報告のためのCONSORT声明の使用を支持しており、各主要および副次的結果について推定効果量およびその精度（95％信頼区間など）を報告する必要性を強調している。読者は、試験結果の解釈は、実際の治療効果（信頼区間付き）を見て臨床的意義を考慮すべきであり、単に「P」値や統計的有意性に基づいてはならないことを心に留めておくべきである＜2708＞。

PMC

コメントを残すコメントをキャンセル

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル