収束的妥当性とは
収束的妥当性は、論文の中で2種類の測定手順や研究方法(例えば、参与観察と調査)を用いて構成概念(例えば、怒り、抑うつ、モチベーション、タスクパフォーマンス)に関するデータを収集する場合、構成概念妥当性の立証に役立つものである。 収束的妥当性がどの程度実証されているかは、関心のある構成概念に関するデータを収集するために使用した2つの異なる測定手順および調査方法から得られたスコアの間の関係の強さによって確立されます。
私たちが「事実にもかかわらず」という言葉を使ったのは、研究において、ある構成概念について信頼できる運用上の定義、つまり、ある特定の構成概念を測定するための信頼できる単一の方法を作り出すことは、十分に難しいからです。 身長をセンチメートルで測ったり、体重をキログラムで測ったりすることを提案するのは一つの方法ですが、これらは構成要素の操作上の定義であり、一つの操作上の定義を思いつくのは簡単です。 怒り、抑うつ、意欲、タスクパフォーマンスなどの構成概念について、信頼性の高い操作定義を作成することは、複数の操作定義を作成することはおろか、はるかに困難です。 しかし、収束的妥当性を確立するためには、対象となる構成概念について2つの操作的定義を考えなければなりません。 2つの操作的定義を考える必要があるのは、2つの異なる測定方法(例えば、研究方法として参加者観察とアンケート調査)を用いるからである。 これらの測定手順には、それぞれ異なる操作上の定義が必要になります。 例を見てみましょう。
Study #1
Construct #1 = Sleep quality
フィットネス レベルと睡眠の質の関係、つまり、運動が人々の睡眠の質に与える影響を研究することに興味があると想像してください。 この例では、従属変数である睡眠の質のスコアに注目しましょう(つまり、睡眠の質が関心のある構成要素です)。 この研究の参加者は、朝起きると、自己記入式調査(つまり、質問票に記入する)を使って睡眠の質を記録します。 これにより、参加者がどれだけよく眠れたと感じたかを知ることができる。 しかし、これは睡眠の質という構成要素を測定するための信頼できる測定方法なのでしょうか? 自己記入式測定法は、ある種のバイアスがかかりやすい場合があるので、単純にわからないと想像してみましょう。 そこで、被験者の睡眠パターンを観察するために、ビデオカメラで睡眠中の被験者を観察します。 その際、被験者の睡眠の質を点数化します。 2つの異なる研究方法を用いて睡眠の質を評価することで、私たちが興味を持っている構成要素について、より信頼性の高い測定手順が得られることを期待しています
この結果、2つの研究方法の下で用いられた2つの異なる測定手順(すなわち、調査からの得点と参加者の観察からの得点)による2つの得点のセットが得られます。 この2つの点数(2つの異なる調査方法で測定した点数)の間に強い関係があれば、収束的妥当性が証明され始めたと言えるでしょう。 収束的妥当性を示すのに役立つこのような強い関係は、構成要素の妥当性を評価する上で重要なステップである。つまり、睡眠の質を測定するために使用している測定手順が、睡眠の質という構成要素の有効な測定法であるとより確信できる。
収束的妥当性を確立するには、異なる2つの方法による、2種類の測定手順からのスコア間の関連の強さを評価する。 これは通常、2つのスコア間の相関を計算することで達成される。
注:収束的妥当性は、記事でより詳細に説明している同時的妥当性とは異なる。 同時性の妥当性で詳しく説明しています。 しかし、この区別は非常に簡単です。 収束的妥当性、並行的妥当性ともに、2つの異なる測定手順からの得点間の関係の強さを調べることで、構成要素の妥当性を評価する方法です。 しかし、同時検証は、新しい測定手順と確立された測定手順を比較するのに対して、収束的妥当性をテストするときは、両方の測定手順が新しいのです。 したがって、構成要素の妥当性を確立するために使用している測定手順の1つが確立されている場合は、この記事を読む必要があります。 同時性の妥当性