前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 |
因子スコアは平均値が0で標準偏差がほぼ1であり、しかも——斜交回転をしないのなら——お互いにほぼ独立であるという好都合な性質を持っています。 しかしこれまでの説明でわかるように、因子スコアを計算するのは少々面倒です。
そこで因子スコアの計算を簡単にするために、切片を省略し、因子負荷量の絶対値が大きい項目の係数を「1」または「-1」にし、絶対値の小さい項目は係数を「0」にするという簡便法が考えられます。 つまり因子負荷量の絶対値が大きい項目の合計——ただし符号が負の項目つまり逆転項目も有り得る——を、そのまま簡便な因子スコアにしてしまうおうというわけです。 これは第2節で説明したプロクラステス回転で用いる単純構造の仮想的ターゲット行列をそのまま因子負荷量行列にしたことに相当します。
例えば第2節で求めたバリマックス回転後の因子スコア計算式について、切片を省略し、因子負荷量の絶対値が大きい項目だけ合計した簡便な因子スコアとその因子負荷量は次のようになります。
変数 | バリマックス回転後 | プロマックス回転後 | 下位尺度 | |||
---|---|---|---|---|---|---|
第1因子 | 第2因子 | 第1因子 | 第2因子 | 下位尺度1 | 下位尺度2 | |
国語 | 0.801810 | 0.155304 | 0.829523 | -0.031603 | 1 | 0 |
数学 | 0.082096 | 0.929518 | -0.123538 | 0.978432 | 0 | 1 |
英語 | 0.680001 | 0.435808 | 0.634115 | 0.299946 | 1 | 0 |
理科 | 0.268685 | 0.663845 | 0.138369 | 0.646783 | 0 | 1 |
社会 | 0.905261 | 0.113823 | 0.950588 | -0.101781 | 1 | 0 |
この簡便な因子スコアは平均値が0にならず、標準偏差も1にならず、お互いに独立ではないものの、簡単に計算できて内容が直感的にわかりやすいという大きなメリットがあります。 そこで心理学分野では本来の因子スコアの代わりにこの簡便な因子スコアを多用し、これを下位尺度スコア(下位尺度得点)と呼び、下位尺度を疑似因子として用います。 そしてこのような下位尺度を確立し、普遍性のある心理学的検査法(通常はアンケート)を開発することを尺度開発と呼びます。
表16.1.1について、上記の下位尺度スコアを求めると表17.3.2のようになります。 そして下位尺度スコアと合計点について、平均値や標準偏差等の基礎統計量を求めると表17.3.3のようになります。
生徒ID | 下位尺度スコア1 | 下位尺度スコア2 | 合計点 |
---|---|---|---|
1 | 231 | 136 | 367 |
2 | 159 | 158 | 317 |
3 | 154 | 63 | 217 |
4 | 110 | 58 | 168 |
5 | 205 | 66 | 271 |
6 | 159 | 124 | 283 |
7 | 229 | 78 | 307 |
8 | 191 | 134 | 325 |
9 | 159 | 115 | 274 |
10 | 132 | 57 | 189 |
11 | 145 | 66 | 211 |
12 | 140 | 62 | 202 |
13 | 177 | 106 | 283 |
14 | 231 | 180 | 411 |
15 | 202 | 113 | 315 |
16 | 163 | 108 | 271 |
17 | 135 | 123 | 258 |
18 | 162 | 101 | 263 |
19 | 237 | 95 | 332 |
20 | 178 | 85 | 263 |
平均値 | 175 | 101 | 276 |
項目 | 平均値 | 標準偏差 | α係数 | 相関係数 | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|
下位尺度スコア | 回転前 因子スコア | バリマックス回転後 因子スコア | プロマックス回転後 因子スコア |
||||||||
1 | 2 | f1 | f2 | f1 | f2 | f1 | f2 | ||||
下位尺度スコア1 | 175 | 37 | 0.860 | 1 | 0.403 | 0.921 | -0.345 | 0.955 | 0.289 | 0.986 | 0.476 |
下位尺度スコア2 | 101 | 35 | 0.769 | 0.403 | 1 | 0.709 | 0.666 | 0.192 | 0.955 | 0.398 | 0.966 |
合計点 | 276 | 60 | 0.791 | 0.848 | 0.827 | 0.976 | 0.173 | 0.698 | 0.730 | 0.836 | 0.852 |
表17.3.3の下位尺度スコアに関するクロンバックのα係数(Cronbach's coefficient alpha)はどちらもかなり高い値であり、「下位尺度の内部一貫性が高い」とか「下位尺度の信頼性が高い」と評価されます。 しかし第16章第2節で説明したように、α係数は下位尺度の信頼性の指標ではなく冗長性または情報重複度の指標と解釈することもできます。 そのため統計学的には、この値が高いほど「下位尺度は情報が重複しており無駄な測定項目が多い」と解釈することも可能です。 (→16.2 主成分分析結果の解釈、5.4 級内相関係数と一致係数)
ただしアンケート調査の場合、同じような内容の質問を表現を変えてわざと複数項目作ることがあります。 そのようにして質問内容に冗長性を持たせることによって、データの内部一貫性と信頼性を検討することが可能になります。 医学分野で用いる臨床検査値と違ってアンケートデータは偏りや誤差が入りやすいので、データの信頼性を高くするためにそういった工夫が必要な時があるのです。
また下位尺度の信頼性が高いからといって、その下位尺度が科学的に妥当なものであるとは限りません。 このデータの場合は因子の解釈に基づいて下位尺度1が「国語・英語・数学」の学力つまり文化系の学力を表していて、下位尺度2が「数学・理科」の学力つまり理科系の学力を表していると一応は解釈できます。
しかし文化系の学力とか理科系の学力という概念が妥当かどうか、そして2種類の下位尺度がそれらを適切に反映しているかどうかについては、このデータだけからは判断できません。 それらについては心理学分野の知見や、それを目的とした研究による裏付けが必要です。 このことから下位尺度の信頼性と下位尺度の妥当性は全く別の概念だということがわかります。
表17.3.3の相関係数を見ると、下位尺度スコア1と回転前後の第1因子スコア、下位尺度スコア2と回転後の第2因子スコアの関連性が強く、下位尺度スコア同士にも関連性があります。 そのため2種類の下位尺度スコアの結果について検討する時は、それぞれ独立に評価することができないので注意が必要です。 例えばこの場合は2種類の下位尺度スコアの相関関係が正である、つまり「国語・英語・数学」の学力が高いと「数学・理科」の学力も高いという関係があり、どちらの下位尺度にも全体的な学力を表す要素が入り込んでいると考えられます。 そのため2種類の下位尺度を独立に評価せず、お互いの関連性を考慮しながら評価する必要があります。
また合計点と下位尺度スコアの相関係数を見ると、下位尺度スコアはどちらも正の大きな値です。 そして合計点と因子スコアの相関係数を見ると、回転前は第1因子スコアの相関係数だけが大きく、プロマックス回転後はどちらの因子スコアも相関係数が大きいことがわかります。 このことから、下位尺度スコアとプロマックス回転後の因子スコアには全体的な学力を表す要素が入り込んでいると解釈できます。
さらにプロマックス回転後の因子スコアは下位尺度スコアとの相関係数が大きく、因子スコア同士の相関係数も合計点に対する相関係数も下位尺度スコアのそれと似ています。 このことから、プロマックス回転後の因子スコアは下位尺度スコアとほぼ同じ情報を持っていると解釈できます。 したがって下位尺度を用いるなら、わざわざプロマックス回転をする必要はないと考えられます。
通常、斜交回転しない限り因子はお互いにほぼ独立です。 そのため因子分析を元にして導き出した下位尺度についても、暗黙のうちにお互いにほぼ独立という前提で結果を独立に評価することが多いようです。 しかし斜交回転しない因子はお互いにほぼ独立ですが、下位尺度は独立とは限りません。 そのため回転しない因子または直交回転した因子と下位尺度をうまく使い分けて、結果を合理的に解釈するのがお勧めです。
ちなみに下位尺度スコアを用いて1番目の生徒のテストの点数を復元すると次のようになります。 第1節で因子回転前の因子スコアを用いて同じ生徒のテストの点数を復元したものと同様に、ここでは下位尺度スコアによる復元点数を「共通性による復元点数」扱いし、実際の点数との差を「独自性よる誤差」扱いしています。 (→17.1 因子と因子分析 (3)因子分析結果の解釈)
上記の計算結果から、下位尺度スコアはその下位尺度に含まれる各項目の点数をそれらの項目の平均値で復元するという、かなりラフな因子スコアに相当することがわかると思います。 ただし因子スコアと違って下位尺度スコアの寄与率は求められないので、共通性と独自性の寄与率も求められません。 そのため下位尺度スコアを用いた時の元のデータの復元率の良し悪しは正確には評価できませんが、因子スコアを用いた時の復元率よりは確実に悪くなります。 これらのことから、下位尺度および下位尺度スコアと因子および因子スコアの関係を何となく理解できるのではないかと思います。
因子分析を用いて尺度開発をした例として、日本語版抑うつ状態チェックリスト改訂版を紹介しましょう。 これは早稲田大学大学院人間科学研究科の長谷川晃先生等が開発された心理尺度で、インターネットの「心理尺度の広場」というサイトにアップされています。 この心理尺度には2種類の下位尺度があり、抑うつ気分の2つの構成成分である情動的成分と、自己全般に対するネガティブな視点を測定することができます。 (→日本パーソナリティ心理学会 心理尺度の広場)
上記のようなグレードデータは、医学分野では順序尺度のデータとして扱うのが普通です。 しかし心理学分野では計量尺度のデータとして扱うのが普通です。 何故なら主成分分析や因子分析は計量尺度のデータにしか適用できず、下位尺度を求めることも計量尺度のデータしか行えないからです。
計量尺度と順序尺度の違いは、数字と数字の間隔が等間隔で四則演算ができるかどうかです。 表17.3.4のようなグレードデータは数字と数字の間隔が等間隔とは限らず、厳密にいえば四則演算を行うことはできません。
例えば1番目と2番目の質問の回答がどちらも「3:どちらともいえない」だった被検者と、1番目の回答が「1:まったくあてはまらない」で、2番目の回答が「5:非常にあてはまる」だった被検者がいたとします。 この時、2つの質問の合計を求めるとどちらの被検者も「6」になり、これが下位尺度スコアなら2人とも同じ値と解釈されます。 これは「(3:どちらともいえない)+(3:どちらともいえない)=(1:まったくあてはまらない)+(5:非常にあてはまる)=6」と解釈したことに相当し、数字と数字の間隔が等間隔であることを前提にしています。
ところがこの場合は数字と数字の間隔は等間隔とは限らず、厳密にいえばこのような足し算は成り立たないと考えられます。 しかし心理学分野の研究ではこのようなアンケート調査が中心なので、仕方なくグレードデータを近似的に計量尺度データとして扱い、主成分分析や因子分析を適用して下位尺度を求めているのです。 そしてグレードデータをできるだけ計量尺度に近づけるために、表17.3.4のように「どちらともいえない」を中心にして左右対称の選択肢を設定するのが普通です。 このような回答形式のことをリッカート尺度(Likert scale)といいます。
近代科学はデータをできるだけ定量評価し、結果を関数で表して法則化することが多いので、統計学も計量尺度のデータを中心にして発達してきました。 そのため数学的な厳密さよりも結果を数量表現することを優先し、こういったグレードデータを近似的に計量尺度のデータとして扱ってもかまわないと思います。
またこの例のようなアンケート形式の尺度を開発する時は、解釈しやすい下位尺度を作るために最初から因子を想定してアンケートの質問を作成することが大切です。 例えば「独立心」という因子を想定している時は、独立心の高さや内容を明らかにするような質問をいくつか作成して独立心を多面的に把握できるようにします。 そのようにして作成された複数の質問は、当然、お互いに関連性が強く、因子分析でひとつの因子として抽出され、下位尺度を構成する可能性が高くなります。
最後に、主成分分析と因子分析の使い分けについて少し説明しておきましょう。 主成分分析は実際に観測されたデータを要約して概括評価項目つまり目的変数を作成するための手法であり、作成された概括評価項目のことを主成分と呼びます。 それに対して因子分析は実際に観測されたデータが何故そのような値になっているかという要因つまり説明変数を探るための手法であり、推測された潜在的な説明変数のことを因子と呼びます。
例えば表16.1.1の1番目の生徒の各項目を標準化した時の主成分スコアと、バリマックス回転後およびプロマックス回転後の因子スコアは次のとおりでした。 (→16.3 特殊な主成分分析 表16.3.1、17.2 因子軸の回転 表17.2.2)
生徒ID | 国語 | 数学 | 英語 | 理科 | 社会 | 合計点 | 主成分スコア | バリマックス回転後の 因子スコア | プロマックス回転後の 因子スコア |
|||
---|---|---|---|---|---|---|---|---|---|---|---|---|
z1 | z2 | f1 | f2 | f1 | f2 | |||||||
1 | 72 | 80 | 88 | 56 | 71 | 367 | 1.50852 | 0.0286941 | 0.946922 | 1.17509 | 1.18655 | 1.34561 |
平均値 | 56 | 51 | 59 | 51 | 60 | 276 | 0 | 0 | 0 | 0 | 0 | 0 |
そして因子スコアと因子負荷量から、この生徒のテストの点を復元すると次のようになります。 なお因子軸を回転しても共通性と独自性は変わらないので、復元した点数は回転前と変わりません。 標準化された点数がわずかに異なるのは計算誤差によるものです。 (→17.1 因子と因子分析 (3)因子分析結果の解釈)
主成分分析の結果から第1主成分はレベルを表す合計点的な概括評価項目であり、第2主成分は理科系・文化系のタイプを表す概括評価項目と解釈できました。 そこでこの生徒は第1主成分スコアが正の大きな値であり、第2主成分が正の小さな値であることから、合計点は平均値よりもかなり高く、タイプとしては理科系と文化系の中間的なタイプである、つまりどの教科の点数も平均値より高いと評価できます。
一方、因子分析の結果から第1因子は文化系の学力を表し、第2因子は理科系の学力を表していると解釈できました。 そこでこの生徒は第1因子スコアも第2因子スコアも正で大きな値であることから、2種類の学力をどちらも平均以上に持っているので、どの教科も平均値以上の点数を取ることができたと解釈できます。
このように因子分析は特定の個人や特定の集団についてある観測値が得られている時、それらの観測値がそのような値になっている原因を因子によって説明することが主な目的です。 そのため因子分析に基いて作成した下位尺度も同じような目的に用いるべきです。 心理学・社会学分野では因子分析が多用され、本来は主成分分析を適用すべき場合でも因子分析を適用したり、下位尺度を用いたりしてしまうことがよくあります。 2種類の手法の違いをよく理解して、適切に使い分けることが大切です。