前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 |
第1節では因子負荷量に基づいて第1因子は「国語・英語・社会」の学力を表し、第2因子は「数学・理科」の学力を表すと解釈しました。 しかしこの解釈は少々強引です。 そこで因子分析では因子の解釈が容易になるように因子軸の回転という操作を行います。
図17.1.2の因子負荷量のプロットでは数学と理科のプロットをひとつのグループとみなし、英語と国語と社会のプロットをもうひとつのグループとみなすことができます。 そこで第1因子軸F1と第2因子軸F2の角度を直角に保ったまま、右回りに約37度回転つまり約-37度回転すると、F1が英語と国語と社会のプロットの下まで回転し、F2が数学と理科のプロットの近くまで回転し、5つのプロットが全て第1象限に入ります。
そのように因子軸を回転したものが図17.2.1であり、回転前後の因子負荷量を表にしたものが表17.2.1です。 この回転後の座標軸では第1因子は「国語・英語・社会」の学力を表し、第2因子は「数学・理科」の学力を表すという解釈がさらにもっともらしくなります。 このように因子軸の角度を直角に保ったまま行う回転を直交回転といいます。 直交回転ではプロット同士の相対的位置は変わりません。
変数 | 回転前 | バリマックス回転後 | プロマックス回転後 | 共通性 | 独自性 | |||
---|---|---|---|---|---|---|---|---|
第1因子 | 第2因子 | 第1因子 | 第2因子 | 第1因子 | 第2因子 | |||
国語 | 0.736500 | -0.352968 | 0.801810 | 0.155304 | 0.829523 | -0.031603 | 0.667019 | 0.332981 |
数学 | 0.619721 | 0.697631 | 0.082096 | 0.929518 | -0.123538 | 0.978432 | 0.870743 | 0.129257 |
英語 | 0.805787 | -0.055111 | 0.680001 | 0.435808 | 0.634115 | 0.299946 | 0.652330 | 0.347670 |
理科 | 0.611298 | 0.373090 | 0.268685 | 0.663845 | 0.138369 | 0.646783 | 0.512882 | 0.487118 |
社会 | 0.794874 | -0.447917 | 0.905261 | 0.113823 | 0.950588 | -0.101781 | 0.832454 | 0.167546 |
直交回転には色々な種類があり、ここでは因子負荷量の分散(variance)合計を最大(max)にするという条件で回転するバリマックス回転(varimax rotation)を用いました。 表17.2.1のパリマックス回転後の因子負荷量を見ると、回転前と比べて因子負荷量の大小関係が極端になり、値のバラツキ具合つまり分散が大きくなっていることがわかります。 しかしこの回転は直交回転なので、原点からプロットまでの平方距離をプロットの座標成分の平方和によって求めることができます。 そのため因子軸の回転前と同様に、平方距離つまり共通性を座標成分の平方和つまり因子負荷量の平方和によって求めることができます。 (注1)
直交回転に対して、F1とF2の角度を変えながら回転する操作を斜交回転といいます。 図17.2.2は代表的な斜交回転であるプロマックス回転(promax rotation)を行ったものです。 この回転はバリマックス回転を行った後で、さらにF1を英語と国語・社会の間になるように左回りに約12.5度回転し、F2を数学と理科のプロットの間になるように右回りに約12.5度回転します。
その結果、最初の因子軸から見るとF1は右回りに約24.5度回転つまり約-24.5度回転し、F2は右回りに約49.5度回転つまり約-49.5度回転したことになり、F1とF2の角度は約65度になります。 そして表17.2.1のプロマックス回転後の因子負荷量を見ると、値のバラツキ具合がバリマックス回転後よりもさらに極端になっていることがわかります。
プロマックス回転は、バリマックス回転を行った後で、因子負荷量の大小関係をさらに極端にして単純構造——各項目について1つの因子負荷量だけが1で、他は0であるような単純な構造——に近くなるようにプロクラステス回転(Procrustes rotation)を行う斜交回転です。
プロクラステス回転は単純構造をした任意の仮想的ターゲット行列を事前に設定し、実際の因子軸をそれに合わせるように無理矢理回転するという、かなり強引で恣意的な回転です。 しかし事前に仮想的ターゲット行列を設定するのは、現実問題としてかなり困難です。 そこでバリマックス回転を行った後の因子負荷量を3〜4乗し、大小関係をさらに極端にしたものを仮想的ターゲット行列として使用するように改善した手法がプロマックス回転です。 「プロマックス」という名称は、プロクラステス回転とバリマックス回転を合わせて行うことに由来します。 (注2)
このように斜交回転は直交回転よりも因子の解釈が容易になるものの、因子軸が直交しなくなって因子同士が独立ではなくなります。 その結果、各因子を独立に評価し、独立に検討することができなくなってしまいます。 このことは後で詳しく説明します。 また因子軸を直交回転しても斜交回転しても共通性と独自性は変わりません。 しかし斜交回転すると原点からプロットまでの平方距離を座標成分の単純な平方和で求めることができず、共通性と因子負荷量の平方和が一致しなくなります。
ちなみに因子軸の回転と同じ操作を主成分軸についても行うことができます。 実際、主成分分析のオプションとして主成分軸の回転操作をサポートしている統計ソフトもあります。 しかし主成分分析は概括評価をするための手法なので、主成分軸の回転は目的にそぐわないところがあります。 そのため個人的には主成分軸を回転する必要はないと思います。
因子軸を回転すると因子負荷量が変わるので因子スコアが変わります。 そして斜交回転では因子同士が独立ではなくなります。 因子軸回転後の因子スコアの計算式は次のようになります。
生徒ID | 回転前因子スコア | バリマックス回転後因子スコア | プロマックス回転後因子スコア | |||
---|---|---|---|---|---|---|
f1 | f2 | f1 | f2 | f1 | f2 | |
1 | 1.46061 | 0.379615 | 0.946922 | 1.17509 | 1.18655 | 1.34561 |
2 | 0.209076 | 1.9989 | -1.02298 | 1.72998 | -0.608501 | 1.48083 |
3 | -0.778036 | -0.815521 | -0.139011 | -1.11852 | -0.386563 | -1.12308 |
4 | -1.71442 | 0.36327 | -1.59336 | -0.729652 | -1.71649 | -1.04359 |
5 | 0.217509 | -1.45495 | 1.04152 | -1.03896 | 0.781696 | -0.800928 |
6 | 0.0301516 | 0.143009 | -0.0609851 | 0.132821 | -0.029611 | 0.117325 |
7 | 0.851495 | -1.50616 | 1.58121 | -0.702368 | 1.38318 | -0.359941 |
8 | 0.828471 | 0.335977 | 0.465218 | 0.763424 | 0.624727 | 0.843172 |
9 | 0.105883 | 0.569722 | -0.254388 | 0.520655 | -0.131011 | 0.45674 |
10 | -1.36669 | -0.194189 | -0.981959 | -0.970203 | -1.1747 | -1.15241 |
11 | -1.03791 | -0.575354 | -0.490813 | -1.08046 | -0.720842 | -1.15864 |
12 | -1.16899 | -0.272046 | -0.776792 | -0.91495 | -0.962366 | -1.0559 |
13 | 0.189634 | 0.315361 | -0.0355808 | 0.366262 | 0.0475507 | 0.35097 |
14 | 1.98713 | 0.919515 | 1.04814 | 1.9224 | 1.45295 | 2.09769 |
15 | 0.354799 | -0.690131 | 0.696121 | -0.342897 | 0.601375 | -0.191416 |
16 | -0.364562 | 0.0480982 | -0.321454 | -0.178568 | -0.353336 | -0.241226 |
17 | -0.609982 | 1.64513 | -1.47004 | 0.957868 | -1.21748 | 0.632917 |
18 | -0.265975 | 0.395387 | -0.449181 | 0.159093 | -0.402 | 0.0626941 |
19 | 1.10321 | -1.14904 | 1.57062 | -0.265577 | 1.47091 | 0.0652015 |
20 | -0.0314199 | -0.456596 | 0.246795 | -0.385434 | 0.153968 | -0.326018 |
平均値 | 0 | 0 | 0 | 0 | 0 | 0 |
因子スコア | f1 | f2 | α係数 | 標準偏差 |
---|---|---|---|---|
f1 | 1 | 0.010256 | 0.710866 | 0.957201 |
f2 | 0.010256 | 1 | 0.000721 | 0.918749 |
バリマックス回転後 | プロマックス回転後 | 因子スコア | f1 | f2 | α係数 | 標準偏差 | f1 | f2 | α係数 | 標準偏差 |
---|---|---|---|---|---|---|---|---|---|
f1 | 1 | 0.042189 | 0.528766 | 0.9391475 | 1 | 0.455357 | 0.648447 | 0.89806 | |
f2 | 0.042189 | 1 | 0.211260 | 0.9371953 | 0.455357 | 1 | 0.355909 | 0.893528 |
バリマックス回転は直交回転なので、本来は因子スコア同士の相関係数は変わらないはずです。 しかし因子スコアは誤差のある推測値なので、因子スコア同士の相関係数がわずかに大きくなっています。 それに対してプロマックス回転は斜交回転なので、因子スコア間の相関係数がかなり大きくなっています。 この回転では因子軸F1とF2の角度が約65度なので、第1因子と第2因子の相関係数はcos(65) = 0.42になるはずです。 しかしやはり因子スコアの推測誤差のせいで実際の相関係数は約0.46になっています。 そのため図17.2.3と比べると、図17.2.4はプロットがほんのわずかに右上がりの楕円状に分布し、図17.2.5はかなり右上がりの楕円状に分布しています。
図17.2.3、図17.2.4、図17.2.5のグラフで、例えば14番の生徒に注目してみましょう。 この生徒の回転前の第1因子スコアは1.98713、第2因子スコアは0.919515です。 それに対してバリマックス回転後は第1因子スコアが1.04814、第2因子スコアが1.9224になり、2つの因子スコアの大小関係が逆転しています。 またプロマックス回転後は第1因子スコアが1.45295、第2因子スコアが2.09769になり、やはり2つの因子スコアの大小関係が逆転しています。 そしてこの生徒のテストの点は国語が73点、数学が95点、英語が81点、理科が85点、社会が77点で、合計が411点です。
回転前の第1因子は「国語・英語・社会」の学力ではなく全体的な学力を表していて、第2因子は「数学・理科」の学力ではなく「数学・理科」の学力と「国語・英語・社会」の学力のどちらが優勢かというタイプを表しています。 この生徒は合計点が平均よりも高いので第1因子スコアが大きく、数学と理科の点数が国語と英語と社会の点数よりも高いので第2因子が少し大きいわけです。
しかしバリマックス回転後は第1因子が「国語・英語・社会」の学力を表し、第2因子は「数学・理科」の学力を表しています。 そのため第1因子スコアが小さくなり、第2因子スコアが第1因子よりも大きくなったわけです。 ただしどの教科の点数も平均点よりは高いので、第1因子スコアも第2因子スコアも正の値になっています。
またプロマックス回転では2つの因子が独立ではなくなるので、第1因子スコアが高い時は第2因子スコアも高くなり、どちらの因子にも全体的な学力を表す要素が入り込みます。 その結果、全ての教科の点数が平均値より高い14番の生徒は、第1因子スコアも第2因子スコアもバリマックス回転後の因子スコアよりも大きくなり、図17.2.5では右上の少し離れたところにプロットされています。 このように因子同士が独立ではないと2つの因子を独立に評価することはできず、因子スコアの解釈が複雑になってしまいます。
これらのことから回転前の因子スコアは主成分スコアのような概括評価に近いのに対して、バリマックス回転後の因子スコアはちょうど因子の含有量を表す値のように解釈できるので、因子スコアという名称にふさわしい値であることがわかると思います。 そしてプロマックス回転後は各因子を独立に評価できなくなるので結果の解釈が複雑になり、あまり合理的ではないこともわかると思います。
因子同士が独立ではないということは、因子同士が情報を共有していて同じように変動する部分があるということです。 例えばお互いに独立ではない2つの因子と項目の関係を模式図にすると次のようになります。
模式図で表したように、お互いに独立ではない第1因子(例えば国語・英語・社会の学力)と第2因子(例えば数学・理科の学力)は、第1因子だけに存在する部分因子A(例えば読解力を表す部分因子)と、第2因子だけに存在する部分因子B(例えば論理的思考力を表す部分因子)と、2つの因子に共通する部分因子C(例えば知的好奇心を表す部分因子)に分解できます。 そして2つの因子が各項目に影響を及ぼしている状態を正確に分析するためには、これら3種類の部分因子が各項目にどのような影響を及ぼしているかを明らかにする必要があります。 つまり因子と各項目の関係を正確に分析するためには、最終的にはお互いに独立した因子と各項目の関係を明確にする必要があるわけです。
そもそも因子分析は、複雑に絡み合った多くの項目の変動を独立した少数の因子によって説明するために開発された手法です。 そのため因子同士が独立ではないと因子の解釈が複雑になり、本来の目的から外れてしまいます。 そして因子同士が独立ではないと、最終的にはお互いに独立した部分因子にまで分解して分析する必要があります。
また第3節で説明する下位尺度は、究極の単純構造をした因子負荷量を持つ疑似因子に相当します。 下位尺度はお互いに独立ではない可能性が高いものの、因子よりも簡単にスコアを求めることができ、しかも解釈が容易であるという大きな利点があります。 そのため現在の心理学分野では因子分析結果に基づいて下位尺度を確立し、それによって尺度開発を行うのが主流になっています。
これらのことを考慮すると、因子の解釈が多少容易ではあるものの因子同士が独立ではなく、下位尺度と比べて計算も解釈も難しい斜交回転よりも、因子同士が独立という下位尺度にはない特徴を持つ直交回転の方が合理的で有用だと思います。
分母 | |||
---|---|---|---|
- | + | ||
分子 | + | 第2象限 | 第1象限 |
- | 第3象限 | 第4象限 |
この操作は因子負荷量行列Lを適当な(q,q)型の正規直交行列Pを用いて直交変換し、回転後の因子負荷量行列Mに変換したことに相当します。
回転後も共通性と独自性が変わらないということは、因子軸を直交回転(または斜交回転)して得られる因子負荷量行列は全て因子分析の解であるということを意味します。 因子を抽出する時は共通性を最大にする、または独自性を最小にするという基準で計算します。 そのため共通性と独自性が同じ解は全て同等ということになり、因子軸を直交回転して得られる因子負荷量行列は全て解になり得ます。 そのため因子分析の解は反復計算の初期値に強く影響され、初期値が異なれば異なる解に収束することも大いに有り得ます。
しかし因子負荷量の分散を最大にする解は一意に決まることが多いので、共通性と独自性がほぼ同じで因子負荷量行列だけが異なる色々な解をバリマックス回転すると、よく似た解になることがあります。 この意味でも因子軸を直交回転するのは有意義です。
表16.1.1のデータから主因子法で得られた因子軸を、実際に規準バリマックス回転してみましょう。
表16.1.1のデータについて実際に計算すると次のようになります。