7.4 パス解析
(1) パス図
重回帰分析の結果を解釈する時、図7.4.1のようなパス図(path diagram)を描くと便利です。
パス図では四角形で囲まれたものは変数を表し、変数と変数を結ぶ単方向の矢印「→」は原因と結果という因果関係があることを表し、双方向の矢印「←→」はお互いに影響を及ぼし合っている相関関係を表します。
そして矢印の近くに書かれた数字をパス係数といい、因果関係の場合は標準偏回帰係数を、相関関係の場合は相関係数を記載します。
回帰誤差は四角形で囲まず、目的変数と単方向の矢印で結びます。
そして回帰誤差のパス係数として残差寄与率の平方根つまりを記載します。
図7.4.1は第2節で計算した重回帰分析結果をパス図で表現したものです。
このパス図から重症度の大部分はTCとTGに基づいて評価していて、その際、TGよりもTCの方をより重要と考えていること、そしてTCとTGの間には強い相関関係があることがわかります。
パス図は次のようなルールに従って描きます。
- ○直接観測された変数を観測変数といい、四角形で囲む。
-
例:臨床検査値、アンケート項目等
- ○直接観測されない仮定上の変数を潜在変数といい、丸または楕円で囲む。
-
例:因子分析の因子等
- ○分析対象以外の要因を表す変数を誤差変数といい、何も囲まないか丸または楕円で囲む。
-
例:重回帰分析の回帰誤差等
未知の原因 誤差
- ○因果関係を表す時は原因変数から結果変数方向に単方向の矢印を描く。
-
- ○相関関係(共変関係)を表す時は変数と変数の間に双方向の矢印を描く。
-
- ○これらの矢印をパスといい、パスの傍らにパス係数を記載する。
-
パス係数は因果関係の場合は重回帰分析の標準偏回帰係数または偏回帰係数を用い、相関関係の場合は相関係数または偏相関係数を用いる。
パス係数に有意水準を表す有意記号「*」を付ける時もある。
- ○外生変数:モデルの中で一度も他の変数の結果にならない変数、つまり単方向の矢印を一度も受け取らない変数。
-
図7.4.1ではTCとTGが外生変数。
誤差変数は必ず外生変数になる。
- ○内生変数:モデルの中で少なくとも一度は他の変数の結果になる変数、つまり単方向の矢印を少なくとも一度は受け取る変数。
-
図7.4.1では重症度が内生変数。
- ○構造変数:観測変数と潜在変数の総称
-
構造変数以外の変数は誤差変数である。
- ○測定方程式:共通の原因としての潜在変数が、複数個の観測変数に影響を及ぼしている様子を記述するための方程式。
-
因子分析における因子が各項目に影響を及ぼしている様子を記述する時などに使用する。
- ○構造方程式:因果関係を表現するための方程式。
-
観測変数が別の観測変数の原因になる、といった関係を記述する時などに使用する。
図7.4.1が構造方程式の例。
(2) 階層的重回帰分析
表6.1.1のデータに年齢を付け加えたものが表7.4.1のようになったとします。
この場合、年齢がTCとTGに影響し、さらにTCとTGを通して間接的に重症度に影響することは大いに考えられます。
つまり年齢がTCとTGの原因であり、さらにTCとTGが重症度の原因であるという2段階の因果関係があることになります。
このような場合は図7.4.2のようなパス図を描くことができます。
表7.4.1 脂血異常症患者の年齢とTCとTG
患者No. | 年齢 | TC | TG | 重症度 |
1 | 50 | 220 | 110 | 0 |
2 | 45 | 230 | 150 | 1 |
3 | 48 | 240 | 150 | 2 |
4 | 41 | 240 | 250 | 1 |
5 | 50 | 250 | 200 | 3 |
6 | 42 | 260 | 150 | 3 |
7 | 54 | 260 | 250 | 2 |
8 | 51 | 260 | 290 | 1 |
9 | 60 | 270 | 250 | 4 |
10 | 47 | 280 | 290 | 4 |
図7.4.2のパス係数は次のようにして求めます。
まず最初に年齢を説明変数にしTCを目的変数にした単回帰分析と、年齢を説明変数にしTGを目的変数にした単回帰分析を行います。
そしてその標準偏回帰係数を年齢とTC、年齢とTGのパス係数にします。
ちなみに単回帰分析の標準偏回帰係数は単相関係数と一致するので、この場合のパス係数は標準偏回帰係数であると同時に相関係数でもあります。
次にTCとTGを説明変数にし、重症度を目的変数にした重回帰分析を行います。
これは第2節で計算した重回帰分析であり、パス係数は図7.4.1と同じになります。
表7.4.1のデータについてこれらの計算を行うと次のような結果になります。
○説明変数x:年齢 目的変数y:TCとした単回帰分析
単回帰式:
標準偏回帰係数 = 単相関係数 = 0.321
○説明変数x:年齢 目的変数y:TGとした単回帰分析
単回帰式:
標準偏回帰係数 = 単相関係数 = 0.280
○説明変数x
1:TC、x
2:TG 目的変数y:重症度とした重回帰分析
重回帰式:
TCの標準偏回帰係数 = 1.239 TGの標準偏回帰係数 = -0.549
重寄与率:R
2 = 0.814(81.4%) 重相関係数:R = 0.902
残差寄与率の平方根:
このように、因果関係の組み合わせに応じて重回帰分析(または単回帰分析)をいくつかの段階に分けて適用する手法を階層的重回帰分析(hierarchical multiple regression analysis)といいます。
因果関係が図7.4.2のような複雑なものになる時は階層的重回帰分析を行う必要があります。
(3) パス解析
階層的重回帰分析とパス図を利用して、複雑な因果関係を解明しようとする手法をパス解析(path analysis)といいます。
パス解析ではパス図を利用して次のような効果を計算します。
- ○直接効果 … 原因変数が結果変数に直接影響している効果
-
因果関係についてのパス係数の値がそのまま直接効果を表す。
例:図7.4.2の場合
- 年齢 → TCの直接効果:0.321
- 年齢 → TGの直接効果:0.280
- 年齢 → 重症度の直接効果:なし
- TC → 重症度の直接効果:1.239
- TG → 重症度の直接効果:-0.549
- ○間接効果 … A→B→Cという因果関係がある時、AがBを通してCに影響を及ぼしている間接的な効果
-
原因変数と結果変数の経路にある全ての変数のパス係数を掛け合わせた値が間接効果を表す。
経路が複数ある時はそれらの値を合計する。
例:図7.4.2の場合
- 年齢 → (TC + TG) → 重症度の間接効果:0.321×1.239 + 0.280×(-0.549) = 0.244
- TC:重症度に直接影響しているので間接効果はなし
- TG:重症度に直接影響しているので間接効果はなし
- ○相関効果 … 相関関係がある他の原因変数を通して、結果変数に影響を及ぼしている間接的な効果
-
相関関係がある他の原因変数について直接効果と間接効果の合計を求め、それに相関関係のパス係数を掛け合わせた値が相関効果を表す。
相関関係がある変数が複数ある時はそれらの値を合計する。
例:図7.4.2の場合
- 年齢:相関関係がある変数がないため相関効果はなし
- TC → TG → 重症度の相関効果:0.753×(-0.549) = -0.413
- TG → TC → 重症度の相関効果:0.753×1.239 = 0.933
- ○全効果 … 直接効果と間接効果と相関効果を合計した効果
-
原因変数と結果変数の間に直接的な因果関係がある時は単相関係数と一致する。
例:図7.4.2の場合
- 年齢 → 重症度の全効果:0.244(間接効果のみ)
- TC → 重症度の全効果:1.239 - 0.413 = 0.826 (本来はTGと重症度の単相関係数0.827と一致するが、計算誤差のため正確には一致していない)
- TG → 重症度の全効果:-0.549 + 0.933 = 0.384 (本来はTGと重症度の単相関係数0.386と一致するが、計算誤差のため正確には一致していない)
以上のパス解析から次のようなことがわかります。
- 年齢がTCを通して重症度に及ぼす間接効果は正、TGを通した間接効果は負であり、TCを通した間接効果の方が大きい。
- TCが重症度に及ぼす直接効果は正、TGを通した相関効果は負であり、直接効果の方が大きい。
- その結果、TCが重症度に及ぼす全効果つまり単相関係数は正になる。
- TGが重症度に及ぼす直接効果は負、TCを通した相関効果は正であり、相関効果の方が大きい。
- その結果、TGが重症度に及ぼす全効果つまり単相関係数は正になる。
ここで注意しなければならないことは、図7.4.2は表7.4.1のデータを解釈するモデルのひとつであり、他のモデルを組み立てることもできるということです。
例えば年齢と重症度の間にTCとTGを経由しない直接的な因果関係を想定すれば図7.4.2とは異なったパス図を描くことになり、階層的重回帰分析の内容も異なったものになります。
どのようなモデルが最適かを決めるためには、モデルにどの程度の科学的な妥当性があり、パス解析の結果がどの程度科学的に解釈できるかをじっくりと検討する必要があります。
重回帰分析だけでなく判別分析や因子分析とパス解析を組み合わせ、潜在因子も含めた複雑な因果関係を総合的に分析する手法を共分散構造分析(CSA:Covariance Structure Analysis)あるいは構造方程式モデリング(SEM:Structural Equation Modeling)といいます。
これらの手法はモデルの組み立てに恣意性が高いので、主として社会学や心理学分野で用いられます。