前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 |
この章では正準相関分析の原理と結果の解釈方法、そして他の手法との関係について解説します。
一般に、医学分野では人体の生理的な機能を複数の臨床検査値によって総合的に評価します。 例えば腎機能を尿素窒素(BUN)、クレアチニンなどによって総合的に評価したり、肝機能をAST(GOT)、ALT(GPT)、γ-GTPなどによって総合的に評価したりします。 そしてそういった2種類の機能がお互いに影響を及ぼし合っているかどうかを検討するために、それらの間の相関関係を評価したい時があります。
その場合、最も単純な方法は2種類の臨床検査値グループについて総当りで相関係数を求め、それらを総合的に評価する方法です。 この方法では、例えば前述の腎機能に関する2個の臨床検査値と肝機能に関する3個の臨床検査値について、図19.1.1(1)のように全部で3×2 = 6種類の単相関係数が求められます。 そして同じグループの臨床検査値間には相関関係があることを考慮した上で、これら6種類の単相関係数を検討し、腎機能と肝機能の相関関係を総合的に評価する必要があります。 正直いって、これはかなり面倒で難しい作業です。
そこで第7章で説明した重相関係数を利用する方法が考えられます。 重相関係数は、ひとつの項目と複数の項目の間の相関性を表す指標です。 そのため2種類の臨床検査値グループのうち数が少ない方の臨床検査値のひとつひとつについて、もう一方の臨床検査値グループとの重相関係数を求めることによって評価すべき相関係数の数を減らすことができます。 (→7.2 重回帰分析結果の解釈)
例えば前述の腎機能と肝機能では、図19.1.1(2)のように腎機能のBUNとクレアチニンのそれぞれについて、肝機能の3個の臨床検査値との重相関係数を求めます。 そしてこれら2種類の重相関係数を検討する時は、腎機能の2個の臨床検査値間の相関関係だけを考慮して、肝機能と腎機能の相関関係を総合的に評価すれば良いことになります。 しかしこの方法でも、腎機能の臨床検査値同士の相関関係は山カンで評価することになります。 これでは何となく中途半端です。
そこで腎機能の臨床検査同士の相関関係も考慮した上で、図19.1.1(3)のように腎機能の臨床検査値グループと肝機能の臨床検査値グループの相関関係を1つの相関係数で要約できると便利です。 そのようなグループ間の相関のことを正準相関(canonical correlation)といい、正準相関の程度を表す指標のことを正準相関係数(canonical correlation coefficient)といいます。 そして正準相関係数を求める手法のことを正準相関分析(CCA:Canonical Correlation Analysys)といいます。 これは重相関係数と重相関分析を拡張した手法に相当します。
心理学分野では人間の外向性や社会性といった心理的因子を複数のアンケート項目によって評価し、それらの心理的因子がお互いにどのように関連しているかを検討することがあります。 また社会学分野でも社会の開放性や平等性といった社会的因子を色々な指標によって評価し、それらの社会的因子がお互いにどのように関連しているかを検討することがあります。
医学分野では複数の臨床検査値を総合せず、個別に検討する方が多いと思います。 しかし心理学分野や社会学分野では、複数の指標を総合して検討する方が多いと思います。 その意味で正準相関分析は医学分野よりも心理学分野や社会学分野に向いた手法といえるでしょう。
ある集団を対象にして、生理的機能Aを調べるための臨床検査を7種類、生理的機能Bを調べるための臨床検査値を5種類測定した結果が表19.1.1のようになったとします。 この仮想的なデータについて単相関係数、重相関係数、正準相関係数を求めてみましょう。
No. | 臨床検査グループA | 臨床検査グループB | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
A-1 | A-2 | A-3 | A-4 | A-5 | A-6 | A-7 | B-1 | B-2 | B-3 | B-4 | B-5 | |
1 | 46 | 55 | 126 | 51 | 75.0 | 25 | 72 | 6.8 | 489 | 27 | 8 | 360 |
2 | 52 | 55 | 95 | 42 | 81.2 | 18 | 50 | 7.2 | 464 | 30 | 5 | 348 |
3 | 46 | 69 | 107 | 38 | 98.0 | 18 | 74 | 6.8 | 430 | 32 | 9 | 386 |
4 | 49 | 50 | 105 | 48 | 97.6 | 16 | 60 | 6.8 | 362 | 26 | 6 | 331 |
5 | 42 | 55 | 90 | 46 | 66.5 | 2 | 68 | 7.2 | 453 | 23 | 11 | 391 |
6 | 48 | 61 | 106 | 43 | 78.0 | 25 | 58 | 7.0 | 405 | 29 | 7 | 389 |
7 | 49 | 60 | 100 | 49 | 90.6 | 15 | 60 | 7.0 | 420 | 21 | 10 | 379 |
8 | 48 | 63 | 122 | 52 | 56.1 | 17 | 68 | 7.1 | 466 | 28 | 2 | 362 |
9 | 45 | 55 | 105 | 48 | 76.0 | 15 | 61 | 6.8 | 415 | 24 | 6 | 386 |
10 | 48 | 64 | 120 | 38 | 60.2 | 20 | 62 | 7.1 | 413 | 28 | 7 | 398 |
11 | 49 | 52 | 100 | 42 | 53.4 | 6 | 42 | 7.4 | 404 | 23 | 6 | 400 |
12 | 47 | 62 | 100 | 34 | 61.2 | 10 | 62 | 7.2 | 427 | 25 | 7 | 407 |
13 | 41 | 51 | 101 | 53 | 62.4 | 5 | 60 | 8.0 | 372 | 25 | 3 | 409 |
14 | 52 | 55 | 125 | 43 | 86.3 | 5 | 62 | 6.8 | 496 | 30 | 10 | 350 |
15 | 45 | 52 | 94 | 50 | 51.4 | 20 | 65 | 7.6 | 394 | 24 | 3 | 399 |
16 | 49 | 57 | 110 | 47 | 72.3 | 19 | 45 | 7.0 | 446 | 30 | 11 | 337 |
17 | 53 | 65 | 112 | 47 | 90.4 | 15 | 75 | 6.6 | 446 | 30 | 12 | 357 |
18 | 47 | 57 | 95 | 47 | 72.3 | 9 | 64 | 6.6 | 420 | 25 | 4 | 447 |
19 | 48 | 60 | 120 | 47 | 86.4 | 12 | 62 | 6.8 | 447 | 28 | 11 | 381 |
20 | 49 | 55 | 113 | 41 | 84.1 | 15 | 60 | 7.0 | 398 | 27 | 4 | 387 |
21 | 48 | 69 | 128 | 42 | 47.9 | 20 | 63 | 7.1 | 485 | 30 | 7 | 350 |
22 | 42 | 57 | 122 | 46 | 54.2 | 15 | 63 | 7.2 | 400 | 28 | 6 | 388 |
23 | 54 | 64 | 155 | 51 | 71.4 | 19 | 61 | 6.9 | 511 | 33 | 12 | 298 |
24 | 53 | 63 | 120 | 42 | 56.6 | 8 | 53 | 7.5 | 430 | 29 | 4 | 353 |
25 | 42 | 71 | 138 | 44 | 65.2 | 17 | 55 | 7.0 | 487 | 29 | 9 | 370 |
26 | 46 | 66 | 120 | 45 | 62.2 | 22 | 68 | 7.4 | 470 | 28 | 7 | 360 |
27 | 45 | 56 | 91 | 29 | 66.2 | 18 | 51 | 7.9 | 380 | 26 | 5 | 358 |
28 | 50 | 60 | 120 | 42 | 56.6 | 8 | 57 | 6.8 | 460 | 32 | 5 | 348 |
29 | 42 | 51 | 126 | 50 | 50.0 | 13 | 57 | 7.7 | 398 | 27 | 2 | 383 |
30 | 48 | 50 | 115 | 41 | 52.9 | 6 | 39 | 7.4 | 415 | 28 | 6 | 314 |
31 | 42 | 52 | 140 | 48 | 56.3 | 15 | 60 | 6.9 | 470 | 27 | 11 | 348 |
32 | 48 | 67 | 105 | 39 | 69.2 | 23 | 60 | 7.6 | 450 | 28 | 10 | 326 |
33 | 49 | 74 | 151 | 49 | 54.2 | 20 | 58 | 7.0 | 500 | 30 | 12 | 330 |
34 | 47 | 55 | 113 | 40 | 71.4 | 19 | 64 | 7.6 | 410 | 29 | 7 | 331 |
35 | 49 | 74 | 120 | 53 | 54.5 | 22 | 59 | 6.9 | 500 | 33 | 21 | 348 |
36 | 44 | 52 | 110 | 37 | 54.9 | 14 | 57 | 7.5 | 400 | 29 | 2 | 421 |
37 | 52 | 66 | 130 | 47 | 45.9 | 14 | 45 | 6.8 | 505 | 28 | 11 | 355 |
38 | 48 | 68 | 100 | 45 | 53.6 | 23 | 70 | 7.2 | 522 | 28 | 9 | 352 |
この場合は表19.1.2のように(7 + 5)×(7 + 5 - 1)/2 = 66個の単相関係数が求められます。 そしてこれらの単相関係数を総合的に考察して、2つの臨床検査グループの間の相関関係を検討することになります。 現実問題として、これはほとんど不可能でしょう。
A-1 | A-2 | A-3 | A-4 | A-5 | A-6 | A-7 | B-1 | B-2 | B-3 | B-4 | B-5 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
A-1 | 1 | 0.301 | 0.164 | -0.029 | 0.246 | 0.072 | -0.166 | -0.401 | 0.361 | 0.412 | 0.280 | -0.470 |
A-2 | 0.301 | 1 | 0.387 | 0.009 | -0.101 | 0.456 | 0.251 | -0.300 | 0.640 | 0.508 | 0.560 | -0.243 |
A-3 | 0.164 | 0.387 | 1 | 0.319 | -0.243 | 0.193 | -0.018 | -0.303 | 0.559 | 0.554 | 0.322 | -0.480 |
A-4 | -0.029 | 0.009 | 0.319 | 1 | -0.037 | 0.052 | 0.204 | -0.283 | 0.271 | -0.041 | 0.247 | -0.093 |
A-5 | 0.246 | -0.101 | -0.243 | -0.037 | 1 | 0.052 | 0.323 | -0.430 | -0.184 | -0.012 | 0.142 | -0.018 |
A-6 | 0.072 | 0.456 | 0.193 | 0.052 | 0.052 | 1 | 0.281 | -0.080 | 0.260 | 0.331 | 0.236 | -0.289 |
A-7 | -0.166 | 0.251 | -0.018 | 0.204 | 0.323 | 0.281 | 1 | -0.257 | 0.150 | 0.039 | 0.084 | 0.192 |
B-1 | -0.401 | -0.300 | -0.303 | -0.283 | -0.430 | -0.080 | -0.257 | 1 | -0.443 | -0.265 | -0.463 | 0.074 |
B-2 | 0.361 | 0.640 | 0.559 | 0.271 | 0.184 | 0.260 | 0.150 | -0.443 | 1 | 0.499 | 0.607 | -0.469 |
B-3 | 0.412 | 0.508 | 0.554 | -0.041 | -0.012 | 0.331 | 0.039 | -0.265 | 0.499 | 1 | 0.356 | -0.521 |
B-4 | 0.280 | 0.560 | 0.322 | 0.247 | 0.142 | 0.236 | 0.084 | -0.463 | 0.607 | 0.356 | 1 | -0.420 |
B-5 | -0.470 | -0.243 | -0.480 | -0.093 | -0.018 | -0.289 | 0.192 | 0.074 | -0.469 | -0.521 | -0.420 | 1 |
この場合は表19.1.3のように重相関係数が5個と偏相関係数が5×7 = 35個求められます。 そして重相関係数の値から、グループAとグループBはお互いに相関が高く、中でもB-2とグループAの相関が最も高いことがわかります。 そしてB-2はA-2、A-3、A-1との相関が高く、A-6との相関は低いこともわかります。 B-2とグループAの偏相関係数は表19.1.2の単相関係数と似ているものの、偏相関係数は他の項目の影響を補正した値なので、より厳密な値になっています。
重相関係数 | 偏相関係数 | |||||||
---|---|---|---|---|---|---|---|---|
A-1 | A-2 | A-3 | A-4 | A-5 | A-6 | A-7 | ||
B-1 | 0.702356 | -0.240821 | -0.227078 | -0.280453 | -0.260044 | -0.453061 | 0.177214 | -0.104178 |
B-2 | 0.774491 | 0.320357 | 0.443797 | 0.332893 | 0.221055 | -0.21672 | -0.0548852 | 0.154852 |
B-3 | 0.723069 | 0.298363 | 0.179488 | 0.509749 | -0.261159 | 0.0384377 | 0.169075 | 0.0471639 |
B-4 | 0.679066 | -0.0365556 | 0.544883 | 0.0755864 | 0.325196 | 0.332769 | -0.0424438 | -0.24156 |
B-5 | 0.683631 | -0.374557 | 0.0956927 | -0.429634 | -0.000284684 | -0.0808348 | -0.316026 | 0.214496 |
表19.1.3の結果は表19.1.2の結果よりも解釈が簡単です。 しかしこの結果を総合的に解釈するには、グループBの項目同士の相関関係も考慮する必要があります。 これはやはり少々難しいことです。
正準相関分析は、まずグループごとに主成分のような要約値である正準変量(canonical variate)を主成分分析と似た方法で求めます。 次に正準変量についてグループ間で相関係数を求め、それが正準相関係数になります。 原則として、正準変量は項目数の少ない方のグループの項目数と同じ数だけ求めることができます。 そして各正準変量がどの程度の情報を要約しているかを表す寄与率を求めることができます。 またグループ内の正準変量はお互いに独立なので、個々の正準相関係数を独立に検討することができます。
A 対 B | 正準変量1 | 正準変量2 | 正準変量3 | 正準変量4 | 正準変量5 |
---|---|---|---|---|---|
正準相関係数 | 0.851471 | 0.72841 | 0.610896 | 0.393214 | 0.324657 |
寄与率(固有値) | 0.725002 | 0.530581 | 0.373194 | 0.154617 | 0.105402 |
表19.1.4では5個全ての正準変量が抽出されていて、それぞれ正準相関係数と寄与率が求められています。 この場合の寄与率は正準相関係数を平方した値であり、主成分分析の固有値に相当します。 これらの正準変量を全て検討せず、寄与率の大きい正準変量についてだけ検討してもかまいません。 例えば寄与率が50%以上の正準変量についてだけ検討するなら、正準変量1と2だけを独立に検討すれば良いことになります。 そしてこれらの正準相関係数の値から、グループAとグループBは相関が高いと容易に解釈することができます。 (→16.1 主成分と主成分分析)
ただしこれらの正準変量がどのような情報を要約したものであるかについては、主成分分析と同様に正準変量と元の項目の関係に注目して検討する必要があります。 それについては次節で説明します。