前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 |
正準相関分析は記述統計学的な手法なので、推測統計学的手法である検定とは相性が良くありません。 しかし何が何でも検定をしないと気が済まない有意症患者のために、正準相関係数の近似的な検定手法が考案されています。 それには個々の母正準相関係数が0かどうかを検定する手法と、全ての母正準相関係数が0かどうかを一括して検定する手法の2種類があります。 表19.1.1のデータにそれらの検定を適用すると次のようになります。 (注1)
これらの検定結果から、5つの母正準相関係数は0ではないといえます。 正準相関分析を適用するためには多数例のデータが必要ですから、このデータのように検定結果はたいてい有意になります。 しかしこれらは単なる有意性検定のため意味はあまり無く、正準相関係数の値そのものと、それらが表している意味を解釈する方が大切です。
正準相関分析は重相関分析を拡張した手法であり、一方の項目グループが1つの時は重相関分析に相当します。 そこで第7章の表6.1.1のデータに正準相関分析を適用してみましょう。 重回帰分析に合わせて、便宜的に表6.1.1のTCをx1、TGをx2、重症度をyで表します。
患者No. | x1:TC | x2:TG | y:重症度 |
---|---|---|---|
1 | 220 | 110 | 0 |
2 | 230 | 150 | 1 |
3 | 240 | 150 | 2 |
4 | 240 | 250 | 1 |
5 | 250 | 200 | 3 |
6 | 260 | 150 | 3 |
7 | 260 | 250 | 2 |
8 | 260 | 290 | 1 |
9 | 270 | 250 | 4 |
10 | 280 | 290 | 4 |
これに対して重回帰分析と重相関分析の結果は次のとおりでした。 (→7.2 重回帰分析結果の解釈)
これらの結果を比べると第1正準相関係数と重相関係数およびそれらの寄与率が一致し、全ての正準相関係数の検定と重相関係数の検定がほぼ一致していることがわかります。 そして正準スコアu1の正準変量係数と重回帰式の偏回帰係数はよく似ていて、両者の間には一定の比例関係があることがわかります。
重回帰分析ではyの推測値を重回帰式から求めます。 そのための単位は元のyと同じで、の平均値はyの平均値と一致し、標準偏差はyの標準偏差よりも推測誤差分だけ小さくなります。 例えば表6.1.1のデータの場合、yもも平均値は2.1で、標準偏差はyが1.37032であるのに対しては1.2361です。 それに対して正準スコアは平均値が0で標準偏差が1になるように標準化されています。 そのため正準変量係数を1.2361(の標準偏差)倍すると、偏回帰係数に一致します。 そして正準スコアの切片-16.6664043を1.2361倍して2.1を足すと、重回帰式の切片-18.5014に一致します。
重相関分析または重回帰分析において、説明変数が1つだけの時は単相関分析と単回帰分析になります。 そのため正準相関分析も2つの項目グループがどちらも1つだけの時は単相関分析または単回帰分析に相当します。 これらのことから正準相関分析は相関分析と回帰分析の最も一番的な手法であることがわかると思います。
次に正準相関分析と重判別分析の関係について検討しましょう。 重判別分析は正準分析とも呼ばれることからわかるように、正準相関分析の親切筋に当たる手法です。 第18章の表18.1.1のデータに正準相関分析を適用してみましょう。 便宜的に表18.1.1の3群をy1とy2というダミー変数で表し、検査項目1〜5をx1〜x5で表します。
ID | y1 疾患A | y2 疾患B | x1 検査項目1 | x2 検査項目2 | x3 検査項目3 | x4 検査項目4 | x5 検査項目5 |
---|---|---|---|---|---|---|---|
N01 | 0 | 0 | 0 | 2 | 2 | 4 | 3 |
N02 | 0 | 0 | 0 | 3 | 3 | 5 | 5 |
N03 | 0 | 0 | 1 | 4 | 3 | 3 | 2 |
N04 | 0 | 0 | 2 | 4 | 5 | 4 | 2 |
N05 | 0 | 0 | 0 | 5 | 4 | 3 | 3 |
N06 | 0 | 0 | 1 | 6 | 3 | 3 | 6 |
N07 | 0 | 0 | 0 | 6 | 5 | 6 | 6 |
N08 | 0 | 0 | 2 | 6 | 6 | 4 | 4 |
N09 | 0 | 0 | 0 | 7 | 5 | 7 | 4 |
N10 | 0 | 0 | 0 | 8 | 6 | 2 | 5 |
A01 | 1 | 0 | 0 | 1 | 3 | 6 | 5 |
A02 | 1 | 0 | 1 | 1 | 4 | 4 | 4 |
A03 | 1 | 0 | 0 | 2 | 3 | 1 | 3 |
A04 | 1 | 0 | 0 | 2 | 5 | 7 | 5 |
A05 | 1 | 0 | 2 | 3 | 4 | 5 | 8 |
A06 | 1 | 0 | 0 | 3 | 5 | 3 | 1 |
A07 | 1 | 0 | 2 | 3 | 6 | 2 | 3 |
A08 | 1 | 0 | 0 | 4 | 4 | 2 | 3 |
A09 | 1 | 0 | 0 | 4 | 5 | 4 | 6 |
A10 | 1 | 0 | 1 | 4 | 6 | 3 | 2 |
A11 | 1 | 0 | 0 | 5 | 5 | 6 | 4 |
A12 | 1 | 0 | 0 | 5 | 6 | 4 | 7 |
A13 | 1 | 0 | 1 | 5 | 7 | 3 | 1 |
A14 | 1 | 0 | 0 | 6 | 7 | 3 | 6 |
A15 | 1 | 0 | 0 | 7 | 8 | 5 | 5 |
B01 | 0 | 1 | 0 | 2 | 2 | 3 | 4 |
B02 | 0 | 1 | 1 | 2 | 4 | 6 | 7 |
B03 | 0 | 1 | 0 | 3 | 3 | 4 | 3 |
B04 | 0 | 1 | 0 | 3 | 4 | 6 | 5 |
B05 | 0 | 1 | 0 | 4 | 4 | 7 | 6 |
B06 | 0 | 1 | 2 | 4 | 4 | 3 | 2 |
B07 | 0 | 1 | 0 | 4 | 5 | 8 | 6 |
B08 | 0 | 1 | 0 | 5 | 3 | 6 | 7 |
B09 | 0 | 1 | 0 | 5 | 4 | 4 | 3 |
B10 | 0 | 1 | 0 | 6 | 5 | 6 | 5 |
B11 | 0 | 1 | 1 | 7 | 6 | 5 | 8 |
B12 | 0 | 1 | 0 | 7 | 7 | 5 | 4 |
これに対して重判別分析の結果は次のとおりでした。 (→18.2 重判別分析)
正準相関分析の寄与率つまり固有値r2と重判別分析の固有値λの間には、理論的に次のような関係があります。 (注2)
重判別分析の正準スコアは全体の平均値が0であり、群ごとの標準偏差はほぼ1です。 しかし全体の標準偏差は群ごとの平均値がばらついている分だけ大きくなるので、普通は1よりも大きくなります。 例えば表18.1.1の場合、第1正準スコアの全体の標準偏差は1.64379になり、第2正準スコアの全体の標準偏差は1.0399になります。
それに対して正準スコアは、平均値が0で標準偏差が1になるように標準化されています。 そのため第1正準変量係数を1.64379倍すると重判別分析の第1正準係数に一致し、第2正準変量係数を1.0399倍すると重判別分析の第2正準係数に一致します。 そして平均値はどちらも0なので、切片についても同じ値を掛けるだけで両者が一致します。 また全ての正準相関係数の検定結果とウィルキスのΛによる検定結果がほぼ一致していて、全ての正準相関係数の検定は多変量分散分析に相当することがわかります。
群が2つの時の重判別分析は普通の線形判別分析に相当します。 そのため正準相関分析も一方の項目グループが1つのダミー変数だけの時は線形判別分析に相当します。 また多変量分散分析は変数が1つだけの時は一元配置分散分析に相当します。 そのため正準相関分析も一方の項目グループが1つの項目だけの時は一元配置分散分析に相当し、さらにもう一方の項目グループが1つのダミー変数だけの時は2つの平均値の差の検定つまり2標本t検定に相当します。 これらのことから正準相関分析は非常に汎用的な手法であることがわかると思います。
表19.1.1のデータについて実際に計算してみましょう。
データベクトルx.1、…、x.pはn次元ベクトル空間Vnの内部にp次元部分空間Wx(超平面α)を張り、データベクトルy.1、…、y.qはq次元部分空間Wy(超平面β)を張ります。 そして第k正準変量ukは超平面α上でx.1、…、x.pの1次結合した合成ベクトルであり、vkは超平面β上でy.1、…、y.qを一次結合した合成ベクトルです。 この時、ukとvkはこれらのベクトルのなす角θが最小になるように合成されたもので、このθの余弦であるcosθが第k正準相関係数rkになります。
図19.3.1でデータベクトルyが1つだけの時は第7章の図7.1.2と原理的に同じものになり、重回帰モデルになります。 またデータ行列Yが多群を分類するためのダミーデータの場合は次のようになります。
この固有方程式はλ/(1 - λ)を固有値にした重判別分析の固有方程式に相当します。 そのため、この場合の正準相関分析は重判別分析に相当します。 さらにデータ行列Yがない時、正準変量uはデータ行列Xの主成分になります。 そのため、この場合の正準相関分析は主成分分析に相当します。 (→18.2 重判別分析 (注1)、16.1 主成分と主成分分析 (注1))