前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 | 4 |
この章では判別分析を利用した多群の判別、重判別分析の原理と結果の解釈方法、そして多変量分散分析との関係について解説します。
医学分野ではひとつの疾患を判別するだけでなく、2つ以上の疾患を同時に判別したり、疾患に色々なタイプがあって、そのタイプまで判別したい時があります。 そのような場合は疾患と正常の判別という2群の判別ではなく、疾患Aと疾患Bと正常の判別というような多群の判別が必要になります。 例えば正常、疾患A、疾患Bの3群について5種類の検査項目(計量値)を測定したところ、表18.1.1のようになったとします。
ID | 群 | 検査項目1 | 検査項目2 | 検査項目3 | 検査項目4 | 検査項目5 |
---|---|---|---|---|---|---|
N01 | 正常 | 0 | 2 | 2 | 4 | 3 |
N02 | 正常 | 0 | 3 | 3 | 5 | 5 |
N03 | 正常 | 1 | 4 | 3 | 3 | 2 |
N04 | 正常 | 2 | 4 | 5 | 4 | 2 |
N05 | 正常 | 0 | 5 | 4 | 3 | 3 |
N06 | 正常 | 1 | 6 | 3 | 3 | 6 |
N07 | 正常 | 0 | 6 | 5 | 6 | 6 |
N08 | 正常 | 2 | 6 | 6 | 4 | 4 |
N09 | 正常 | 0 | 7 | 5 | 7 | 4 |
N10 | 正常 | 0 | 8 | 6 | 2 | 5 |
A01 | 疾患A | 0 | 1 | 3 | 6 | 5 |
A02 | 疾患A | 1 | 1 | 4 | 4 | 4 |
A03 | 疾患A | 0 | 2 | 3 | 1 | 3 |
A04 | 疾患A | 0 | 2 | 5 | 7 | 5 |
A05 | 疾患A | 2 | 3 | 4 | 5 | 8 |
A06 | 疾患A | 0 | 3 | 5 | 3 | 1 |
A07 | 疾患A | 2 | 3 | 6 | 2 | 3 |
A08 | 疾患A | 0 | 4 | 4 | 2 | 3 |
A09 | 疾患A | 0 | 4 | 5 | 4 | 6 |
A10 | 疾患A | 1 | 4 | 6 | 3 | 2 |
A11 | 疾患A | 0 | 5 | 5 | 6 | 4 |
A12 | 疾患A | 0 | 5 | 6 | 4 | 7 |
A13 | 疾患A | 1 | 5 | 7 | 3 | 1 |
A14 | 疾患A | 0 | 6 | 7 | 3 | 6 |
A15 | 疾患A | 0 | 7 | 8 | 5 | 5 |
B01 | 疾患B | 0 | 2 | 2 | 3 | 4 |
B02 | 疾患B | 1 | 2 | 4 | 6 | 7 |
B03 | 疾患B | 0 | 3 | 3 | 4 | 3 |
B04 | 疾患B | 0 | 3 | 4 | 6 | 5 |
B05 | 疾患B | 0 | 4 | 4 | 7 | 6 |
B06 | 疾患B | 2 | 4 | 4 | 3 | 2 |
B07 | 疾患B | 0 | 4 | 5 | 8 | 6 |
B08 | 疾患B | 0 | 5 | 3 | 6 | 7 |
B09 | 疾患B | 0 | 5 | 4 | 4 | 3 |
B10 | 疾患B | 0 | 6 | 5 | 6 | 5 |
B11 | 疾患B | 1 | 7 | 6 | 5 | 8 |
B12 | 疾患B | 0 | 7 | 7 | 5 | 4 |
このデータを用いて3群の判別を行う時、最初に考えられるのは2群ごとに判別分析を適用し、それらの結果を総合的に検討して群の判別を行うという方法です。 その方法を適用すると次のようになります。 (→第9章 判別分析)
この結果を見ると正常群と疾患A群の判別確率が最も高く、次が疾患A群と疾患B群、最後が正常群と疾患B群であることがわかります。 つまり正常群と疾患A群が最も異なっていて、疾患B群は疾患A群よりも正常群に近いと解釈できます。 そして3群の判別に大きく寄与するのは検査項目2と検査項目3ですが、正常群と疾患A群および疾患B群を判別する時と、疾患A群と疾患B群を判別する時では判別係数の符号が反対になる、つまり影響の仕方が反対になることがわかります。
上記の判別関数を用いて、例えば疾患A群のA07の症例について判別スコアを計算すると次のようになります。
最初の判別スコアと2番目の判別スコアから、この症例は正常の確率は低いことがわかります。 そしてさらに3番目の判別スコアも考慮すると、疾患Aの確率が最も高いことがわかります。 したがってこの症例は疾患Aと判別することになり、正しく判別することができます。