前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 |
一口に多変量解析といっても多種多様な手法があり、お互いに密接な関係を持っています。 それらの手法を大雑把に分類してみましょう。 第2節で説明したように、多変量解析を適用するデータにはTCやTGのようにその項目だけで独立して測定されたものと、重症度のように他のデータを要約して得られたものとがあります。 あるデータが直接にしろ間接にしろ結果として他のデータに影響を与えている時、影響を与えているデータを説明変数または独立変数と呼び、影響を与えられているデータを目的変数または従属変数と呼びます。 この分類からすればTCとTGは説明変数、重症度は目的変数であると考えることができます。 (→5.1 相関係数と回帰直線)
多変量解析では説明変数を内的基準と呼び、目的変数を外的基準または基準変数(criterion variable)と呼ぶことがあります。 さらに直接観測可能ではなく、色々なデータの変動パターンを通して間接的に推測されるような変数のことを潜在変数(latent variable)と呼びます。 これらの変数の個数やデータの種類——計量値か計数値か——に応じてさまざまな手法があり、それらの手法は次のような2種類に大別できます。
予測・判別の問題は目的変数が説明変数からどのように影響を受けているのかをデータに基いて分析し、その内容を検討したり、あるいは説明変数が特定の値だった時に目的変数がどのような値になるかを予測したりするものです。 これには第2節で説明した勘ピュータによる概括評価規準の分析などが含まれます。
データの内部構造の分析は項目と項目がどのようにからみ合い、どのように影響を及ぼし合っているかを分析したり、それに基づいて効率的な要約値を求めたりするものです。 これには第2節で説明した数学的な概括評価規準の設定などが含まれます。
変数の個数とデータの種類によって主な多変量解析手法を分類すると表6.3.1のようになります。
手法名 | 基準変数 | 説明変数 | 潜在変数 | |||
---|---|---|---|---|---|---|
名義尺度 | 計量尺度 | 名義尺度 | 計量尺度 | 名義尺度 | 計量尺度 | |
重回帰分析 | − | 1 | − | 多数 | − | − |
共分散分析 | − | 1 | 多数 | 多数 | − | − |
分散分析 | − | 1 | 多数 | − | − | − |
数量化I類 | − | 1 | 多数 | − | − | − |
多変量回帰分析 | − | 多数 | − | 多数 | − | − |
正準相関分析 | − | 多数 | − | 多数 | − | − |
(線形)判別分析 | 1(2分類)(注1) | − | − | 多数 | − | − |
重判別分析 | 1(多分類)(注1) | − | − | 多数 | − | − |
ロジスティック回帰分析 | 1(2分類) | − | − | 多数 | − | − |
順序ロジスティック回帰分析 | 1(多分類) | − | − | 多数 | − | − |
ポアソン回帰分析 | 1(2分類) | − | − | 多数 | − | − |
数量化II類 | 1(多分類)(注1) | − | 多数 | − | − | − |
多変量生命表解析(注2) | 1(2分類) | − | − | 多数 | − | − |
主成分分析 | − | − | − | 多数 | − | − |
因子分析 | − | 多数 | − | − | − | 多数 |
数量化III類 | − | − | 多数 | − | − | (多数) |
クラスター分析 | − | − | − | 多数 | 多数 | − |
数量化IV類 | − | − | 多数 | − | 多数 | − |
多次元尺度構成法 | − | − | − | 多数 | - | − |
多変量解析手法の中には原理的に同じものであり、条件によっては同一の手法になってしまうものも少なくありません。 例えば重回帰分析において、説明変数が名義尺度の時は分散分析または数量化I類に相当し、説明変数に計量尺度と名義尺度が混在している時は共分散分析に相当します。 そして目的変数が名義尺度になった時は(線形)判別分析に相当し、その名義尺度をロジスティック変換によって計量尺度化した時はロジスティック回帰分析に相当します。 さらに(線形)判別分析において、説明変数も名義尺度の時は数量化II類に相当します。
多変量解析手法の中で数学的に最も一般的なものは正準相関分析です。 表6.3.1では正準相関分析は説明変数が計量尺度多数で基準変数も計量尺度多数になっていますが、実際には説明変数と基準変数という区別はなく、2種類の変数グループ間の相関関係を分析するための手法です。 正準相関分析において、説明変数も基準変数も1つだけの時は普通の相関分析になります。 そして説明変数と基準変数の間に因果関係を想定すると、多変量回帰分析に相当します。 さらに基準変数が1つだけの時は重回帰分析に相当し、基準変数が名義尺度の時は重判別分析に相当します。 また基準変数がない時は主成分分析に相当し、説明変数が潜在変数になった時は因子分析に相当します。
一方、主成分分析において、説明変数が名義尺度の時は数量化III類に相当します。 そして因子分析において、基準変数が名義尺度の時も数量化III類に相当します。 さらにクラスター分析において、説明変数が分類尺度の時は数量化IV類に相当します。 ちなみに説明変数または基準変数として潜在変数を想定する因子分析と数量化III類そしてクラスター分析と数量化IV類は、潜在変数の想定法に任意性があるので数学的にまだ確立されていない部分が多く、現在も色々と研究され続けています。
多変量解析の中で最も利用頻度が高い手法は、重回帰分析とその親戚に当たる判別分析です。 この2つの手法は多変量解析の基礎ともいうべき手法であり、応用範囲が広く、手法のバリエーションも豊富なので、医学や薬学に限らず各種の分野で広く利用されています。 他の手法はともかく、重回帰分析と判別分析だけは理解するよう努力してください。
またデータの要約という意味から、最も多変量解析らしい手法は主成分分析と因子分析です。 これらの手法は理論的に複雑なので数学者には好まれているものの、実際の医学・薬学研究者にはあまり利用されていません。 もし時間にも理解力にも十分な余裕があるようなら、これらの手法も理解してみてください。