玄関雑学の部屋雑学コーナー統計学入門

6.3 多変量解析の分類

(1) 内的基準と外的基準

一口に多変量解析といっても多種多様な手法があり、お互いに密接な関係を持っています。 それらの手法を大雑把に分類してみましょう。 第2節で説明したように、多変量解析を適用するデータにはTCやTGのようにその項目だけで独立して測定されたものと、重症度のように他のデータを要約して得られたものとがあります。 あるデータが直接にしろ間接にしろ結果として他のデータに影響を与えている時、影響を与えているデータを説明変数または独立変数と呼び、影響を与えられているデータを目的変数または従属変数と呼びます。 この分類からすればTCとTGは説明変数、重症度は目的変数であると考えることができます。 (→5.1 相関係数と回帰直線)

多変量解析では説明変数を内的基準と呼び、目的変数を外的基準または基準変数(criterion variable)と呼ぶことがあります。 さらに直接観測可能ではなく、色々なデータの変動パターンを通して間接的に推測されるような変数のことを潜在変数(latent variable)と呼びます。 これらの変数の個数やデータの種類——計量値か計数値か——に応じてさまざまな手法があり、それらの手法は次のような2種類に大別できます。

予測・判別の問題は目的変数が説明変数からどのように影響を受けているのかをデータに基いて分析し、その内容を検討したり、あるいは説明変数が特定の値だった時に目的変数がどのような値になるかを予測したりするものです。 これには第2節で説明した勘ピュータによる概括評価規準の分析などが含まれます。

データの内部構造の分析は項目と項目がどのようにからみ合い、どのように影響を及ぼし合っているかを分析したり、それに基づいて効率的な要約値を求めたりするものです。 これには第2節で説明した数学的な概括評価規準の設定などが含まれます。

変数の個数とデータの種類によって主な多変量解析手法を分類すると表6.3.1のようになります。

表6.3.1 多変量解析手法の分類
手法名基準変数説明変数潜在変数
名義尺度計量尺度名義尺度計量尺度名義尺度計量尺度
重回帰分析1多数
共分散分析1多数多数
分散分析1多数
数量化I類1多数
多変量回帰分析多数多数
正準相関分析多数多数
(線形)判別分析1(2分類)(注1)多数
重判別分析1(多分類)(注1)多数
ロジスティック回帰分析1(2分類)多数
順序ロジスティック回帰分析1(多分類)多数
ポアソン回帰分析1(2分類)多数
数量化II類1(多分類)(注1)多数
多変量生命表解析(注2)1(2分類)多数
主成分分析多数
因子分析多数多数
数量化III類多数(多数)
クラスター分析多数多数
数量化IV類多数多数
多次元尺度構成法多数-

(2) 多変量解析手法間の関係

多変量解析手法の中には原理的に同じものであり、条件によっては同一の手法になってしまうものも少なくありません。 例えば重回帰分析において、説明変数が名義尺度の時は分散分析または数量化I類に相当し、説明変数に計量尺度と名義尺度が混在している時は共分散分析に相当します。 そして目的変数が名義尺度になった時は(線形)判別分析に相当し、その名義尺度をロジスティック変換によって計量尺度化した時はロジスティック回帰分析に相当します。 さらに(線形)判別分析において、説明変数も名義尺度の時は数量化II類に相当します。

多変量解析手法の中で数学的に最も一般的なものは正準相関分析です。 表6.3.1では正準相関分析は説明変数が計量尺度多数で基準変数も計量尺度多数になっていますが、実際には説明変数と基準変数という区別はなく、2種類の変数グループ間の相関関係を分析するための手法です。 正準相関分析において、説明変数も基準変数も1つだけの時は普通の相関分析になります。 そして説明変数と基準変数の間に因果関係を想定すると、多変量回帰分析に相当します。 さらに基準変数が1つだけの時は重回帰分析に相当し、基準変数が名義尺度の時は重判別分析に相当します。 また基準変数がない時は主成分分析に相当し、説明変数が潜在変数になった時は因子分析に相当します。

一方、主成分分析において、説明変数が名義尺度の時は数量化III類に相当します。 そして因子分析において、基準変数が名義尺度の時も数量化III類に相当します。 さらにクラスター分析において、説明変数が分類尺度の時は数量化IV類に相当します。 ちなみに説明変数または基準変数として潜在変数を想定する因子分析と数量化III類そしてクラスター分析と数量化IV類は、潜在変数の想定法に任意性があるので数学的にまだ確立されていない部分が多く、現在も色々と研究され続けています。

図6.3.1 各種多変量解析手法の関係

多変量解析の中で最も利用頻度が高い手法は、重回帰分析とその親戚に当たる判別分析です。 この2つの手法は多変量解析の基礎ともいうべき手法であり、応用範囲が広く、手法のバリエーションも豊富なので、医学や薬学に限らず各種の分野で広く利用されています。 他の手法はともかく、重回帰分析と判別分析だけは理解するよう努力してください。

またデータの要約という意味から、最も多変量解析らしい手法は主成分分析と因子分析です。 これらの手法は理論的に複雑なので数学者には好まれているものの、実際の医学・薬学研究者にはあまり利用されていません。 もし時間にも理解力にも十分な余裕があるようなら、これらの手法も理解してみてください。


(注1) 判別分析は群によって多数の変数がどのように分布するかを調べ、その違いに着目して群を判別する手法です。 したがってこの手法では名義尺度である群が説明変数であり、計量尺度である多数の変数が目的変数つまり基準変数と解釈する方が妥当です。 しかし従来はこのように分類されることが多いので、ここでは従来の分類法に従いました。 また数量化II類は重判別分析の数量化版に相当するので群が説明変数になりますが、やはり従来の分類法に従いました。

(注2) 生命表解析は特殊な手法のため、多変量生命表解析は一般的な多変量解析とは別に分類します。 しかし医学・薬学分野では多変量生命表解析を使用することが多いので、ここでは多変量解析に含めることにしました。