前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 | 4 | 5 |
データが計数値の場合、2つの項目間の関連性を要約するには主にノンパラ手法を用います。 それらの手法は原理的には計量値の相関分析や回帰分析と同様ですが、データとして順位や度数を用いるところが違っています。
まずデータが順序尺度の時から説明しましょう。 表5.1.1のデータについて体長と尾長のそれぞれに順位を付けて順序尺度にすると次のようになります。 これは後ろ向き研究から得られたデータなのでどちらの順位にも誤差がある点に注意してください。
No. | 体長 | 体長順位(rx) | 尾長 | 尾長順位(ry) |
---|---|---|---|---|
1 | 10.00 | 7 | 8.04 | 7 |
2 | 8.00 | 5 | 6.95 | 4 |
3 | 13.00 | 10 | 7.58 | 6 |
4 | 9.00 | 6 | 8.81 | 9 |
5 | 11.00 | 8 | 8.33 | 8 |
6 | 14.00 | 11 | 9.96 | 10 |
7 | 6.00 | 3 | 7.24 | 5 |
8 | 4.00 | 1 | 4.26 | 1 |
9 | 12.00 | 9 | 10.84 | 11 |
10 | 7.00 | 4 | 4.82 | 2 |
11 | 5.00 | 2 | 5.68 | 3 |
平均値 | 9.00 | 6 | 7.50 | 6 |
この表について実測値の代りに順位rxとryを用いて普通の相関係数を計算してみましょう。
このようにして求めたrsをスピアマンの順位相関係数(Spearman's rank correlation coefficient)といいます。 実測値の代わりに順位を用いただけですから、この相関係数と寄与率の意味は通常の相関係数と同じですし、値も第1節の結果とほとんど変わりません。 なおこのデータには同位の値はありませんが、もし同位の値があれば今までと同じように平均順位を用いて計算します。 (→3.2 1標本の計数値 (注2))
また普通の相関係数と同様に順位相関係数の検定と推定を行なうことができます。 検定は普通の相関係数と同じようにt分布を利用する方法と正規分布を利用する方法があります。 統計学の解説書などではt分布を利用する方法がよく紹介されていますが、ウィルコクソンの2標本検定との関連を考えると正規分布を利用する方法の方が合理的です。 (注1)
データが重症度のような順序分類尺度の時にも、同位の値が多くはなるでしょうが、全く同様に順位相関係数を計算することができます。 しかしそんな時には重症度を次のように計量化し、計量尺度扱いしてしまってもかまいません。
この方が結果の解釈が容易になる上に、こうしないと相関関係をうまく反映できない時もあります。 実際問題として順位相関係数というワケのわからないシロモノを使うよりも、多少不正確でもワケのわかりやすい手法を使う方が賢明です。 (→3.4 2標本の計数値 (1)順序尺度)
また統計学の解説書などによく次のようなことが書かれていて、これをそのまま盲信している人がいると思います。
「たとえ計量尺度のデータでも、正規分布しない時とかデータ数が少ない時とか直線性が低い時は普通の相関係数ではなく順位相関係数を計算しなければならない!」
しかしこれは統計手法と要約値の科学的な意義を無視した乱暴な主張ですから、こんな主張を鵜呑みにしてはいけません。 順位相関係数は2つのデータの順位の間の関連性を表すラフな指標であり、実測値の間の関連性を表す指標ではありません。 例えば図5.3.1のように2つのデータの間の関係が直線的な場合と、値が大きくなるにつれて頭打ちの傾向がある場合について考えてみましょう。 これら2つの場合について普通の相関係数と順位相関係数を計算すると、直線的な関係の場合はどちらも1ですが、頭打ちの関係の場合はそれぞれ0.95と1になります。 これは次のようなことを意味しています。
「2つのデータの計量的な大小関係は直線的な場合は完全に一致しているが、頭打ちの場合は完全には一致していない。 しかし2つのデータの順序の大小関係はどちらの場合も完全に一致している」
このような時、「2つのデータの計量的な関係ではなく順序関係が重要であり、2つのデータの関係が直線的な場合も頭打ちの場合も科学的な意味は同じである」と考えられるのなら順位相関係数を指標にすべきです。 しかし「2つのデータの計量的な関係が重要であり、2つのデータの関係が直線的な場合と頭打ちの場合では科学的な意味は異なる」と考えられるのなら普通の相関係数を指標にすべきです。
そして計量的な関係が重要な時は「2つのデータの大小関係はだいたい一致しているが、値が大きくなるにつれて一方のデータは頭打ちの傾向がある」という関係を特定の関数で表現できるかどうか検討することになります。 例えば対数関係で表現できるかどうかは、一方のデータを対数変換してから相関係数を計算し、実測値を用いた時の相関係数と比べて値が大きくなるか小さくなるかを調べる、といった方法で検討することができます。
このように普通の相関係数を用いるか順位相関係数を用いるかは、データの正規性やデータ数といった数学的な要因ではなく、あくまでも科学的な要因で決めるべきです。
また順序尺度のデータはデータとデータの間隔が等しくなく、四則演算を行うことができません。 そのため原理的に回帰分析を適用することはできません。 なぜなら回帰分析は2種類のデータの間の計量的な関係を関数で近似するための手法だからです。 ただし順序尺度のデータをそのまま計量尺度扱いしてしまってもかまわない時がけっこうあるので、そのような時は普通の回帰分析を適用することができます。 (→2.3 パラメトリック手法とノンパラメトリック手法)
次にデータが名義尺度の時について説明しましょう。 表5.1.1の体長と尾長を8cm未満と8cm以上の2種類に分類してクロス集計表にまとめると次のようになります。
体長分類\尾長分類 | 8cm未満 | 8cm以上 | 計 |
---|---|---|---|
8cm未満 | 4 | 0 | 4 |
8cm以上 | 2 | 5 | 7 |
計 | 6 | 5 | 11 |
これは順位が2つだけの順序尺度のデータと考えることができるので、スピアマンの順位相関係数を求めることができます。 この時の順位相関係数を特に四分点相関係数(four-fold point correration coefficient)と呼び、次のような式で求められます。 これは心理学分野ではφ(ファイ)係数とも呼ばれています。 (→1.9 科学的研究のデザイン、3.4 2標本の計数値 (2)名義尺度)
表5.3.2のデータが完全な名義尺度の時はカテゴリー間に大小関係がないので、厳密にいえば順位相関係数は求められません。 しかし2つの分類の間に何らかの関連性があり、一方の分類が他方の分類に影響を与えることは考えられます。 上の表でいえば体長と尾長の間に正の関連性があれば両者が同じ分類になるマウスが多くなり、左上と右下のカラムの例数が増えるはずです。
もう少し一般化すれば縦(または横)のカテゴリーごとに眺めた時、横(または縦)の分類パターン——表5.3.2では「4−0」と「2−5」——が同じなら縦の分類と横の分類はお互いに関連性がないと考えられます。 しかし縦のカテゴリーごとに横の分類パターンが異なれば縦の分類と横の分類の間に何らかの関連性があると考えられます。 このような関連性を要約する値として第3章第2節(2)と第4章第2節(2)で説明したχ2値があります。 しかしχ2値は例数と自由度によって最大値が異なるので値を比較するには不便です。 そこで総例数をNとし、縦と横の分類数のうち小さい方の値をsとして次のような値を用います。
χ2値は理論度数と実現度数の食い違いの平方和を表すので、この値は1度数あたりの食い違い平方を表します。 実は、この食い違い平方はχ2検定における寄与率R2に他なりません。 そしてこの値の平方根をクラメール(Cramer)の連関係数(coefficient of contingency)といい、Vまたはθで表します。 この値は1度数あたりの食い違い量を表し、最小値が0で、最大値が1になります。 このことからχ2検定は連関係数の検定に相当することがわかると思います。 (→1.9 科学的研究のデザイン、3.4 2標本の計数値 (2)名義尺度、4.2 多標本の計数値 (2)名義尺度)
データが2×2分割表の時、自由度は1になります。 そのためクラメールの連関係数は、次のようにχ2値を総例数Nで割って平方根にするだけになります。 そしてこの場合だけ連関係数と四分点相関係数の絶対値が一致します。 しかし両者は目的も計算原理も異なる指標なので2×2分割表以外では一致しません。 また順序尺度のデータと違って名義尺度のデータを計量尺度のデータとして扱うことはできません。
表5.3.2のデータについて、有意水準5%として実際に計算すると次のようになります。 (注2)
以上のように四分点相関係数とクラメールの連関係数は同じ値ですが、両者の検定結果と推定結果は微妙に違います。 これは四分点相関係数は順序尺度の関連性を表す指標であり、検定は順位相関係数の検定──この場合はマンテル・ヘンツェルの検定に相当──を用いるのに対して、連関係数は名義尺度の関連性を表す指標であり、検定はχ2検定を用い、両者は微妙に異なる検定だからです。 しかしこの場合はどちらも検定結果は有意です。 そして寄与率が50%近くあるので、「体長と尾長の分類間には関連がありそうだ」と解釈できます。
2×2分割表において2種類の分類間の関連性を表す指標としては、他にも第3章第4節で説明したオッズ比(見込み比、odds ratio)があります。 この値は関連性が全くない時は1になり、関連性がある時は1未満または1よりも大きくなります。 ただし四分点相関係数や連関係数のように上下限が決まっているわけではないので、関連性の程度を表す指標としてはあまり便利ではありません。
またこの値は比に基づいているのでデータの中に0のものがあると計算できなかったり、関連性を的確に表さなかったりする欠点があります。 (→1.9 科学的研究のデザイン、3.4 2標本の計数値 (2)名義尺度)
表5.3.2のデータについて、有意水準5%として実際に計算すると次のようになります。 (注3)
一方のデータが名義尺度で他方が計量尺度の時も相関係数に相当する要約値を求めることができます。 表5.1.1のデータについて、体長だけを8cm未満と8cm以上に分類してみましょう。
No. | 体長 | 体長分類(0:8cm未満,1:8cm以上) | 尾長 |
---|---|---|---|
1 | 10.00 | 1 | 8.04 |
2 | 8.00 | 1 | 6.95 |
3 | 13.00 | 1 | 7.58 |
4 | 9.00 | 1 | 8.81 |
5 | 11.00 | 1 | 8.33 |
6 | 14.00 | 1 | 9.96 |
7 | 6.00 | 0 | 7.24 |
8 | 4.00 | 0 | 4.26 |
9 | 12.00 | 1 | 10.84 |
10 | 7.00 | 0 | 4.82 |
11 | 5.00 | 0 | 5.68 |
平均値 | 9.00 | 0.64 | 7.50 |
このデータについて名義尺度のデータを0と1のダミー変数にし、計量尺度のデータはそのままで形式的に両者の相関係数を計算します。 ただし相関係数の符号はダミー変数の決め方によって変わるので相関係数の絶対値を取り、それを相関比(correlation ratio)と呼んでη(イータ)で表します。 この値は名義尺度のデータの分類法と計量尺度のデータの間の関連性を要約する値であり、分類ごとに計算した平均値が異なっているほど大きな値になります。
表5.3.3から見当が付くと思いますが、これは第4章第1節で説明した一元配置分散分析における要因Aの寄与率の平方根に他なりません。 したがってこの時の相関係数の検定は一元配置分散分析そのものになります。 なおη2つまり寄与率のことを相関比と呼ぶこともあります。 しかし相関係数を平方した値が寄与率になるということから、やはりηを相関比と呼ぶ方が合理的だと思います。 そのためここではηのことを相関比と呼ぶことにします。 (→4.1 多標本の計量値、5.1 相関係数と回帰直線 (注4))
表5.3.3のデータについて、有意水準5%として実際に計算すると次のようになります。
一方のデータが名義尺度で他方のデータが順序尺度の時は、ダミー変数と順位を用いて形式的に相関係数を計算します。 この場合も相関係数の絶対値を取り、それを順位相関比(rank correlation ratio)と呼んでηrで表すことにしましょう。 この値は名義尺度のデータの分類法と順序尺度のデータの順位の間の関連性を要約する値であり、分類ごとに計算した順位平均値が異なっているほど大きな値になります。
表5.3.3の尾長を順序尺度扱いすると、このデータにクリスカル・ウォーリスの検定またはウィルコクソンの2標本検定を適用できることがわかると思います。 そして順位相関比は第4章第2節で説明したクリスカル・ウォーリスの検定における要因Aの寄与率の平方根に相当します。 したがってこの時の相関係数の検定はクリスカル・ウォーリスの検定になります。 (→4.2 多標本の計数値 (1)順序尺度 1)データに対応がない場合)
表5.3.3の体長を順序尺度扱いし、有意水準5%として実際に計算すると次のようになります。
一方のデータが名義尺度で他方が計量尺度の時も回帰直線を求めることができます。 第1節の表5.1.5の生後日数だけを8日未満と8日以上に分類すると次のようになります。 これは前向き研究から得られたデータなので、表5.3.1や表5.3.2や表5.3.3と違って生後日数分類には誤差がなく、尾長にだけ誤差がある点に注意してください。 このデータに回帰分析を適用すると、説明変数である生後日数がダミー変数であり、目的変数である尾長が計量尺度の時の回帰直線を求めることになります。
No. | 生後日数 | 生後日数分類(0:8日未満,1:8日以上) | 尾長 |
---|---|---|---|
1 | 4 | 0 | 4.26 |
2 | 5 | 0 | 5.68 |
3 | 6 | 0 | 7.24 |
4 | 7 | 0 | 4.82 |
5 | 8 | 1 | 6.95 |
6 | 9 | 1 | 8.81 |
7 | 10 | 1 | 8.04 |
8 | 11 | 1 | 8.33 |
9 | 12 | 1 | 10.84 |
10 | 13 | 1 | 7.58 |
11 | 14 | 1 | 9.96 |
平均値 | 9 | 0.64 | 7.50 |
表5.3.4のデータについて、有意水準5%として実際に計算すると次のようになります。
この時、回帰直線の切片5.5は生後日数が8日未満の群における尾長の平均値になり、回帰係数3.144は生後日数が8日以上の群における尾長の平均値と8日未満の群における尾長の平均値の差になります。 したがってこの時の回帰分析は2群の平均値の差の検定つまり2標本t検定に相当します。 これは、見方を変えれば群という要因によって目的の項目のデータが変動するかどうかを調べていると解釈することができます。 つまり群を説明変数にし、計量尺度の項目を目的変数にした回帰分析を行っていることに相当するわけです。
またこの時の回帰直線が2群の平均値を通ることから回帰直線は説明変数がある特定の値の時の目的変数の平均値に相当する、つまり平均値を2次元に拡張したものであることがわかると思います。 (→5.1 相関係数と回帰直線 (注4))
目的変数が計量尺度ではなく順序尺度の時は回帰係数が平均値の差の代わりに順位平均値の差になり、回帰分析がウィルコクソンの2標本検定またはクリスカル・ウォーリスの検定に相当します。 この場合は群を説明変数にし、データの順位を目的変数にした回帰分析を行っていることに相当します。 (→4.2 多標本の計数値 (1)順序尺度 1)データに対応がない場合)
以上とは反対に説明変数である生後日数は計量尺度または順序尺度のままにして、目的変数である尾長を8cm未満と8cm以上に分類した時も回帰直線を求めることができます。 ただし目的変数として0/1のダミー変数をそのまま用いるのではなく出現率を用います。 表5.3.4の尾長を2分類にすると次のようになります。
No. | 生後日数 | 尾長 | 8cm未満 | 8cm以上 | 計 | 8cm以上の出現率 |
---|---|---|---|---|---|---|
1 | 4 | 4.26 | 1 | 0 | 1 | 0 |
1 | 5 | 5.68 | 1 | 0 | 1 | 0 |
3 | 6 | 7.24 | 1 | 0 | 1 | 0 |
4 | 7 | 4.82 | 1 | 0 | 1 | 0 |
5 | 8 | 6.95 | 1 | 0 | 1 | 0 |
6 | 9 | 8.81 | 0 | 1 | 1 | 1 |
7 | 10 | 8.04 | 0 | 1 | 1 | 1 |
8 | 11 | 8.33 | 0 | 1 | 1 | 1 |
9 | 12 | 10.84 | 0 | 1 | 1 | 1 |
10 | 13 | 7.58 | 1 | 0 | 1 | 0 |
11 | 14 | 9.96 | 0 | 1 | 1 | 1 |
平均値 | 9 | 7.50 | 0.545 | 0.455 | - | 0.455 |
この表のままでも計算できますが、尾長8cm以上の出現率が0か1になってしまい、出現率が直線的に増加している様子がわかりづらいと思います。 そこで体長を5cm間隔でまとめると次のようになります。
生後日数分類 | 尾長8cm未満 | 尾長8cm以上 | 計 | 8cm以上の出現率 |
---|---|---|---|---|
4-5(4.5) | 2 | 0 | 2 | 0 |
6-10(8) | 3 | 2 | 5 | 0.4 |
11-14(12.5) | 1 | 3 | 4 | 0.75 |
全体 | 6 | 5 | 11 | 0.455 |
この場合、説明変数である生後日数分類の値をどのようにするかが問題です。 一番もっともらしいのは分類の中央の値にすることであり、表5.3.6の生後日数分類の括弧の中の値がそれです。 もっと単純なものとしては単に1、2、3という値にする方法もあります。 説明変数は本来は計量尺度ですが、確率変数ではなく、研究者が任意の値を指定する変数です。 そのため目的変との関係が直線的になるように計量化できるのなら順序尺度または順序分類尺度のデータでもかまいません。
目的変数は尾長8cm以上の出現率であり、生後日数4.5の時が0、8の時が0.4、12.5の時が0.75になります。 しかしこれら3つの出現率は、それを計算したデータ数が異なるので信頼度が異なります。 そこでこれらの出現率を均等に扱わず、信頼度が高い出現率ほど重要視して回帰直線を計算します。 そのような計算方法を重み付け最小2乗法といい、回帰直線を求める時に利用した最小2乗法の一種です。 表5.3.6のデータについて、有意水準5%として実際に計算すると次のようになります。 (注4)
直線性つまり回帰係数の検定統計量にt値ではなくχ2値を用いるのは、目的変数が普通の計量値ではなく出現率だからです。 この手法をコクラン・アーミテージ(Cochran-Armitage)の傾向分析といい、回帰係数の検定部分だけを特にコクラン・アーミテージ(Cochran-Armitage)の傾向検定と呼びます。 この手法では回帰係数の検定だけでなく、回帰直線からのズレの検定も行うことができます。 その検定が異質性(ズレ)の検定です。 この検定結果が有意の時は実際の出現率と回帰直線の間にズレがある、つまり出現率の変動に直線的ではない部分があるということになります。
ちなみに表5.3.5のデータにコクラン・アーミテージの傾向分析を適用すると次のようになります。 この場合はポイント数が増えたので回帰係数の検定結果が有意になった反面、出現率が0%か100%のためズレが少し大きくなっています。
コクラン・アーミテージの傾向分析は、表5.3.6のように説明変数が順序尺度または順序分類尺度で目的変数が名義尺度の時によく用いられます。 そのため「この手法は説明変数が順序尺度のデータでないと適用できない」と誤解している人がけっこういるようです。 しかしこの手法の説明変数は本来は計量尺度です。 でも順序尺度のデータを適当に計量化して説明変数にしてもかまわないので、そのような場合によく用いられるだけです。 したがって本来は表5.3.5のような計量尺度のデータをわざわざ表5.3.6のような順序尺度のデータにする必要はありません。
以上のことから、データが計量尺度の場合に限らず、どんな場合でも関連性を要約する原理は同じということがわかると思います。 なお生後日数と尾長8cm以上の出現率の間に薬剤の用量−反応関係(dose-response relationship)に相当する関係があると考えられる時は、コクラン・アーミテージの傾向分析よりもプロビット分析を用いる方が合理的です。 プロビット分析については第13章で説明します。 (→13.4 プロビット分析)
同位の値がg個あると2乗和はだけ小さくなります。 そのため次のような同意の補正を行います。
表5.3.1のデータについて実際に計算してみましょう。
ウィルコクソンの2標本検定における順位データは次のように表すことができます。
このデータに対してA群に属す時は「0」、B群に属す時は「1」という値をとるダミー変数rxを対応させます。
A群: | ry= | ry11, | …, | ry1i, | …, | ry1n | (i = 1,…,n) |
rx= | rx1=0, | …, | 0, | …, | 0 | ||
B群: | ry= | ry21, | …, | ry2j, | …, | ry2m | (j = 1,…,m) |
rx= | rx2=1, | …, | 1, | …, | 1 |
このデータについてスピアマンの順位相関係数を計算すると次のようになります。
以上のように、この場合のスピアマンの順位相関係数は連続修正を施さないウィルコクソンの2標本検定、つまり群が2つの時のクリスカル・ウォーリスの検定と深い関係があります。 そしてスピアマンの順位相関係数を平方した寄与率とクリスカル・ウォーリスの検定における要因Aの寄与率が一致します。 計量値でも相関係数と分散分析一元配置との間にこれと同じような関係があったことを考えると、順位相関係数の検定としては次のような式を用いるのが合理的です。 (→3.4 2標本の計数値、4.2 多標本の計数値 (1)順序尺度)
ちなみにデータが2変量正規分布する時、普通の相関係数つまりピアソン(Pearson)の相関係数rとスピアマンの順位相関係数rsの間には次のような関係があります。 (→9.4 多変量の場合)
少し複雑な考え方として、次のように順位に適当なスコアを対応させ、そのスコアを用いて順位相関係数を計算する手法があります。
そのスコアとして標準正規分布における%点の値、つまり(n + 1)を分母とした時の順位rの累積出現率に対応する正規偏位を用いるものがファン・デル・ヴェルデン(van der Waerden)の順位相関係数です。 これはデータの順位を利用して、データを強引に正規分布として取り扱う手法です。 そのためデータが正規分布していれば、データをそのまま用いて計算した普通の相関係数と一致します。
これと同じ考え方で順位に正規偏位を対応させ、2群の正規偏位平均値の差を検定するファン・デル・ヴェルデン検定という手法もあります。 この手法はデータが正規分布していれば2群の平均値の差の検定つまり2標本t検定の正規検定版に相当するので、ウィルコクソンの2標本検定よりも好ましいとされています。 (→3.4 2標本の計数値 (注3))
しかし順位を利用したノンパラメトリック手法は、データが正規分布していない時はパラメトリック手法よりも検出力が高くなるという特徴を持っています。 そのためデータが正規分布していない時にこそ使い道があります。 データが正規分布している時は素直にパラメトリック手法を用いた方が効率的かつ合理的です。 そのためファン・デル・ヴェルデンの順位相関係数もファン・デル・ヴェルデン検定も、計算が面倒な割に使い道はあまりありません。
分類 | B1(0) | B2(1) | 計 |
---|---|---|---|
A1(0) | n11 | n12 | N1. |
A2(1) | n21 | n22 | N2. |
計 | N.1 | N.2 | N |
以上のように、この時の相関係数は四分点相関係数(φ係数)とクラメールの連関係数になります。 ただし(注1)で説明したように、一方の順位が2つの時のスピアマンの順位相関係数の検定は連続修正をしないウィルコクソンの2標本検定に一致します。 そして第3章第4節の(注4)で説明したように、2×2分割表に連続修正をしないウィルコクソンの2標本検定をあてはめると連続修正をしないマンテル・ヘンツェルの検定に一致します。
したがってクラメールの連関係数の検定には連続修正をしないχ2検定を用い、四分点相関係数の検定には連続修正をしないウィルコクソンの2標本検定つまり連続修正をしないマンテル・ヘンツェルの検定を用いるのが合理的です。 また四分点相関係数の推定には、順位相関係数と同様にフィッシャーのz変換を利用する手法を用いるのが合理的でしょう。
χ2検定のことを独立性の検定または関連性の検定と呼ぶことがあります。 それはこの検定が多群の出現率の差の検定であると同時に、クラメールの連関係数の検定でもあるからです。 しかし厳密にいうと関連性の検定は母集団からN個の標本を取り出し、それを分類Aと分類Bという2種類の方法で分類した時の分類間の関連性の有無を検定する手法、つまり横断的研究から得られたデータの分類間の関連性の有無を検定する手法です。
それに対して出現率の差の検定はA1群の母集団からN1.例の標本を取り出した時のB2分類の出現率がn12/N1.であり、A2群の母集団からN2.例の標本を取り出した時のB2分類の出現率がn22/N2.である時の出現率の差を検定する手法、つまり前向き研究から得られたデータの出現率の差を検定する手法です。 これらはよく似た概念ですが、試験デザインが異なるので母集団の設定と標本の取り出し方が微妙に違います。
群が2つで分類が2つの時に出現率の差を検定する手法がフィッシャーの正確検定であり、連続修正を施したχ2検定はその正規近似手法に相当します。 そして連続修正を施さないχ2検定は出現率の差の検定よりも連関係数の検定という性格が強くなります。 そのため出現率の差の検定にはフィッシャーの正確検定または連続修正を施したχ2検定を用い、関連性の検定には連続修正を施さないχ2検定を用いるのが合理的です。 ただしフィッシャーの正確検定は有意性検定しかできないので、統計的仮説検定を行いたい時は連続修正を施したχ2検定を用います。
名義尺度と計量尺度の相関分析と回帰分析では回帰係数の検定が平均値の差の検定に相当し、相関係数の検定が相関比の検定に相当し、両者は同じものになります。 それに対して名義尺度同士の相関分析と回帰分析では回帰係数の検定が出現率の差の検定に相当し、相関係数の検定が連関係数の検定に相当し、両者は微妙に異なります。 しかし両者の違いは微妙なので、細かいことにこだわらずに出現率の差の検定と関連性の検定を同一視し、どちらの手法を用いてもかまわないという考え方もあります。 (→3.4 2標本の計数値 (注4))
表5.3.2のデータについて実際に計算してみましょう。 一般的なa×b分割表についての計算式と連関係数の推定方法については4.2節の(注1)をご覧ください。
オッズ比はその名の通り比に基づいた値なので、例数が少ない時は関連性を的確に表さない場合があります。 例えば次のような2つの2×2分割表についてφ係数とオッズ比を計算すると両者の特徴がよくわかります。 この場合、A1分類におけるB2分類の出現率とA2分類におけるB2分類の出現率は、表5.3.8では10%と20%であるのに対して表5.3.9では1%と2%です。 この出現率から見ると表5.3.8の方が関連性が高いと考えられ、φ係数の方が関連性を的確に表していることがわかります。
A分類\B分類 | B1 | B2 | 計 |
---|---|---|---|
A1 | 90 | 10 | 100 |
A2 | 80 | 20 | 100 |
計 | 170 | 30 | 200 |
A分類\B分類 | B1 | B2 | 計 |
---|---|---|---|
A1 | 99 | 1 | 100 |
A2 | 98 | 2 | 100 |
計 | 197 | 3 | 200 |
説明変数 | 例数 | 非出現例数 | 出現例数 | 出現率 |
---|---|---|---|---|
x1 | n1 | s1 | r1 | p1 |
: | : | : | : | : |
xi | ni | si | ri | pi |
: | : | : | : | : |
xk | nk | sk | rk | pk |
全体 | N | S | R | p |
この表の説明変数と出現率に回帰直線を当てはめて、出現率の推定値と推定誤差と直線回帰式を次のように表します。
これらの式に基づいて回帰分析を行う場合、出現率の値を平等に扱わず、信頼度が高い値つまり誤差が少ない値ほど重要視して最小2乗法を適用するのが好ましいと考えられます。 一般に出現例数riは二項分布をし、その二項分布は平均値ri、分散nipi(1 - pi)の正規分布で近似できます。 そして出現率piは平均値pi、分散の正規分布で近似できます。 この場合の出現率piはni例のデータから計算された平均値に相当する統計量であり、その分散の平方根は標準誤差になります。 したがって出現率をその標準誤差の逆数で重み付けして最小2乗法を適用すれば、誤差が少ない出現率ほど重要視することになります。
回帰分析の帰無仮説は説明変数の影響がない、つまり回帰係数bが0ということです。 この時、piは全て同じ値になり、その分散も同じ値になります。 その時の出現率を全体の出現率pで推定すると次のようになります。
この時、出現率にその標準誤差の逆数をかけて最小2乗法を適用すると、平方誤差の合計は次のようになります。
このように目的変数を重み付けし、重み付け平方誤差を最小にするという規準を用いた最小2乗法を重み付け最小2乗法といいます。 平方誤差の重みは上記のように目的変数の分散の逆数を用いるのが普通です。 そして本来の重み付け最小2乗法ではpiの重みとしてwiを用います。 しかしこの手法は直線性の検定を主目的にしているので、b = 0という帰無仮説に基づいてwを重みとして用いる点が少し特殊なので注意が必要です。 (→7.1 重回帰モデル (注1))
この時の最小2乗解と回帰分析の各種パラメーターは次のようになり、これは目的変数が名義尺度の時の回帰分析に相当します。 これをコクラン・アーミテージの傾向分析といい、この中の直線性の検定のことを特にコクラン・アーミテージの傾向検定と呼びます。 そしてこの手法は出現率に増加または減少傾向があるかどうかを検討するために用いられることが多いので、傾向検定という略称で呼ばれることもあります。
要因 | 平方和 | 自由度 | χ2値 | |
---|---|---|---|---|
直線性(回帰) | Sβ | φβ | χβ2 | |
異質性(ズレ) | SLOF | φLOF | χLOF2 | |
全体 | Syy | φy | χyy2 |
平方和がそのままχ2値になるのは、出現率に重みとして例数を掛けているので出現率とその推定値の誤差が実現度数と理論度数の食い違いに相当し、それを平方して合計した平方和がχ2値に相当するからです。 そして全体の平方和Syyつまりχyy2は一般的な2×kのχ2検定における検定統計量χo2に相当します。 (→3.4 2標本の計数値 (注6))
一般的な2×kのχ2検定ではχo2を全例数Nで割った値が寄与率になり、その平方根がクラメールの連関係数になります。 コクラン・アーミテージの傾向分析では、この寄与率はN例の0/1のダミーデータの変動のうち出現率の変動によって説明できる割合を表します。 そしてN例の0/1のダミーデータの変動のうち、回帰直線によって説明できる割合は次のようになります。
この寄与率に対して、表5.3.11の上に記載した寄与率は出現率の変動のうち回帰直線によって説明できる割合を表す寄与率になります。 図5.3.3のようなグラフを描いた場合、回帰直線の寄与率としては出現率の変動に対する寄与率の方が感覚的に納得できると思います。 そこで普通は回帰直線の寄与率として出現率の変動に対する寄与率を用い、本文中でもその寄与率だけを記載してあります。 なお表5.3.6のようにひとつの説明変数の値について1つのデータだけが存在する時、2種類の寄与率は同じ値になります。
表5.3.6のデータについて実際に計算してみましょう。
ちなみに説明変数xiを順序尺度のデータ扱いして順位和検定で用いる順位にすると、次のようにコクラン・アーミテージの傾向検定は時期数が1つだけの拡張マンテル検定つまり群数が2つの時のクリスカル・ウォーリスの検定とほぼ一致します。 このコクラン・アーミテージの傾向検定と拡張マンテル検定の微妙な違いは、前者が回帰分析系の手法であるのに対して後者が相関分析系の手法であることに起因します。 (→4.4 繰り返しのある多標本・多時期の計数値 (注1))
このことから拡張マンテル検定において、順位の代わりに説明変数xiの値そのものを用いればコクラン・アーミテージの傾向検定と同じような傾向検定を行えることがわかると思います。 そのため表5.3.10のような出現率の表がb個あり、その全ての表に共通する直線性つまり全ての表の回帰直線が平行と仮定した時の直線性の検定に拡張マンテル検定を流用することがあります。
しかし拡張マンテル検定は2群の順位平均値に関する共分散分析に相当する手法なので、そのような使い方は合理的ではありません。 そのような場合は、多群の用量−反応関係に関する共分散分析に相当するプロビット法による平行線検定法を用いるべきです。 プロビット法による平行線検定法については第13章をご覧ください。 (→13.5 名義尺度の平行線検定法)
またkが2でx1 = 0、x2 = 1とすると、次のようにコクラン・アーミテージの傾向検定は2群の出現率の差の正規近似検定つまり2×2のχ2検定(ただしどちらも連続修正無)に一致します。 これはkが2の時は回帰直線からのズレがなくなり、全体の変動と回帰の変動が一致し、回帰の検定が全体の検定つまり一般的な2×2のχ2検定に相当するためです。 (→3.4 2標本の計数値 (注3))
このことから、2×2のχ2検定は説明変数も目的変数も名義尺度の時の回帰係数の検定に相当することがわかります。 一方、kが2の時の拡張マンテル検定はマンテル・ヘンツェルの検定に一致します。 そして(注2)で説明したように、マンテル・ヘンツェルの検定は順序が2つだけの時の相関係数つまり四分点相関係数の検定に相当します。
説明変数が名義尺度で目的変数が計量値の場合、相関係数の検定と回帰係数の検定は一致しました。 しかし目的変数も名義尺度の場合は相関係数の検定と回帰係数の検定は微妙に異なります。 ただし両者の違いは微妙なので、細かいことにこだわらず、相関係数の検定にも回帰係数の検定にもどちらの検定手法を適用してもかまわないという考え方もあります。
ただし相関分析がどちらの変数も確率変数であるのに対して、回帰分析は目的変数だけが確率変数である点が異なります。 つまり本質的に相関分析は横断的研究で得られたデータを分析する手法であり、評価指標は相関係数です。 それに対して回帰分析は前向き研究で得られたデータを分析する手法であり、評価指標は回帰係数(回帰式)です。 そのためたとえ同じ検定手法を適用するにしても相関分析を適用すべきデータと回帰分析を適用すべきデータをはっきりと区別し、相関分析と回帰分析を明確に使い分ける必要があります。
ただし、どちらの場合も寄与率を計算することができます。 相関分析の寄与率は2つの変数が共有している情報量の割合を表し、回帰分析の寄与率は目的変数の全変動のうち説明変数によって説明がつく割合を表します。 このように寄与率は色々な場面で利用することができる便利な指標です。