前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1-1 | 1-2 | 2-1 | 2-2 | 3 | 4 |
データが名義尺度の時は度数を利用した分散分析相当の手法を適用します。 話の都合上、ここでもデータに対応がない場合から説明しましょう。
表4.1.1の収縮期血圧について120mmHg未満を「正常」、120mmHg以上を「異常」と判定して、対応のない名義尺度のデータにしてみましょう。 そして薬剤投与群と収縮期血圧判定をクロス集計し、クロス集計表にまとめます。
群内No. | A剤投与群 | B剤投与群 | C剤投与群 |
---|---|---|---|
1 | 正常 | 正常 | 正常 |
2 | 異常 | 正常 | 正常 |
3 | 異常 | 正常 | 正常 |
4 | 異常 | 正常 | 正常 |
5 | 異常 | 正常 | 正常 |
群\判定 | 正常 | 異常 | 計 |
---|---|---|---|
A剤投与群 | 1 | 4 | 5 |
B剤投与群 | 5 | 0 | 5 |
C剤投与群 | 5 | 0 | 5 |
計 | 11 | 4 | 15 |
表4.2.5のクロス集計表は3群のデータを2種類に分類した3×2分割表なので、第3章で説明したχ2検定を適用して群ごとの異常率が同じかどうか検定することができます。 χ2検定は名義尺度における一元配置分散分析に相当し、多群の出現率パターンつまり多分類の割合が全て等しいかどうかを検定します。 そのため2標本t検定に相当する2×2のχ2検定以外は有意性検定を行うのが普通であり、この場合の帰無仮説と対立仮説は次のようになります。 (→3.4 2標本の計数値 (2) 名義尺度(分類データ) 2) データに対応がない場合)
また表4.2.5が横断的研究から得られた得られデータをまとめたものの時は、問題を「薬剤の種類と判定の間に関連があるか?」ととらえることができます。 その場合は独立性または関連性または適合度の検定になり、クラメール(Cramer)の連関係数(coefficient of contingency)V(またはθ)を評価指標にして次のような帰無仮説と対立仮説になります。
通常、2×2のχ2検定以外は連続修正を施さないため、出現率パターンの検定と連関係数の検定は同じものになります。 したがって前向き研究から得られたデータにも横断的研究から得られたデータにも連関係数の検定を適用し、結果を解釈する時にデータが得られた研究デザインと評価指標を考慮するのが合理的です。
有意水準5%として、表4.2.6に3×2のχ2検定を適用すると次のようになります。 (注1)
χo2は理論度数と実現度数の食い違いの平方を合計した値であり、一元配置分散分析における要因Aの平方和SAに相当する値です。 そして寄与率は一元配置分散分析における要因Aの寄与率に相当し、全体の理論度数と実現度数の食い違い平方和に対する要因Aによる食い違い平方和の割合を表します。 クラメールの連関係数は1度数あたりの食い違い量を表し、薬剤の種類と判定が独立なら0に、完全に関連していれば1になります。 これらの結果から次のような統計学的結論を採用することができます。
この統計学的結論から医学的結論を導くためには、一元配置分散分析と同様に次のような点について検討する必要があります。
これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。
一元配置分散分析と同様に、この場合も多重比較を行うことができます。 この場合の多重比較は平均値の代わりに出現率を用いるだけで、原理は一元配置分散分析の多重比較と同じです。 そして出現率に関する医学的な同等範囲を±10%未満とすると、多重比較の対立仮説は次のようになります。
有意水準5%、信頼係数95%として、ボンフェローニ型多重比較とそれに対応する区間推定を行うと次のようになります。 (注2)
以上の結果より、ファミリーとしての統計学的結論は次のようになります。
これについてもχ2検定と同様の疑問点について検討し、全てに肯定的に答えられるとしたら次のような医学的結論を採用することができます。
分類数が3つ以上の時は出現率ではなく出現パターンつまり分類の割合を多重比較することになります。 その場合、分類の割合について医学的な同等範囲を合理的に決めるのが難しいので統計的仮説検定ではなく有意性検定を行います。 そうするとわざわざ多重比較をする意義が薄くなるので多重比較は行わず、χ2検定だけ行って各群の分類の割合の違いを医学的に検討するのが実際的です。
多群の出現率パターンが全て等しいかどうかを検定する手法として、尤度(ユウド、likelihood)を利用する尤度比検定(likelihood ratio test、G検定とも呼ばれる)というものがあります。 尤度は特定の母数の「もっともらしさ」を表す条件付き確率の一種であり、判別分析で利用されるので詳しい説明はそちらを参照してください。 また尤度比検定はロジスティック回帰分析でも用いられるのでそちらも参考にしてください。 (→9.3 1変量の場合 (1) 尤度と最尤法、10.3 ロジスティック回帰分析の計算方法 (注2))
尤度比検定では次のような帰無仮説と対立仮説を設定します。
帰無仮説が正しい時は「3群の出現率パターンが全て同じ」という結果になる確率が最も高くなり、「3群の出現率パターンが異なっている」という結果になる確率は低くなります。 その反対に対立仮説が正しい時は「3群の出現率パターンが異なっている」という結果になる確率の方が高くなります。 そのため実際の結果が「3群の出現率パターンが全て同じ」という時は、「帰無仮説のもっともらしさ」つまり帰無仮説の尤度の方が「対立仮説のもっともらしさ」つまり対立仮説の尤度よりも高くなります。 そして実際の結果が「3群の出現率パターンが異なっている」という時はその反対になります。
そこで帰無仮説の最大尤度と対立仮説の最大尤度の比つまり尤度比(likelihood ratio)を求めると、これは実際の結果が「3群の出現率パターンが全て同じ」時は大きくなり、「3群の出現率パターンが異なっている」時は小さくなるはずです。
この尤度比は3群の出現率が異なっているほど小さな値になるので、3群の出現率のバラツキの程度を表す指標としては直感的にわかりにくいところがあります。 そこでこの値を逆数にすると3群の出現率のバラツキの程度を表す指標つまり群と判定の関連性の強さを表す指標になります。 そしてこの尤度比を平方して対数変換すると近似的にχ2分布をするので、この性質を利用して独立性(関連性)の検定を行うことができます。
有意水準5%として、表4.2.6に尤度比検定を適用すると次のようになります。 (注3)
この検定結果は前述の出現率パータンまたは連関係数の検定結果と少し違っています。 しかしこの手法は出現率のバラツキの程度または関連性の程度を表す指標が異なっているので、それは当然です。 そのためこの手法は尤度比を出現率のバラツキの程度を表す指標にすることが医学的に妥当な時だけ用います。 尤度比は解釈が難しいので、普通は連関係数の検定を用いた方が無難です。
今度は表4.1.6の収縮期血圧について120mmHg未満を「正常」、120mmHg以上を「異常」と判定して、対応のある分類データにしてみましょう。
被験者No. | 投与前 | 投与1週後 | 投与2週後 |
---|---|---|---|
1 | 正常 | 正常 | 正常 |
2 | 異常 | 正常 | 正常 |
3 | 異常 | 正常 | 正常 |
4 | 異常 | 正常 | 正常 |
5 | 異常 | 正常 | 正常 |
表4.2.7のデータを正常/異常という判定を順位が2つだけの順序尺度と考えれば、フリードマンの検定を適用して個人差を取り除いた時の順位平均値の時期変動を検定することができます。 その場合、順位平均値は実質的に異常率に相当し、個人差を取り除いた時の異常率の時期変動を検定していることになります。 この手法はコクラン(Cochran)のQ検定と呼ばれ、名義尺度における繰り返しのない二元配置分散分析に相当します。
フリードマンの検定と同様にこの手法も有意性検定行うのが普通であり、帰無仮説と対立仮説は次のようになります。
有意水準5%として、表4.2.7のデータについて実際に計算すると次のようになります。 (注4)
統計量Qは出現率の分散に相当する値であり、これは近似的に自由度(時期数 - 1)のχ2分布をします。 そのため検定統計量としてF値ではなくχ2値を用います。 またこの場合の要因Bの寄与率は被験者ごとの3時点の正常/異常のバラツキの中で時期変動によって説明できる割合になります。 上記の結果から次のような統計学的結論を採用することができます。
この統計学的結論から医学的結論を導くためには、フリードマンの検定と同様に次のような点について検討する必要があります。
これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。
この場合の多重比較は順位平均値の代わりに異常率を用いるだけで、原理はフリードマンの検定の多重比較と同じです。 そして異常率の差の医学的同等範囲を±10%未満とすると、多重比較の対立仮説は次のようになります。
有意水準5%、信頼係数95%として、ダネット型多重比較とそれに対応する区間推定を行うと次のようになります。 (注5)
以上の結果より、ファミリーとしての統計学的結論は次のようになります。
これについてもコックランのQ検定と同様の疑問点について検討し、全てに肯定的に答えられるとしたら次のような医学的結論を採用することができます。
コックランのQ検定と多重比較において時期数が2つの時は順位が2つだけの時のウィルコクソンの1標本検定つまりマクネマーの検定に相当し、χ2値の平方根がz値に対応します。 (→4.2 多標本の計数値 (注5))
分類 | B1 | … | Bj | … | Bb | 計 |
---|---|---|---|---|---|---|
A1 | n11 | … | n1j | … | n1b | N1. |
: | : | : | : | : | : | : |
Ai | ni1 | … | nij | … | nib | Ni. |
: | : | : | : | : | : | : |
Aa | na1 | … | naj | … | nab | Na. |
計 | N.1 | … | N.j | … | N.b | N |
帰無仮説はと対立仮説は次のようになります。
この仮説のもとで各種の値は次のようになります。 連続修正を施すと非常に繁雑な式になるので、普通は2×2の時以外は連続修正を施しません。
全体の変動はAの各群とBの各分類が完全に対応する時の要因Aの変動になります。 つまりAiに属するNi.例が全てBjに分類され、他のカラムは0例である時のχo2値が全体の変動になります。 ところがaとbは等しいとは限りません。 そこで仮にa≦bとすると、Aiのうちの1つの群については0ではないカラムが(b - a + 1)個存在することになります。 したがって全体の変動を表すχo2値をχT2とすると、この値は次のようになります。
AとBは対等な名義尺度なので、どちらが小さくてもχT2を同じように計算することができます。 したがってaとbのうち小さい方をsとすると、寄与率R2は次のようになります。 この値の平方根は1度数あたりの食い違い量を表し、クラメールの連関係数になります。 そのためこの検定は分類割合(出現率パターン)の検定であると同時に連関係数の検定にもなります。 そして分類割合も連関係数も負にならないので、この検定は片側検定になります。 (→5.3 計数値の相関 (2) 名義尺度の相関)
Aの分類とBの分類がお互いに独立ではない時つまりクラメールの連関係数が0ではない時、χo2は非心度λの非心χ2分布に従います。 λは食い違い量の平方を合計した値であり、χo2によって推定することができます。 そして非心χ2分布の(α/2)点の値χ2(φ,λ,α/2)と(1 - α/2)点の値χ2(φ,λ,1 - α/2)を利用してχo2の区間推定を行うことができます。 さらにそれらの値を利用して寄与率とクラメールの連関係数の区間推定も行うことができます。 (→付録1 各種の確率分布)
なおこの検定は片側検定ですから、本来なら推定も片側信頼区間を用いるべです。 しか寄与率も連関係数も負にならないので片側信頼区間の下限は負になりません。 そのためt検定のように「信頼区間に基準値(この場合はR2=V=0)が入っていなければ有意」という関係が成り立たず、検定結果と推定結果が矛盾することがあります。 そこで寄与率と連関係数は片側信頼区間ではなく両側信頼区間を求めるのが普通です。
表4.2.6のデータについて実際に計算してみましょう。
Bが2分類の時、Ap群とAq群のB2分類の出現率の差の区間推定を2×2分割表と同じ方法で行うことができます。 (→3.4 2標本の計数値 (2)名義尺度 (注3))
2群ごとにフィッシャー型の多重比較または2×bのχ2検定を行い、その有意確率に検定の回数を掛けた値を有意確率にします。 Bが2分類の時は次のようにして出現率の差の区間推定を行うことができます。
Bが2分類の時は出現率の差の区間推定を次のようにして行うことができます。
表4.2.6のデータについて有意水準5%、信頼係数95%として、ボンフェローニ型多重比較を用いて実際に計算してみましょう。
この検定の帰無仮説は「独立モデルが正しい」つまり「交互作用はない」というものになり、対立仮説は「飽和モデルが正しい」つまり「交互作用がある」というものになります。 したがってこの検定は対数線形モデルの交互作用の検定であり、度数を対数変換した時の適合度の検定に相当します。 この手法のことをグッドマンにちなんでG検定といいますが、尤度比を利用した検定なので尤度比検定と呼ぶことが多いようです。
表4.2.8のnijについて、独立モデルと飽和モデルの尤度と尤度比は次のようになります。
この対数尤度比は実現度数と理論度数の比を対数変換した値に実現度数の重みを付けたものになっています。 そのため表4.2.8のデータを対数変換したものをA分類とB分類の二元配置型のデータと考え、それに実現度数の重みを付けて二元配置分散分析と同様の分析をすることができます。
表4.2.6のデータについて交互作用だけ実際に計算してみましょう。
要因 | B1 | … | Bj | … | Bb | 計 |
---|---|---|---|---|---|---|
A1 | y11 | … | y1j | … | y1b | T1. |
: | : | : | : | : | : | : |
Ai | yi1 | … | yij | … | yib | Ti. |
: | : | : | : | : | : | : |
Aa | ya1 | … | yaj | … | yab | Ta. |
計 | T.1 | … | T.j | … | T.b | TT |
この場合の帰無仮説と、帰無仮説が正しい時の要因Bの各時点における発生度数つまり計T.jの期待値と分散は次のようになります。
これらを基にしてT.jを標準化すると次のようになります。
zjの平方を合計して自由度の修正をした統計量Qは近似的に自由度(b-1)のχ2分布をします。 この場合も普通は連続修正を施しません。
全体の変動はブロックごとのB1〜Bb時点のデータが全て一致した時の要因Bの変動と等しくなります。 例えばB1だけが1で他は0の時を考えると次のようになります。
これは要因Aの変動を取り除いた時の全変動であり、同時にその自由度でもあります。 したがって要因Bの寄与率RB2は次のようになります。
表4.2.9のデータを順位が2つだけの順序分類尺度と考えてフリードマンの検定を適用すると、次のようにコクランのQ検定の計算式と一致します。 したがって要因Bの時期数が2つの時は、当然、マクネマーの検定における連続修正を加えない式に一致します。 (→4.2 多標本の計数値 (注5))
表4.2.7のデータについて実際に計算してみましょう。
順位が2つの時のフリードマンにおけるフィッシャー型多重比較とは次のような関係があります。
2時点ごとにフィッシャー型の多重比較またはマクネマーの検定を行い、その有意確率に検定の回数をかけた値を有意確率にします。 区間推定は信頼係数を(1 - α/検定回数)にして行います。
表4.2.7のデータについて有意水準5%、信頼係数95%として、ダネット型多重比較を用いて実際に計算してみましょう。