玄関雑学の部屋雑学コーナー統計学入門

(2) 名義尺度(分類データ)

データが名義尺度の時は度数を利用した分散分析相当の手法を適用します。 話の都合上、ここでもデータに対応がない場合から説明しましょう。

1) データに対応がない場合

a) 出現率パターンの検定

表4.1.1の収縮期血圧について120mmHg未満を「正常」、120mmHg以上を「異常」と判定して、対応のない名義尺度のデータにしてみましょう。 そして薬剤投与群と収縮期血圧判定をクロス集計し、クロス集計表にまとめます。

表4.2.5 薬剤投与後の収縮期血圧判定
群内No.A剤投与群B剤投与群C剤投与群
1正常正常正常
2異常正常正常
3異常正常正常
4異常正常正常
5異常正常正常
表4.2.6 薬剤投与群と判定のクロス集計表
群\判定 正常  異常   計  
A剤投与群145
B剤投与群505
C剤投与群505
11415
図4.2.3 収縮期血圧判定のバーチャート

表4.2.5のクロス集計表は3群のデータを2種類に分類した3×2分割表なので、第3章で説明したχ2検定を適用して群ごとの異常率が同じかどうか検定することができます。 χ2検定は名義尺度における一元配置分散分析に相当し、多群の出現率パターンつまり多分類の割合が全て等しいかどうかを検定します。 そのため2標本t検定に相当する2×2のχ2検定以外は有意性検定を行うのが普通であり、この場合の帰無仮説と対立仮説は次のようになります。 (→3.4 2標本の計数値 (2) 名義尺度(分類データ) 2) データに対応がない場合)

H0:3群の異常率は全て等しい。
H1:3群の異常率は全て等しいというわけではない。

また表4.2.5が横断的研究から得られた得られデータをまとめたものの時は、問題を「薬剤の種類と判定の間に関連があるか?」ととらえることができます。 その場合は独立性または関連性または適合度の検定になり、クラメール(Cramer)の連関係数(coefficient of contingency)V(またはθ)を評価指標にして次のような帰無仮説と対立仮説になります。

H0:薬剤の種類と判定の間に関連性はない → V = 0
H1:薬剤の種類と判定の間にδV程度の関連性がある → V = δV > 0

通常、2×2のχ2検定以外は連続修正を施さないため、出現率パターンの検定と連関係数の検定は同じものになります。 したがって前向き研究から得られたデータにも横断的研究から得られたデータにも連関係数の検定を適用し、結果を解釈する時にデータが得られた研究デザインと評価指標を考慮するのが合理的です。

有意水準5%として、表4.2.6に3×2のχ2検定を適用すると次のようになります。 (注1)

クラメールの連関係数:V = 0.853   寄与率:r2 = V2 = 0.727(72.7%)
χo2 = 10.909(p = 0.0043) > χ2(2,0.05) = 5.991 … 有意水準5%で有意
クラメールの連関係数の95%信頼区間:下限 = 0.404 上限 = 1

χo2は理論度数と実現度数の食い違いの平方を合計した値であり、一元配置分散分析における要因Aの平方和SAに相当する値です。 そして寄与率は一元配置分散分析における要因Aの寄与率に相当し、全体の理論度数と実現度数の食い違い平方和に対する要因Aによる食い違い平方和の割合を表します。 クラメールの連関係数は1度数あたりの食い違い量を表し、薬剤の種類と判定が独立なら0に、完全に関連していれば1になります。 これらの結果から次のような統計学的結論を採用することができます。

統計学的結論:3群の異常率は全て等しいというわけではない。
 または
統計学的結論:薬剤の種類と判定の間には関連性がある。 それは85%程度であり、幅をもたせれば40〜100%の間である。

この統計学的結論から医学的結論を導くためには、一元配置分散分析と同様に次のような点について検討する必要があります。

  1. 約85%という連関係数または約73%という寄与率は医学的に意義があるか?
  2. A剤(プラセボ)の異常率に対してB剤とC剤の異常率が80%低いということは、医学的に意義があるか?(異常率が低いといえるか?)
  3. これらの異常率の違いは純粋に薬剤BまたはCの効果によるものか?
  4. この結果をそのまま高血圧患者全体に当てはめて良いか?

これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。

医学的結論:薬剤A、B、Cの異常率は同一ではない。 すなわち薬剤B、Cには降圧効果がある。
 または
医学的結論:薬剤の種類と判定の間には関連性がある。

一元配置分散分析と同様に、この場合も多重比較を行うことができます。 この場合の多重比較は平均値の代わりに出現率を用いるだけで、原理は一元配置分散分析の多重比較と同じです。 そして出現率に関する医学的な同等範囲を±10%未満とすると、多重比較の対立仮説は次のようになります。

H:B剤投与群とA剤投与群の異常率は-10%または+10%異なる。
  または
H:C剤投与群とA剤投与群の異常率は-10%または+10%異なる。
  または
H:C剤投与群とB剤投与群の異常率は-10%または+10%異なる。

有意水準5%、信頼係数95%として、ボンフェローニ型多重比較とそれに対応する区間推定を行うと次のようになります。 (注2)

○B剤投与群対A剤投与群
χo2 = 8.182(p = 0.0042) → p = 0.0042×3 = 0.0127 < 0.05 … 有意水準5%で有意
出現率の差の95%同時信頼区間 = -0.8 ± 0.43 → 下限 = -1 上限 = -0.37
○C剤投与群対A剤投与群
χo2 = 8.182(p = 0.0042) → p = 0.0042×3 = 0.0127 < 0.05 … 有意水準5%で有意
出現率の差の95%同時信頼区間 = -0.8 ± 0.43 → 下限 = -1 上限 = -0.37
○C剤投与群対B剤投与群
χo2 = 0(p = 1) → p = 1 > 0.05 … 有意水準5%で有意ではない
出現率の差の95%同時信頼区間 = 0 ± 0 → 下限 = 0 上限 = 0

以上の結果より、ファミリーとしての統計学的結論は次のようになります。

ファミリーとしての統計学的結論:A剤投与群と比較するとB剤投与群およびC剤投与群の異常率は低く、B剤投与群とC剤投与群の異常率は同じである。
 B剤投与群およびC剤投与群とA剤投与群の異常率の差は-80%であり、幅をもたせれば-100%〜-37%の間であ。
 C剤投与群とB剤投与群の異常率の差は0%である。

これについてもχ2検定と同様の疑問点について検討し、全てに肯定的に答えられるとしたら次のような医学的結論を採用することができます。

医学的結論:薬剤B、Cには降圧効果があり、その降圧効果は同じである。

分類数が3つ以上の時は出現率ではなく出現パターンつまり分類の割合を多重比較することになります。 その場合、分類の割合について医学的な同等範囲を合理的に決めるのが難しいので統計的仮説検定ではなく有意性検定を行います。 そうするとわざわざ多重比較をする意義が薄くなるので多重比較は行わず、χ2検定だけ行って各群の分類の割合の違いを医学的に検討するのが実際的です。

b) 尤度比検定

多群の出現率パターンが全て等しいかどうかを検定する手法として、尤度(ユウド、likelihood)を利用する尤度比検定(likelihood ratio test、G検定とも呼ばれる)というものがあります。 尤度は特定の母数の「もっともらしさ」を表す条件付き確率の一種であり、判別分析で利用されるので詳しい説明はそちらを参照してください。 また尤度比検定はロジスティック回帰分析でも用いられるのでそちらも参考にしてください。 (→9.3 1変量の場合 (1) 尤度と最尤法10.3 ロジスティック回帰分析の計算方法 (注2))

尤度比検定では次のような帰無仮説と対立仮説を設定します。

H0:3群の出現率パターンは全て等しい → 群と判定の分類は独立である。
H1:3群の異常率は全て等しいというわけではない → 群と判定の分類は独立ではない(関連がある)。

帰無仮説が正しい時は「3群の出現率パターンが全て同じ」という結果になる確率が最も高くなり、「3群の出現率パターンが異なっている」という結果になる確率は低くなります。 その反対に対立仮説が正しい時は「3群の出現率パターンが異なっている」という結果になる確率の方が高くなります。 そのため実際の結果が「3群の出現率パターンが全て同じ」という時は、「帰無仮説のもっともらしさ」つまり帰無仮説の尤度の方が「対立仮説のもっともらしさ」つまり対立仮説の尤度よりも高くなります。 そして実際の結果が「3群の出現率パターンが異なっている」という時はその反対になります。

そこで帰無仮説の最大尤度と対立仮説の最大尤度の比つまり尤度比(likelihood ratio)を求めると、これは実際の結果が「3群の出現率パターンが全て同じ」時は大きくなり、「3群の出現率パターンが異なっている」時は小さくなるはずです。

尤度比:LR = ℒ(θ ) 0 ℒ(θ ) 1
ℒ(θ0):帰無仮説の最大尤度  ℒ(θ1):対立仮説の最大尤度

この尤度比は3群の出現率が異なっているほど小さな値になるので、3群の出現率のバラツキの程度を表す指標としては直感的にわかりにくいところがあります。 そこでこの値を逆数にすると3群の出現率のバラツキの程度を表す指標つまり群と判定の関連性の強さを表す指標になります。 そしてこの尤度比を平方して対数変換すると近似的にχ2分布をするので、この性質を利用して独立性(関連性)の検定を行うことができます。

関連性の強さを表す尤度比:LR = ℒ(θ ) 1 ℒ(θ ) 0
χ2 = ln(LR2) = 2{L(θ1) - L(θ0)}   L(θ0):帰無仮説の最大対数尤度   L(θ1):対立仮説の最大対数尤度

有意水準5%として、表4.2.6に尤度比検定を適用すると次のようになります。 (注3)

尤度比:LR = 1.512  ln(LR) = 0.413
χo2 = 12.393(p = 0.0020) > χ2(2,0.05) = 5.991 … 有意水準5%で有意

この検定結果は前述の出現率パータンまたは連関係数の検定結果と少し違っています。 しかしこの手法は出現率のバラツキの程度または関連性の程度を表す指標が異なっているので、それは当然です。 そのためこの手法は尤度比を出現率のバラツキの程度を表す指標にすることが医学的に妥当な時だけ用います。 尤度比は解釈が難しいので、普通は連関係数の検定を用いた方が無難です。

2) データに対応がある場合

今度は表4.1.6の収縮期血圧について120mmHg未満を「正常」、120mmHg以上を「異常」と判定して、対応のある分類データにしてみましょう。

表4.2.7 薬剤投与前後の収縮期血圧判定
被験者No.投与前投与1週後投与2週後
1正常正常正常
2異常正常正常
3異常正常正常
4異常正常正常
5異常正常正常
図4.2.4 時点別収縮期血圧異常率

表4.2.7のデータを正常/異常という判定を順位が2つだけの順序尺度と考えれば、フリードマンの検定を適用して個人差を取り除いた時の順位平均値の時期変動を検定することができます。 その場合、順位平均値は実質的に異常率に相当し、個人差を取り除いた時の異常率の時期変動を検定していることになります。 この手法はコクラン(Cochran)のQ検定と呼ばれ、名義尺度における繰り返しのない二元配置分散分析に相当します。

フリードマンの検定と同様にこの手法も有意性検定行うのが普通であり、帰無仮説と対立仮説は次のようになります。

H0:3時点の異常率は全て等しい=異常率は時期によって変動しない。
H1:3時点の異常率は全て等しいというわけではない=異常率は時期によって変動する。

有意水準5%として、表4.2.7のデータについて実際に計算すると次のようになります。 (注4)

Q = χo2 = 8(p = 0.0183) > χ2(2,0.05) = 5.991 … 有意水準5%で有意
要因Bの寄与率:RB2 = 0.8(80%)

統計量Qは出現率の分散に相当する値であり、これは近似的に自由度(時期数 - 1)のχ2分布をします。 そのため検定統計量としてF値ではなくχ2値を用います。 またこの場合の要因Bの寄与率は被験者ごとの3時点の正常/異常のバラツキの中で時期変動によって説明できる割合になります。 上記の結果から次のような統計学的結論を採用することができます。

統計学的結論:3時点の異常率は全て等しいというわけではない=異常率は時期によって変動する。

この統計学的結論から医学的結論を導くためには、フリードマンの検定と同様に次のような点について検討する必要があります。

  1. 80%という寄与率は医学的に意義があるか?
  2. 投与前の異常率と比較すると投与1週後と2週後の異常率が80%低いということは医学的に見て意義があるか?(異常率が低いといえるか?)
  3. これらの異常率の変化は純粋に血圧降下剤の効果によるものか?
  4. この結果をそのまま高血圧患者全体に当てはめて良いか?

これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。

医学的結論:血圧降下剤を投与することによって収縮期血圧の異常率は低下する。 すなわち血圧降下剤には降圧効果がある。

この場合の多重比較は順位平均値の代わりに異常率を用いるだけで、原理はフリードマンの検定の多重比較と同じです。 そして異常率の差の医学的同等範囲を±10%未満とすると、多重比較の対立仮説は次のようになります。

H1:投与1週後と投与前の異常率は-10%または+10%異なる。
  または
H1:投与2週後と投与前の異常率は-10%または+10%異なる。

有意水準5%、信頼係数95%として、ダネット型多重比較とそれに対応する区間推定を行うと次のようになります。 (注5)

○投与1週後対投与前
|do| = 2.449(p = 0.0270) > d(2,∞) = 2.212 … 有意水準5%で有意
出現率の差の95%同時信頼区間 = -0.8 ± 0.72 → 下限 = -1 上限 = -0.08
○投与2週後対投与前
|do| = 2.449(p = 0.0270) > d(2,∞) = 2.212 … 有意水準5%で有意
出現率の差の95%同時信頼区間 = -0.8 ± 0.72 → 下限 = -1 上限 = -0.08

以上の結果より、ファミリーとしての統計学的結論は次のようになります。

ファミリーとしての統計学的結論:投与前の異常率と比較すると投与1週後と2週後の異常率は低下している。
 異常率の差はどちらも-80%であり、幅をもたせれば-100%〜-8%の間である。

これについてもコックランのQ検定と同様の疑問点について検討し、全てに肯定的に答えられるとしたら次のような医学的結論を採用することができます。

医学的結論:血圧降下剤を投与することによって1週後と2週後の収縮期血圧異常率は低下する。 すなわち血圧降下剤は1週後から2週後まで効果がある。

コックランのQ検定と多重比較において時期数が2つの時は順位が2つだけの時のウィルコクソンの1標本検定つまりマクネマーの検定に相当し、χ2値の平方根がz値に対応します。 (→4.2 多標本の計数値 (注5))


(注1) 表4.2.6を一般化してA分類がa個、B分類がb個の時はa×bのχ2検定を適用します。 これは第3章の(注6)で説明した2×bのχ2検定を拡張したものになります。 (→3.4 2標本の計数値 (注6))

表4.2.8 a×b分割表
分類B1BjBb
A1n11n1jn1bN1.
:::::::
Aini1nijnibNi.
:::::::
Aana1najnabNa.
N.1N.jN.bN

帰無仮説はと対立仮説は次のようになります。

H0:A1〜Aa群におけるBの分類割合は同一である。
H1:A1〜Aa群におけるBの分類割合は同一ではない。
 または
H0:Aの分類とBの分類はお互いに独立である。
H1:Aの分類とBの分類はお互いに独立ではない。

この仮説のもとで各種の値は次のようになります。 連続修正を施すと非常に繁雑な式になるので、普通は2×2の時以外は連続修正を施しません。

nijの理論度数: (i = 1,…,a、j = 1,…,b)

自由度:φ = (a - 1)(b - 1)
検定:χo2 > χ2(φ,α)の時、有意水準100α%で有意

全体の変動はAの各群とBの各分類が完全に対応する時の要因Aの変動になります。 つまりAiに属するNi.例が全てBjに分類され、他のカラムは0例である時のχo2値が全体の変動になります。 ところがaとbは等しいとは限りません。 そこで仮にa≦bとすると、Aiのうちの1つの群については0ではないカラムが(b - a + 1)個存在することになります。 したがって全体の変動を表すχo2値をχT2とすると、この値は次のようになります。

○1個のカラムだけが0ではない群:個数 = a - 1

○(b - a + 1)個のカラムが0ではない群:個数 = 1

AとBは対等な名義尺度なので、どちらが小さくてもχT2を同じように計算することができます。 したがってaとbのうち小さい方をsとすると、寄与率R2は次のようになります。 この値の平方根は1度数あたりの食い違い量を表し、クラメールの連関係数になります。 そのためこの検定は分類割合(出現率パターン)の検定であると同時に連関係数の検定にもなります。 そして分類割合も連関係数も負にならないので、この検定は片側検定になります。 (→5.3 計数値の相関 (2) 名義尺度の相関)

Aの分類とBの分類がお互いに独立ではない時つまりクラメールの連関係数が0ではない時、χo2は非心度λの非心χ2分布に従います。 λは食い違い量の平方を合計した値であり、χo2によって推定することができます。 そして非心χ2分布の(α/2)点の値χ2(φ,λ,α/2)と(1 - α/2)点の値χ2(φ,λ,1 - α/2)を利用してχo2の区間推定を行うことができます。 さらにそれらの値を利用して寄与率とクラメールの連関係数の区間推定も行うことができます。 (→付録1 各種の確率分布)

なおこの検定は片側検定ですから、本来なら推定も片側信頼区間を用いるべです。 しか寄与率も連関係数も負にならないので片側信頼区間の下限は負になりません。 そのためt検定のように「信頼区間に基準値(この場合はR2=V=0)が入っていなければ有意」という関係が成り立たず、検定結果と推定結果が矛盾することがあります。 そこで寄与率と連関係数は片側信頼区間ではなく両側信頼区間を求めるのが普通です。

χo2の(1 - α)%信頼区間  下限:χL2 = χ2(φ,χo2,α/2)  上限:χU2 = χ2(φ,χo2,1 - α/2)
寄与率の(1 - α)%信頼区間  下限:  上限:
連関係数の(1 - α)%信頼区間 下限:VL = RL  上限:VU = RU

表4.2.6のデータについて実際に計算してみましょう。

自由度:φ = (3 - 1)×(2 - 1) = 2


χo2の95%信頼区間  下限:χL2 = χ2(2,10.909,0.025) = 2.453  上限:χU2 = χ2(2,10.909,0.975) = 28.959
寄与率の95%信頼区間  下限:  上限:
連関係数の95%信頼区間 下限:VL = 0.404 上限:VU = 1

(注2) χ2検定における多重比較の計算式は次のとおりです。 多重比較の各手法の特徴は第1節の(注4)を見てください。 (→4.1 多標本の計量値 (注4))

(0) フィッシャー型(LSD(Least Significant Difference)法)
npj:特定のAp群におけるBj分類の例数   nqj:特定のAq群におけるBj分類の例数
Np.:特定のAp群の合計例数   Nq.:特定のAq群の合計例数
Nj.:Bj分類の合計例数  N:全例数

※連続修正を施した時

検定:χo2 > χ2(n - 1,α)の時、有意水準100α%で有意

Bが2分類の時、Ap群とAq群のB2分類の出現率の差の区間推定を2×2分割表と同じ方法で行うことができます。 (→3.4 2標本の計数値 (2)名義尺度 (注3))

Ap群におけるB2分類の出現率:   Aq群におけるB2分類の出現率:
出現率の差:d = pq - pp
出現率の差の標準誤差:
出現率の差の100(1 - α)%信頼区間: → 下限:δL = d - t(∞,α)SEd  上限:δU = d + t(∞,α)SEd
※連続修正を施した時
出現率の差の100(1-α)%信頼区間:
→ 下限:  上限:
(1) ボンフェローニ型:ダンの多重比較

2群ごとにフィッシャー型の多重比較または2×bのχ2検定を行い、その有意確率に検定の回数を掛けた値を有意確率にします。 Bが2分類の時は次のようにして出現率の差の区間推定を行うことができます。

Ap群におけるB2分類の出現率:   Aq群におけるB2分類の出現率:
出現率の差:d = pq - pp
出現率の差の標準誤差:
比較回数:k = a(a - 1)/2
出現率の差の100(1-α)%信頼区間: → 下限:δL = d - t(∞,α/k)SEd  上限:δU = d + t(∞,α/k)SEd
※連続修正を施した時
出現率の差の100(1-α)%信頼区間:
→ 下限:  上限:
(2) シェッフェ型:シェッフェのs検定
npj:Ap群におけるBj分類の例数   nqj:Aq群におけるBj分類の例数
Np.:Ap群の合計例数   Nq.:Aq群の合計例数
N.j:Bj分類の合計例数  N:全例数

※連続修正を施した時

検定:χo2 > χ2((a - 1)(b - 1),α)の時、有意水準100α%で有意

Bが2分類の時は出現率の差の区間推定を次のようにして行うことができます。

Ap群におけるB2分類の出現率:   Aq群におけるB2分類の出現率:
出現率の差:d = pq - pp
出現率の差の標準誤差:
出現率の差の100(1 - α)%信頼区間:
→ 下限:  上限:
※連続修正を施した時
出現率の差の100(1-α)%信頼区間:
→ 下限:  上限:

表4.2.6のデータについて有意水準5%、信頼係数95%として、ボンフェローニ型多重比較を用いて実際に計算してみましょう。

○B剤投与群対A剤投与群

χo2の有意確率 = 0.0042 → p = 0.0042×3 = 0.0127 < 0.05
d = 0 - 0.8 = -0.8     t(∞,0.05/3) = 2.394より
出現率の差の95%同時信頼区間 = -0.8 ± 2.394×0.179 = -0.8 ± 0.43 → 下限 = -1 上限 = -0.37
○C剤投与群対A剤投与群

χo2の有意確率 = 0.0042 → p =0.0042×3 = 0.0127 < 0.05
d = 0 - 0.8 = -0.8
出現率の差の95%同時信頼区間 = -0.8 ± 2.394×0.179 = -0.8 ± 0.43 → 下限: = -1 上限: = -0.37
○C剤投与群対B剤投与群

χo2の有意確率 = 1 → p = 1 > 0.05
出現率の差の95%同時信頼区間 = 0 ± 0 → 下限 = 0 上限 = 0

(注3) 表4.2.8の度数を対数変換して線形モデルを当てはめ、2種類の分類間の交互作用つまり関連性を検討する手法をグッドマン(Goodman)が開発しました。 その手法では2種類の分類間に交互作用がない対数線形モデル(log linear model)のことを独立モデルと呼び、交互作用がある対数線形モデルのことを飽和モデル(saturated model)と呼びます。 交互作用のない独立モデルでは2種類の分類が独立になり、モデルから導かれる度数は理論度数になります。 それに対して交互作用のある飽和モデルから導かれる度数は実現度数そのものになります。 そして独立モデルの尤度と飽和モデルの尤度の比を利用して交互作用の有無を検定します。

この検定の帰無仮説は「独立モデルが正しい」つまり「交互作用はない」というものになり、対立仮説は「飽和モデルが正しい」つまり「交互作用がある」というものになります。 したがってこの検定は対数線形モデルの交互作用の検定であり、度数を対数変換した時の適合度の検定に相当します。 この手法のことをグッドマンにちなんでG検定といいますが、尤度比を利用した検定なので尤度比検定と呼ぶことが多いようです。

表4.2.8のnijについて、独立モデルと飽和モデルの尤度と尤度比は次のようになります。

独立モデルの尤度:   対数尤度:
飽和モデルの尤度:   対数尤度:
尤度比:   対数尤度比:

この対数尤度比は実現度数と理論度数の比を対数変換した値に実現度数の重みを付けたものになっています。 そのため表4.2.8のデータを対数変換したものをA分類とB分類の二元配置型のデータと考え、それに実現度数の重みを付けて二元配置分散分析と同様の分析をすることができます。

二元配置分散分析の基本式:

全体:   自由度:φT = a b - 1
要因A:   自由度:φA = a - 1
要因B:   自由度:φB = b - 1
交互作用:   φA×B = φA×φB = (a - 1)(b - 1)
交互作用の対数尤度比:   尤度比:
交互作用の検定(尤度比検定):χA×B2 > χ2A×B,α)の時、有意水準100α%で有意

表4.2.6のデータについて交互作用だけ実際に計算してみましょう。

自由度:φA×B = (3 - 1)×(2 - 1) = 2

  LR = exp(0.413114) = 1.51152

(注4) 要因Aの水準数つまり被験者数をa、要因Bの水準数つまり時期数をbとして、コクランのQ検定の計算式を導いてみましょう。 多時期の2分類データは「有」に相当する時は1、「無」に相当する時は0となるダミー変数yを用いて次のように表すことができます。

表4.2.9 多時期の2分類データ
要因B1BjBb
A1y11y1jy1bT1.
:::::::
Aiyi1yijyibTi.
:::::::
Aaya1yajyabTa.
T.1T.jT.bTT

この場合の帰無仮説と、帰無仮説が正しい時の要因Bの各時点における発生度数つまり計T.jの期待値と分散は次のようになります。

H0:母集団におけるB1〜Bb時点の発生確率は全て等しい。
n = a b     

これらを基にしてT.jを標準化すると次のようになります。

zjの平方を合計して自由度の修正をした統計量Qは近似的に自由度(b-1)のχ2分布をします。 この場合も普通は連続修正を施しません。


要因Bの検定:Q = χo > χ2(b-1,α)の時、有意水準100α%で有意

全体の変動はブロックごとのB1〜Bb時点のデータが全て一致した時の要因Bの変動と等しくなります。 例えばB1だけが1で他は0の時を考えると次のようになります。

これは要因Aの変動を取り除いた時の全変動であり、同時にその自由度でもあります。 したがって要因Bの寄与率RB2は次のようになります。

表4.2.9のデータを順位が2つだけの順序分類尺度と考えてフリードマンの検定を適用すると、次のようにコクランのQ検定の計算式と一致します。 したがって要因Bの時期数が2つの時は、当然、マクネマーの検定における連続修正を加えない式に一致します。 (→4.2 多標本の計数値 (注5))

データ0の平均順位:
データ1の平均順位:
Bjの順位和:
全体の順位和:
同位の補正:

表4.2.7のデータについて実際に計算してみましょう。

T.1 = 4  T.2 = T.3 = 0   TT = 4

(注5) 要因Bに関する多重比較は次のようになり、これは順位が2つの時のフリードマンの検定における多重比較と一致します。 (→4.2 多標本の計数値 (注4))

(0) フィッシャー型:LSD(Least Significant Difference)法
T.p:特定のp時点の発生度数   T.q:特定のq時点の発生度数
発生率の差:
発生率の差の標準誤差:
検定: > χ2(1,α)の時、有意水準100α%で有意
推定:発生率の差の100(1-α)%同時信頼区間:
→ 下限:δL = d - t(∞,α)SEd  上限:δU = d + t(∞,α)SEd

順位が2つの時のフリードマンにおけるフィッシャー型多重比較とは次のような関係があります。

     
Tj:時期jの順位和   rd:順位平均値の差   V(rd):順位平均値の差の分散
(1) ダネット型:ダネットのd検定
T.p:対照となるp時点の発生度数 T.q:q時点の発生度数
発生率の差:
発生率の差の標準誤差:
検定統計量:
検定:|do| > d(b - 1;∞,α)の時、有意水準100α%で有意
推定:発生率の差の100(1 - α)%同時信頼区間
→ 下限:δL = d - d(b-1;∞,α)SEpd  上限:δU = d + d(b-1;∞,α)SEd
(2) テューキー型:テューキーのq検定、HSD(Honestly Significant Difference)法
T.p:p時点の発生度数 T.q:q時点の発生度数
発生率の差:
発生率の差の標準誤差:
検定統計量:
検定:|qo| > q(b;∞,α)の時、有意水準100α%で有意
推定:発生率の差の100(1 - α)%同時信頼区間
→ 下限:  上限:
(3) ボンフェローニ型:ダンの多重比較

2時点ごとにフィッシャー型の多重比較またはマクネマーの検定を行い、その有意確率に検定の回数をかけた値を有意確率にします。 区間推定は信頼係数を(1 - α/検定回数)にして行います。

(4) シェッフェ型:シェッフェのs検定
○2群ごとの比較
T.p:p時点の発生度数 T.q:q時点の発生度数
発生率の差:
発生率の差の標準誤差:
検定: > χ2(b-1,α)の時、有意水準100α%で有意
推定:発生率の差の100(1 - α)%同時信頼区間
→ 下限:  上限:
○一般対比
  Ctj:j時点の係数
> χ2(b - 1,α)の時、有意水準100α%で有意

表4.2.7のデータについて有意水準5%、信頼係数95%として、ダネット型多重比較を用いて実際に計算してみましょう。

○投与1週後対投与前
d = 0 - 0.8 = -0.8  TT=4     
|do| = 2.449(p = 0.0270) > d(2,∞,0.05) = 2.212
発生率の差の95%同時信頼区間:δLU = -0.8 ± 2.212×0.327 ≒ -0.8 ± 0.72 → 下限 = -1 上限 = -0.08
○投与2週後対投与前
d = 0 - 0.8 = -0.8  
|do| = 2.449(p = 0.0270) > d(2,∞,0.05) = 2.212
発生率の差の95%同時信頼区間:δLU = -0.8 ± 2.212×0.327 ≒ -0.8 ± 0.72 → 下限 = -1 上限 = -0.08