玄関雑学の部屋雑学コーナー統計学入門

(2) データに対応がある場合

1) 二元配置分散分析

医学分野では、対応のない多標本のデータと同様に対応のある多標本のデータもしばしば登場します。 例えば第3章で「慢性肝炎患者に薬剤を投与することによってASTが低下するか?」という問題について考えたのと同じように、次のような問題について考えてみましょう。 (→3.3 2標本の計量値 (1) データに対応がある場合)

問題:高血圧患者に血圧降下剤を投与することによって血圧が低下するか?

データに対応がない場合と同様に、この場合も降圧効果を評価するには収縮期血圧を評価項目にして平均値を評価指標にすることが医学的に妥当だとします。 しかしこの場合は観測時点が投与前後の2時点だけでなく3時点以上あり、その全てが評価対象時点だとします。 例えば測定時点が薬剤投与前、投与1週後、投与2週後の3時点あり、投与前と比較して投与1週後と2週後の収縮期血圧が低下するかどうかを調べたいとします。 この場合、母集団における投与前、1週後、2週後の収縮期血圧平均値をそれぞれμ0、μ1、μ2とし、基準値をμ0にします。 すると検定の帰無仮説を次のように表すことができます。

H0:μ0 = μ1 = μ2 (3時点の母平均値が全て等しい)

対立仮説については、医学的な同等範囲を決めて投与前と1週後、投与前と2週後それぞれで対立仮説を設定し、統計的仮説検定を行うことが可能です。 しかし対応のない場合と同様に、まずは帰無仮説を否定した単純な対立仮説を設定して有意性検定を行うことにしましょう。 (→(1) データに対応がない場合)

H1:μ0 ≠ μ1 = μ2 または μ1 ≠ μ2 = μ0 または μ2 ≠ μ0 = μ1 または μ0 ≠ μ1 ≠ μ2 (3時点の母平均値が全て等しいというわけではない)

これらの仮説を検定するために5例の高血圧患者に血圧降下剤を投与し、投与前、投与1週後、投与2週後の収縮期血圧を測定した結果が表4.1.6のようになったとします。

表4.1.6 薬剤投与前後の収縮期血圧(mmHg)
被験者No.投与前投与1週後投与2週後平均値
1116106108330110
2128102100330110
3129108108345115
4137118114369123
5140116110366122
6505505401740-
平均値130110108-116
平均値の標準誤差4.23.02.3-3.2
平均値の95%信頼区間118〜142102〜118102〜114-109〜123

この場合、データを変動させる要因は個人差と時期の2つと考えられます。 例えばNo.1とNo.2とNo.3の被検者の平均値(投与前・投与1週後・投与2週後の平均値)が110、110、115とばらついているのは個人差のためだと考えられます。 それに対して投与前、投与1週後、投与2週後の平均値(5例の被検者の平均値)が130、110、108とばらついているのは血圧降下剤の効果が時期によって変化しているためだと考えられます。

個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。 しかしこれは同じ人で時期を変えて3回測定した対応のあるデータなので個人差を誤差から分離して効率の良い分析をすることができます。 このようにデータを変動させる意味のある要因が2つある時の分散分析を二元配置分散分析(two-way layout analysis of variance)といいます。

通常の二元配置分散分析では一方の要因——この場合は個人差——は効果を分析するのが目的ではなく誤差を減らすのが目的であり、ブロック因子と呼ばれます。 では誤差に相当する要因は何でしょうか? それは時期による血圧の変動パターンが被験者によって異なるという要因です。 平ったくいえば血圧の下がり具合が個人によって異なっていること、つまり血圧の下がり具合の個人差が誤差になるのです。 これを個人(要因A)と時期(要因B)の交互作用(effect modification)といい、要因A×Bと表記します。 これが二元配置分散分析における誤差つまり残差になります。 この交互作用に対して要因Aと要因Bによる変動のことを主効果といいます。

二元配置分散分析ではデータyijを次のように分解して考えます。

yij = μ + αi + βj + εij → (yij - μ) = αi + βj + εij
(yij - mT) = (mi. - mT) + (m.j - mT) + (yij - mij) = (mi. - mT) + (m.j - mT) + {yij - (mi. + m.j - mT)}
μ ≒ mT:総平均値   αi ≒ (mi. - mT):要因A第i水準による変動分   βj ≒ (m.j - mT):要因B第j水準による変動分
εij ≒ (yij - mij):要因A第i水準と要因B第j水準の交互作用による変動分=残差
mi.:要因A第i水準の平均値  m.j:要因B第j水準の平均値
mij = mi. + m.j - mT:要因A第i水準・要因B第j水準の理論的推定値
被検者No.5の投与前の値:140 = 116 + (122 - 116) + (130 - 116) + (140 - 136)=116 + 6 + 14 + 4
∴(140 - 116) = 24 = (122 - 116) + (130 - 116) + (140 - 136)=6 + 14 + 4
図4.1.4 二元配置分散分析の模式図

一元配置分散分析と同様に、この基本式に従って平方和と自由度と分散を求めることができます。 表4.1.6のデータについてそれらを計算し、分散分析表にまとめると次のようになります。 (注1)

表4.1.7 分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
要因A:個人差4744118.55.780
要因B:時期1480274036.098
残差:交互作用164820.5 
全体211814 

二元配置分散分析では個人差を誤差から分離し、独立して検定することができます。 それが要因Aの検定であり、この検定の帰無仮説と対立仮説は次のように表せます。

H0:被検者ごとの平均値は全て等しい。
H1:被検者ごとの平均値は全て等しいわけではない。

有意水準5%として、表4.1.7の分散比について検定すると次のようになります。

FA = 5.780(p = 0.0173) > F(4,8,0.05) = 3.838 … 有意水準5%で有意

この検定結果から被験者ごとの平均値はばらついていることがわかります。 ただしここでは要因Aはブロック因子であり、個人差を誤差から分離して効率の良い分析をすることが目的です。 そのため検定結果よりも分散比の方が重要です。 この場合の分散比は5.780つまり個人差の情報密度が誤差の情報密度の6倍ほどあるので個人差を誤差から分離すると誤差の情報密度が薄くなり、効率が良くなることがわかります。

要因Bの検定は時期の検定であり、これがこの分析の主目的です。

FB = 36.098(p = 0.0001) > F(2,8,0.05) = 4.459 … 有意水準5%で有意
要因Bの寄与率:R B 2 = 要因Bの平方和 要因Bの平方和+残差の平方和 = 1480 1480 + 164 = 0.900(90.0%)

要因Bの寄与率は要因Bの平方和を全体の平方和で割るのではなく、全体の平方和から要因Aの平方和を引いたもの、つまり(要因Bの平方和+残差の平方和)で割ります。 これはブロック因子の情報を全体の情報から分離して要因Bの情報を検討するためです。 この検定結果から次のような統計学的結論を採用することができます。

統計学的結論:3時点の収縮期平均値は全て等しいというわけではない=収縮期血圧平均値は時期によって変動する。

この統計学的結論から医学的結論を導くためには、次のような点について検討する必要があります。

  1. 90%という寄与率は医学的に意義があるか?
  2. 投与前の収縮期血圧平均値130mmHgに対して、投与1週後の平均値110mmHg、投与2週後の平均値108mmHgという値は医学的に見て低下したといえるか?
  3. これらの平均値の変化は純粋に血圧降下剤の効果によるものか?
  4. この結果をそのまま高血圧患者全体に当てはめて良いか?

これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。

医学的結論:血圧降下剤を投与することによって収縮期血圧は低下する。 すなわち血圧降下剤には効果がある。

実は、表4.1.6は表4.1.1の対応のないデータを対応のあるデータにしたものです。 そのため個人差を残差に含めて一元配置分散分析にすると、その分散分析表は表4.1.2の分散分析表の要因Aを時期にしたものと一致します。

表4.1.8 個人差を残差に含めた分散分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
要因B:時期1480274013.918
残差:個人差+交互作用6381253.167 
全体211814 

表4.1.7と表4.1.8を比べると残差分散が大きくなって誤差の情報密度が濃くなっています。 その結果、個人差に関する情報が得られないだけでなく検定や推定の精度も悪くなります。 しかし個人差の情報密度が誤差よりも薄ければ、個人差を残差に含めて一元配置分散分析にした方が効率が良くなります。 このように対応のあるデータを対応のないデータとして扱った方が効率が良いのは個人差が誤差よりも小さい時だけです。 医学分野で扱うデータは個人差が大きいものが多いので、そのような場合はめったにありません。

また二元配置分散分析で要因Bの時期数(水準数)が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。 その場合、要因Bの変動とは2時期の平均値の差に相当し、誤差である交互作用とは要因Bの変動パターンが個人によって異なっていること、つまり2時期の変化量のバラツキに相当します。 (注2) (→3.3 2標本の計量値 (1) データに対応がある場合)

2) 多重比較

二元配置分散分析で時期の検定結果が有意になっても「3時点の平均値がばらついている」という定性的かつ漠然とした結論しか出せません。 投与前の平均値と比較してどの時点の平均値が異なっているかを検討するためには、投与前と投与1週後、投与前と投与2週後について多重比較を行う必要があります。 表4.1.6のデータについて医学的な同等範囲を±10mmHgとすると、多重比較の対立仮説は次のようになります。

H1:μ1 = μ0 ± 10 または μ2 = μ0 ± 10

第1節の多重比較で説明したように、この場合は投与前の平均値を対照にして他の2時点の平均値をこれと比較し、2つの検定結果を”いいとこ取り”するのでダネット型多重比較を適用します。 有意水準5%、信頼係数95%として、ダネット型多重比較とそれに対応する区間推定を行うと次のようになります。 (注3)

○投与1週後対投与前
検定:do = 6.984(p = 0.0002) > d(2,8,0.05) = 2.673 … 有意水準5%で有意
δ01の95%同時信頼区間 = -20 ± 7.74 → 下限:δ01L = -27.7 上限:δ01U = -12.3
○投与2週後対投与前
検定:do = 7.683(p = 0.0001) > d(2,8,0.05) = 2.673 … 有意水準5%で有意
δ02の95%同時信頼区間 = -22 ± 7.74 → 下限:δ02L = -29.7 上限:δ02U = -14.3

以上の結果より、ファミリーとしての統計学的結論は次のようになります。

ファミリーとしての統計学的結論:投与前の収縮期血圧平均値と比較して投与1週後と2週後の収縮期平均値は低下している。
 平均値の差はそれぞれ-20と-22であり、幅をもたせればそれぞれ-28〜-12の間と-30〜-14の間である。

これについても分散分析と同様の疑問点について検討し、全て肯定的に答えられるとしたら次のような医学的結論を採用することができます。

医学的結論:血圧降下剤を投与することによって1週後と2週後の収縮期血圧は低下する。 すなわち血圧降下剤は1週後から2週後まで効果がある。

二元配置分散分析では要因Aと要因Bの検定を行うので最低でも検定を2回行います。 そのため「検定を複数回行う時は必ず多重比較が必要である!」と誤解していると、要因Aの検定と要因Bの検定も多重比較にする必要があると考えてしまうかもしれません。 しかしこれらはそれぞれ目的が異なる独立した検定であり、これらの検定結果をいいとこ取りしてファミリーとしての結論を採用することはありません。 したがって要因Aの検定と要因Bの検定を多重比較にする必要はありません

多重比較が必要なのは複数の検定結果を”いいとこ取り”する時だけです。


(注1) 2つの要因A、Bの水準数をそれぞれa、bとして、表4.1.6を一般化すると次のようになります。

表4.1.9 二元配置分散分析の一般的データ
要因B1 … Bj … Bb平均値
A1y11y1jy1bT1.m1.
::::::::
Aiyi1yijyibTi.mi.
::::::::
Aaya1yajyabTa.ma.
T.1T.jT.bTT
平均m.1m.jm.bmT

データyijを二元配置分散分析の基本式に従って分解し、平方和と自由度と分散を求めると次のようになります。

二元配置分散分析の基本式(二元配置分散分析モデル):
 (yij - μ) = αi + βj + εij ≒ (yij - mT) = (mi. - mT) + (m.j - mT) + (yij - mij) = (mi. - mT) + (m.j - mT) + {yij - (mi. + m.j - mT)}
○全体
例数:n = a b  平方和:
自由度:φT = n - 1   分散:
○要因A
平方和:
自由度:φA = a - 1   分散:   寄与率:
○要因B
平方和:
自由度:φB = b - 1   分散:   寄与率:
○残差:A×B
平方和:
自由度:φR = φT - φA - φB = n - a - b + 1 = (a - 1)(b - 1) = φA×φB   分散:
E(VR)=σR2   E(VA) = bσA2 + σR2   E(VB)= a σB2 + σ R2
     

これらの値を分散分析表にまとめると次のようになります。

表4.1.10 分散分析表
要因平方和SS自由度φ平均平方和Ms分散比F
ASAφAVAFA = VA/VR
BSBφBVBFB = VB/VR
残差SRφRVR 
全体STφT 

表4.1.6のデータについて実際に計算してみましょう。

ST = 1162 + 1282 + … + 1102 - 15×1162 = 203958 - 201840 = 2118
φT = 15 - 1 = 14  
SA = 3×(1102 + 1102 + … + 1222) - 201840 = 202314 - 201840 = 474
φA = 5 - 1 = 4     
SB = 5×(1302 + 1102 + 1082) - 201840 = 203320 - 201840 = 1480
φB = 3 - 1 = 2     
SR = 2118 - 1480 - 474 = 164  φR = 14 - 2 - 4 = 8   

(注2) 二元配置分散分析において、要因Bの水準数bを2にすると次のようになります。

n = 2a     φT = n - 1 = 2a - 1

S11:B1の平方和   S12:B2の平方和   S12:B1とB2の積和
  

φA = a - 1  

φB = 2 - 1 = 1  VB = SB

φR = n - a - 1 = a - 1   

以上のように、二元配置分散分析で時期が2つの時は対応のあるt検定(ただし両側検定)と一致します。 対応のあるt検定よりも分散分析の方がきめの細かい分析が可能なので、対応のある2標本の平均値を両側検定で比較したい時は分散分析を用いた方が便利です。 第3章第3節の表3.3.1のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)

表4.1.11 表3.3.1の分散分析表
要因平方和SS自由度φ平均平方和Ms分散比F
個人差10059111.6673.073
時期500150013.761
残差327936.333 
全体183219 
○要因A:個人差
FA ≒ 3.073(p = 0.0549) < F(1,9,0.05) = 5.117 … 有意水準5%で有意ではない
RA2 ≒ 0.755(75.5%)
○要因B:時期
FB ≒ 13.761(p = 0.0048) > F(1,9,0.05) = 5.117 … 有意水準5%で有意
  
RB2 ≒ 0.605(60.5%)

(注3) 要因Bに関するダネット型多重比較は次のようになります。

○投与1週後対投与前
md = 110 - 130 = -20      
|do| = 6.984(p = 0.0002) > d(2,8,0.05) = 2.673
δ01の95%同時信頼区間 = -20 ± 7.74 → 下限:δ01L = -27.7 上限:δ01U = -12.3
○与2週後対投与前
md = 108 - 130 = -22   
|do| = 7.683(p = 0.0001) > d(2,8,0.05) = 2.673
δ01の95%同時信頼区間 = -22 ± 7.74 → 下限:δ01L = -29.7 上限:δ01U = -14.3