前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1-1 | 1-2 | 2-1 | 2-2 | 3 | 4 |
医学分野では、対応のない多標本のデータと同様に対応のある多標本のデータもしばしば登場します。 例えば第3章で「慢性肝炎患者に薬剤を投与することによってASTが低下するか?」という問題について考えたのと同じように、次のような問題について考えてみましょう。 (→3.3 2標本の計量値 (1) データに対応がある場合)
データに対応がない場合と同様に、この場合も降圧効果を評価するには収縮期血圧を評価項目にして平均値を評価指標にすることが医学的に妥当だとします。 しかしこの場合は観測時点が投与前後の2時点だけでなく3時点以上あり、その全てが評価対象時点だとします。 例えば測定時点が薬剤投与前、投与1週後、投与2週後の3時点あり、投与前と比較して投与1週後と2週後の収縮期血圧が低下するかどうかを調べたいとします。 この場合、母集団における投与前、1週後、2週後の収縮期血圧平均値をそれぞれμ0、μ1、μ2とし、基準値をμ0にします。 すると検定の帰無仮説を次のように表すことができます。
対立仮説については、医学的な同等範囲を決めて投与前と1週後、投与前と2週後それぞれで対立仮説を設定し、統計的仮説検定を行うことが可能です。 しかし対応のない場合と同様に、まずは帰無仮説を否定した単純な対立仮説を設定して有意性検定を行うことにしましょう。 (→(1) データに対応がない場合)
これらの仮説を検定するために5例の高血圧患者に血圧降下剤を投与し、投与前、投与1週後、投与2週後の収縮期血圧を測定した結果が表4.1.6のようになったとします。
被験者No. | 投与前 | 投与1週後 | 投与2週後 | 計 | 平均値 |
---|---|---|---|---|---|
1 | 116 | 106 | 108 | 330 | 110 |
2 | 128 | 102 | 100 | 330 | 110 |
3 | 129 | 108 | 108 | 345 | 115 |
4 | 137 | 118 | 114 | 369 | 123 |
5 | 140 | 116 | 110 | 366 | 122 |
計 | 650 | 550 | 540 | 1740 | - |
平均値 | 130 | 110 | 108 | - | 116 |
平均値の標準誤差 | 4.2 | 3.0 | 2.3 | - | 3.2 |
平均値の95%信頼区間 | 118〜142 | 102〜118 | 102〜114 | - | 109〜123 |
この場合、データを変動させる要因は個人差と時期の2つと考えられます。 例えばNo.1とNo.2とNo.3の被検者の平均値(投与前・投与1週後・投与2週後の平均値)が110、110、115とばらついているのは個人差のためだと考えられます。 それに対して投与前、投与1週後、投与2週後の平均値(5例の被検者の平均値)が130、110、108とばらついているのは血圧降下剤の効果が時期によって変化しているためだと考えられます。
個人差を誤差と考えてしまえば、これは水準数が3である一元配置分散分析になります。 しかしこれは同じ人で時期を変えて3回測定した対応のあるデータなので個人差を誤差から分離して効率の良い分析をすることができます。 このようにデータを変動させる意味のある要因が2つある時の分散分析を二元配置分散分析(two-way layout analysis of variance)といいます。
通常の二元配置分散分析では一方の要因——この場合は個人差——は効果を分析するのが目的ではなく誤差を減らすのが目的であり、ブロック因子と呼ばれます。 では誤差に相当する要因は何でしょうか? それは時期による血圧の変動パターンが被験者によって異なるという要因です。 平ったくいえば血圧の下がり具合が個人によって異なっていること、つまり血圧の下がり具合の個人差が誤差になるのです。 これを個人(要因A)と時期(要因B)の交互作用(effect modification)といい、要因A×Bと表記します。 これが二元配置分散分析における誤差つまり残差になります。 この交互作用に対して要因Aと要因Bによる変動のことを主効果といいます。
二元配置分散分析ではデータyijを次のように分解して考えます。
一元配置分散分析と同様に、この基本式に従って平方和と自由度と分散を求めることができます。 表4.1.6のデータについてそれらを計算し、分散分析表にまとめると次のようになります。 (注1)
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:個人差 | 474 | 4 | 118.5 | 5.780 |
要因B:時期 | 1480 | 2 | 740 | 36.098 |
残差:交互作用 | 164 | 8 | 20.5 | |
全体 | 2118 | 14 |
二元配置分散分析では個人差を誤差から分離し、独立して検定することができます。 それが要因Aの検定であり、この検定の帰無仮説と対立仮説は次のように表せます。
有意水準5%として、表4.1.7の分散比について検定すると次のようになります。
この検定結果から被験者ごとの平均値はばらついていることがわかります。 ただしここでは要因Aはブロック因子であり、個人差を誤差から分離して効率の良い分析をすることが目的です。 そのため検定結果よりも分散比の方が重要です。 この場合の分散比は5.780つまり個人差の情報密度が誤差の情報密度の6倍ほどあるので個人差を誤差から分離すると誤差の情報密度が薄くなり、効率が良くなることがわかります。
要因Bの検定は時期の検定であり、これがこの分析の主目的です。
要因Bの寄与率は要因Bの平方和を全体の平方和で割るのではなく、全体の平方和から要因Aの平方和を引いたもの、つまり(要因Bの平方和+残差の平方和)で割ります。 これはブロック因子の情報を全体の情報から分離して要因Bの情報を検討するためです。 この検定結果から次のような統計学的結論を採用することができます。
この統計学的結論から医学的結論を導くためには、次のような点について検討する必要があります。
これらの疑問点について全て肯定的に答えられるとしたら、次のような医学的結論を採用することができます。
実は、表4.1.6は表4.1.1の対応のないデータを対応のあるデータにしたものです。 そのため個人差を残差に含めて一元配置分散分析にすると、その分散分析表は表4.1.2の分散分析表の要因Aを時期にしたものと一致します。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因B:時期 | 1480 | 2 | 740 | 13.918 |
残差:個人差+交互作用 | 638 | 12 | 53.167 | |
全体 | 2118 | 14 |
表4.1.7と表4.1.8を比べると残差分散が大きくなって誤差の情報密度が濃くなっています。 その結果、個人差に関する情報が得られないだけでなく検定や推定の精度も悪くなります。 しかし個人差の情報密度が誤差よりも薄ければ、個人差を残差に含めて一元配置分散分析にした方が効率が良くなります。 このように対応のあるデータを対応のないデータとして扱った方が効率が良いのは個人差が誤差よりも小さい時だけです。 医学分野で扱うデータは個人差が大きいものが多いので、そのような場合はめったにありません。
また二元配置分散分析で要因Bの時期数(水準数)が2つの時は対応のあるt検定に相当し、一元配置分散分析と同様にF値の平方根がt値に一致します。 その場合、要因Bの変動とは2時期の平均値の差に相当し、誤差である交互作用とは要因Bの変動パターンが個人によって異なっていること、つまり2時期の変化量のバラツキに相当します。 (注2) (→3.3 2標本の計量値 (1) データに対応がある場合)
二元配置分散分析で時期の検定結果が有意になっても「3時点の平均値がばらついている」という定性的かつ漠然とした結論しか出せません。 投与前の平均値と比較してどの時点の平均値が異なっているかを検討するためには、投与前と投与1週後、投与前と投与2週後について多重比較を行う必要があります。 表4.1.6のデータについて医学的な同等範囲を±10mmHgとすると、多重比較の対立仮説は次のようになります。
第1節の多重比較で説明したように、この場合は投与前の平均値を対照にして他の2時点の平均値をこれと比較し、2つの検定結果を”いいとこ取り”するのでダネット型多重比較を適用します。 有意水準5%、信頼係数95%として、ダネット型多重比較とそれに対応する区間推定を行うと次のようになります。 (注3)
以上の結果より、ファミリーとしての統計学的結論は次のようになります。
これについても分散分析と同様の疑問点について検討し、全て肯定的に答えられるとしたら次のような医学的結論を採用することができます。
二元配置分散分析では要因Aと要因Bの検定を行うので最低でも検定を2回行います。 そのため「検定を複数回行う時は必ず多重比較が必要である!」と誤解していると、要因Aの検定と要因Bの検定も多重比較にする必要があると考えてしまうかもしれません。 しかしこれらはそれぞれ目的が異なる独立した検定であり、これらの検定結果をいいとこ取りしてファミリーとしての結論を採用することはありません。 したがって要因Aの検定と要因Bの検定を多重比較にする必要はありません。
多重比較が必要なのは複数の検定結果を”いいとこ取り”する時だけです。
要因 | B1 | … | Bj | … | Bb | 計 | 平均値 |
---|---|---|---|---|---|---|---|
A1 | y11 | … | y1j | … | y1b | T1. | m1. |
: | : | : | : | : | : | : | : |
Ai | yi1 | … | yij | … | yib | Ti. | mi. |
: | : | : | : | : | : | : | : |
Aa | ya1 | … | yaj | … | yab | Ta. | ma. |
計 | T.1 | … | T.j | … | T.b | TT | − |
平均 | m.1 | … | m.j | … | m.b | − | mT |
データyijを二元配置分散分析の基本式に従って分解し、平方和と自由度と分散を求めると次のようになります。
これらの値を分散分析表にまとめると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A | SA | φA | VA | FA = VA/VR |
B | SB | φB | VB | FB = VB/VR |
残差 | SR | φR | VR | |
全体 | ST | φT |
表4.1.6のデータについて実際に計算してみましょう。
以上のように、二元配置分散分析で時期が2つの時は対応のあるt検定(ただし両側検定)と一致します。 対応のあるt検定よりも分散分析の方がきめの細かい分析が可能なので、対応のある2標本の平均値を両側検定で比較したい時は分散分析を用いた方が便利です。 第3章第3節の表3.3.1のデータに二元配置分散分析を適用すると、次のように確かに対応のあるt検定の結果と一致します。 (→3.3 2標本の計量値)
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
個人差 | 1005 | 9 | 111.667 | 3.073 |
時期 | 500 | 1 | 500 | 13.761 |
残差 | 327 | 9 | 36.333 | |
全体 | 1832 | 19 |