前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1-1 | 1-2 | 2-1 | 2-2 | 3 | 4 |
二元配置分散分析において、要因Aの水準と要因Bの水準が同じという条件でデータが繰り返し得られれば交互作用も残差から分離できます。 そしてその場合は同一水準条件で繰り返し得られたデータのバラツキが残差になります。 例えば薬物と食餌の影響を調べるために20匹のマウスを無作為に5匹ずつの4群に分け、群1には薬物も食餌も与えず、群2には食餌だけ与え、群3には薬物だけ与え、群4には薬物と食餌を与えて効果を測定した結果が表4.3.1のようになったとします。
要因B:食餌 | 平均値 | |||
---|---|---|---|---|
無 | 有 | |||
要因A:薬物 | 無 | 群1効果 | 群2効果 | 4.5 |
1 | 6 | |||
2 | 7 | |||
2 | 7 | |||
2 | 7 | |||
3 | 8 | |||
平均値=2 | 平均値=7 | |||
有 | 群3効果 | 群4効果 | 16 | |
10 | 17 | |||
11 | 18 | |||
12 | 20 | |||
13 | 22 | |||
14 | 23 | |||
平均値=12 | 平均値=20 | |||
平均値 | 7 | 13.5 | 10.25 |
この場合、薬物の有無が要因A、食餌の有無が要因Bであり、同一水準条件の5匹のマウスが繰り返しです。 このようなデータを解析するための手法を繰り返しのある二元配置分散分析といいます。 そしてこの手法と区別するために第1節で説明した二元配置法を繰り返しのない二元配置分散分析と呼ぶことがあります。
繰り返しのある二元配置分散分析ではデータyijkを次のように分解して考えます。
この基本式に従って表4.3.1のデータについて平方和と自由度と分散を計算し、分散分析表にまとめると次のようになります。 (注1)
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 661.25 | 1 | 661.25 | 264.5 |
要因B:食餌 | 211.25 | 1 | 211.25 | 84.5 |
AxB:薬物と食餌の交互作用 | 11.25 | 1 | 11.25 | 4.5 |
残差 | 40 | 16 | 2.5 | |
全体 | 923.75 | 19 |
それぞれの要因の帰無仮説と、有意水準5%の時の検定結果は次のようになります。
このように繰り返しのある二元配置分散分析では要因Aの検定と要因Bの検定、そして要因AとBの交互作用の検定を行うことができます。 この場合の交互作用の検定は効果に関して薬物と食餌の間に相乗効果または相殺効果があるかどうかの検定です。 例えば図4.3.2で横軸を食餌の有無とし、縦軸を効果とすると、薬物無−食餌有無のグラフと薬物有−食餌有無のグラフが平行かどうかを検討することによって効果に関する薬物と食餌の関係が相乗効果(正の交互作用)、相加効果(交互作用無)、相殺効果(負の交互作用)のどれであるかを判定することができます。
図4.3.2を一般化してA1のB1−B2およびA2のB1−B2の平均値のグラフと、3種類の検定結果との関係を模式的に表すと次のようになります。
この模式図から要因Aの検定はA1とA2のグラフの高さを比較したものに相当し、要因Bの検定はA1とA2を合わせた時のB1→B2のグラフの変動の有無を検定したものに相当することがわかると思います。 そして交互作用の検定はA1におけるB1→B2という変動パターンと、A2におけるB1→B2という変動パターンを比較したものに相当することもわかると思います。 簡単にいえば図4.3.3の上段のグラフのように2本のグラフが並行なら交互作用なし、下段のグラフのように非平行なら交互作用ありということです。 そのため要因Aの検定のことをレベルの検定、交互作用の検定のことをパターンの検定と呼ぶことがあります。
またこの模式図から交互作用がある時は要因Aと要因Bの検定結果は不正確になることがわかると思います。 例えば図4.3.3の下段の左端のグラフでは、要因Aの検定結果も要因Bの検定結果も有意ではありません。 しかしB1ではA1の方がA2よりも高く、B2では反対にA2の方がA1よりも高くなっています。 またA1ではB1の方がB2よりも高く、A2では反対にB2の方がB1よりも高くなっています。 つまり交互作用がある時はA1とA2の比較とB1とB2の比較は不正確になり、どちらも交互作用相手の要因の状態を考慮に入れないと正しい比較はできないということです。
そのため交互作用を残差から分離した二元配置分散分析は、交互作用があるかどうかを検討するためのものと割り切って考えた方が良いと思います。 そして交互作用がある時は要因Aと要因Bの検定結果は採用せず、交互作用の検定結果だけ採用します。 そしてB1におけるA1とA2の平均値の差と、B2におけるA1とA2の平均値の差を科学的に検討し、それぞれの平均値の差に科学的な意義があるかどうか、さらに2つの平均値の差の違いに科学的な意義があるかどうかを検討するのが合理的です。
その場合、要因Bの水準ごとに要因Aの効果を一元配置分散分析で検討する、つまり要因Bで層別解析をするという方法も考えられます。 ただし交互作用の検定結果が有意なら要因Aの効果は要因Bの水準ごとに異なっているといえるので、本来は二重に検定する必要はありません。 しかし何でもかんでも検定しなければ気がすまない有意症患者を納得させるためには、層別解析を行うのもひとつの対処法ではあるでしょう。
交互作用が小さい時(交互作用の分散比が1未満)は、交互作用を残差に含めた方が要因Aと要因Bの検定効率が高くなります。 そのため交互作用を残差に含めて繰り返しのない二元配置分散分析と同じ形式の分散分析を行います。 その分散分析では図4.3.3の上段のように2本のグラフが平行と仮定して分析を行います。 交互作用が小さいということは、お互いに交互作用相手の状態とは無関係に効果を検討することができるという意味だからです。 参考までに表4.3.2の分散分析表の交互作用を残差に含めると次のようになります。 このデータの場合、交互作用が大きいので要因Aと要因Bの検定効率が少し悪くなります。 (注2)
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 661.25 | 1 | 661.25 | 219.341 |
要因B:食餌 | 211.25 | 1 | 211.25 | 70.0732 |
残差 | 51.25 | 17 | 3.01471 | |
全体 | 923.75 | 19 |
人間を対象とした臨床試験では、多数の患者を無作為に2群に分けてそれぞれ別の薬剤を投与し、評価項目を多時期にわたって観察することによって薬効を比較することがよくあります。 この場合、薬剤を要因A、時期を要因Bと考えると繰り返しのある二元配置になります。 しかし薬剤を無視すると、このデザインは被験者を要因A、時期を要因Bとした繰り返しのない二元配置と考えることもできます。
例えば10名の患者を無作為に5名ずつの2群に分け、一方の群にはプラセボPを投与し、もう一方の群には実薬(薬効のある本物の薬剤)Aを投与して、投与前と投与2週後に収縮期血圧を測定した結果が表4.3.4のようになったとします。
群 | 患者ID | 収縮期血圧 | |||
---|---|---|---|---|---|
投与前 | 投与2週後 | 投与前後の平均値 | 投与前後の変化量 | ||
P剤投与群 | 1-1 | 130 | 129 | 129.5 | -1 |
1-2 | 130 | 110 | 120 | -20 | |
1-3 | 121 | 135 | 128 | 14 | |
1-4 | 138 | 125 | 131.5 | -13 | |
1-5 | 133 | 132 | 132.5 | -1 | |
平均値 | 130.4 | 126.2 | 128.3 | -4.2 | |
A剤投与群 | 2-1 | 116 | 108 | 112 | -8 |
2-2 | 128 | 100 | 114 | -28 | |
2-3 | 129 | 108 | 118.5 | -21 | |
2-4 | 137 | 114 | 125.5 | -23 | |
2-5 | 140 | 110 | 125 | -30 | |
平均値 | 130 | 108 | 119 | -22 | |
平均値 | 130.2 | 117.1 | 123.65 | -13.1 |
これを繰り返しのある二元配置と考えた時、同一薬剤投与群における同一時期の個人差が残差になります。 しかし人間は個人差が大きいので、個人差を残差から分離した方が効率が良くなります。 そこで繰り返しのある二元配置と繰り返しのない二元配置を組み合わせ、個人差を残差から分離しつつ、要因Aを群にするような特殊な手法が開発されています。 その手法を繰り返し測定型二元配置分散分析(two-way repeated measures analysis of variace、two-way RMANOVA)といいます。 この名称は、同じ被検者から多時期にわたって連続的に観測して得られたデータのことを繰り返し測定データまたは反復測定データと呼ぶことに由来します。
この場合、群と時期は評価対象が固定されていますが、被験者は評価対象が固定されていません。 つまり同じ試験を何度も行った時、群はいつもP剤投与群とA剤投与群であり、時期は投与前と投与2週後です。 しかし被験者は多くの高血圧症患者からたまたま選択された10名であり、同じ試験を何度も行った時、いつも同じ患者とは限りません。 そのため群と時期は定数扱いできますが、被験者は変数扱いする必要があります。
このように評価対象が固定されていて、定数扱いできるモデルのことを母数モデルまたは固定モデル(fixed model)といい、それによる変動を母数効果または固定効果(fixed effect)といいます。 それに対して評価対象が固定されておらず、変数扱いしなければならないモデルのことを変量モデル(random model)といい、それによる変動を変量効果(random effect)といいます。 さらに両者が混在するモデルのことを混合モデル(mixed model)といい、それによる変動を混合効果(mixed effect)といいます。 繰り返し測定型二元配置分散分析は群と時期を定数扱いし、被験者を変数扱いして、両者の効果を一度に分析する混合効果モデル(mixed effect model)の一種です。
繰り返し測定型二元配置分散分析ではデータyijkを次のように分解して考えます。
この基本式に従って表4.3.4のデータについて平方和と自由度と分散を計算し、分散分析表にまとめると次のようになります。 (注3)
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
要因A:群 | 432.45 | 1 | 432.45 | 6.89713 |
SR:被験者残差 | 501.6 | 8 | 62.7 | |
SUB:被験者 | 934.05 | 9 | 103.783 | 1.69997 |
要因B:時期 | 858.05 | 1 | 858.08 | 14.0549 |
A×B:群と時期の交互作用 | 396.05 | 1 | 396.05 | 6.48731 |
SRxB:被験者残差と時期の交互作用 | 488.4 | 8 | 61.05 | |
全体 | 2676.55 | 19 |
それぞれの要因の帰無仮説と、有意水準5%の時の検定結果は次のようになります。
表4.3.5の「SUB:被験者」より上は被験者を全変動とし、群を要因A、被験者残差を残差とした一元配置分散分析になっています。 そのため群の検定は対応のない検定になります。 「SUB:被験者」以下は被験者を要因A、時期を要因Bとした繰り返しのない二元配置分散分析になっています。 そして通常の残差である被検者と時期の交互作用から「A×B:群と時期の交互作用」を分離し、「SR×B:被検者残差と時期の交互作用」を残差にしています。 そのため被検者の検定と時期の検定は特殊な対応のある検定になり、群と時期の交互作用の検定も行うことができます。
「A×B:群と時期の交互作用」は群ごとの時期変動パターンの違い、つまりP群の平均値の時期変動パターンとA群の平均値の時期変動パターンの違いを表します。 そして「SR×B:被検者残差と時期の交互作用(残差)」は各群における被験者ごとの時期変動パターンの違い、つまり被験者ごとの時期変動パターンの群内バラツキを表します。 このデータは時期が投与前と投与2週後だけなので時期変動パターンは投与前後の変化量に相当します。 そのため2群の平均値の時期変動パターンの違いは投与前後の変化量平均値の差に相当し、被験者ごとの時期変動パターンの群内バラツキは変化量の群内バラツキに相当します。
実際、表4.3.4の投与前後の変化量をデータにして一元配置分散分析つまり2標本t検定を行うと、次のように交互作用の検定結果と一致します。
群と時期の交互作用が小さい時(交互作用の分散比が1未満)は、交互作用を残差に含めた方が検定の効率が高くなります。 表4.3.5の分散分析表の「A×B:群と時期の交互作用」を残差に含めると次のようになります。 このデータの場合、群と時期の交互作用が大きいので検定効率が悪くなります。 そしてこの分散分析表の被検者以下は被検者と時期の繰り返しのない二元配置分散分析そのものです。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
要因A:群 | 432.45 | 1 | 432.45 | 6.89713 |
SR:被験者残差 | 501.6 | 8 | 62.7 | |
SUB:被験者 | 934.05 | 9 | 103.783 | 1.05608 |
要因B:時期 | 858.05 | 1 | 858.08 | 8.73166 |
残差:被検者と時期の交互作用 | 884.45 | 9 | 98.27 | |
全体 | 2676.55 | 19 |
また被検者の違いが小さい時(被検者残差の平均平方和が残差の平均平方和よりも小さい)は、被検者残差を残差(被検者残差と時期の交互作用)に含めて――つまり被検者を繰り返しデータ扱いして――通常の繰り返しのある二元配置分散分析にすると群の検定以外の検定の効率が高くなります。 表4.3.5の分散分析表の被検者残差を残差に含めると次のようになります。 このデータの場合、被検者の違いが大きいので群の検定効率だけがわずかに高くなり、それ以外の検定効率はわずかに悪くなります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
要因A:群 | 432.45 | 1 | 432.45 | 6.98909 |
要因B:時期 | 858.05 | 1 | 858.08 | 13.8675 |
A×B:群と時期の交互作用 | 396.05 | 1 | 396.05 | 6.40081 |
残差 | 990 | 16 | 61.875 | |
全体 | 2676.55 | 19 |
このように二元配置分散分析は応用範囲の広い手法であり、動物実験から臨床試験まで色々な場面で用いることができます。 ただし二元配置分散分析を臨床試験に利用する時は注意しなければならない点があります。 それは分散分析は要因内の各水準はそれぞれ独立であり、お互いに関連性が無いことを前提にしている点です。
動物実験では要因内の各水準を独立にすることは比較的容易です。 しかし臨床試験では繰り返し測定データが多く、このようなデータは独立ではなくお互いに関連性があるのが普通です。 そのため厳密にいえば、繰り返し測定データに対して時期を要因Bにした二元配置分散分析や繰り返し測定型二元配置分散分析を適用するのは不適切です。
そこで繰り返し測定データの間に関連性があると仮定した反復測定分散分析(repeated ANOVA)や多変量分散分析(MANOVA)、そして繰り返し測定混合効果モデル(MMRM:Mixed effect Models for Repeated Measures)を利用した分散分析などが開発されています。 しかしこれらの手法は数学的なモデルが複雑なので複雑な仮定を必要とし、解析に用いる評価指標も非常に複雑なので解析結果を医学的に解釈するのは極めて難しくなります。 いくら数学的に厳密な手法でも、解析結果を医学的に解釈できなければ意味がありません。 (→18.4 多変量分散分析、12.9 時系列共分散分析 (注4))
表4.3.4の試験は収縮期血圧に対するプラセボと実薬の効果を比較することが目的です。 そして投与前後の変化量平均値を薬効の評価指標にすると、表4.3.5の群と時期の交互作用の検定が主目的になります。 しかし普通はわざわざ繰り返し測定型二元配置分散分析などは行わず、投与前後の変化量をデータにして2標本t検定つまり対応のないt検定を行います。 これは投与前後の変化量つまり差の平均値のさらに差を検定するのでサノサ(差の差)の検定または差分の差分分析(DID:Difference-in-differences design)と呼ばれることがあります。 (→3.3 2標本の計量値 (2) データに対応がない場合)
ただし投与前値が変化量に影響する時は、P群とA群の投与前値が異なっていると公平な比較ができません。 そこでP群の投与前平均値とA群の投与前平均値を比較し、それがほぼ同じであることを確認しておく必要があります。 これは投与前実測値に2標本t検定を適用して確認することができます。 これを初期値の比較といい、薬効を比較したい時は必須です。
また通常はP群とA群それぞれの効果の大きさを検討するために、投与前後の変化量平均値に関する検定と推定を行います。 これは群ごとに投与前後の実測値に対応のあるt検定を適用して行います。 これを群内比較といい、薬効を比較したい時にはよく行います。 この群内比較に対して初期値の比較と変化量平均値の比較を群間比較といい、これらの群内比較と群間比較によって薬効を比較するのが普通です。 表4.3.4のデータについて群内比較と群間比較を行うと次のようになります。
群ごとの群内比較の結果を見ると、P群の検定結果は有意ではなくA群の検定結果は有意です。 ただしこの結果だけから「プラセボは薬効が無かったが、実薬は薬効があった!」と即断することはできないので注意してください。 何故ならプラセボと実薬の薬効を比較する時は収縮期血圧がどの程度変化したら医学的に意義のある変化と考えられるかを考慮して、群内比較と群間比較の検定結果と推定結果を総合的に検討する必要があるからです。 その検討方法については第3章を参照してください。 (→3.3 2標本の計量値)
初期値の比較の結果、2群の初期値が異なっていると考えられる時があります。 そのような時は共分散分析(ANCOVA:analysis of covariance、アンコバ)を用いて、初期値の違いを補正して2群の変化量を比較することがあります。 共分散分析は便利で応用範囲の広い手法ですが、この場合はあくまでも後知恵だということに注意する必要があります。 初期値が異なっているということは、患者がほぼ均等な2群に分けられたのではなく何らかの偏りがあると考えられます。 そのため測定されていない潜在因子――例えば遺伝子等――が2群で偏っている可能性があります。 そのような時はいくら共分散分析を用いても潜在因子の補正をすることはできません。 (→第8章 共分散分析)
投与前後の変化量平均値ではなく投与後の実測値平均値を薬効の評価指標にした時は、変化量平均値の比較の代わりに投与2週後の実測値平均値の比較を行います。 ただしその場合、変化量平均値は薬効の評価指標にならないのでP群とA群の群内比較は無意味になります。 そして投与2週後の実測値平均値そのものを群ごとの薬効の指標にし、それが例えば正常域に入っているかどうかを検討することによって群ごとの薬効を検討します。 これは薬効の検討方法としてはあまり合理的とはいえないので、通常は投与前後の変化量平均値を薬効の評価指標にします。 参考までに、表4.3.4の投与2週後のデータについて群間比較を行うと次のようになります。
時期が3つ以上の時、つまり薬剤投与後の時期が2つ以上ある時に薬剤の効果を比較するのは少々複雑です。 例えば表4.3.4の試験で投与1週後にも収縮期血圧を測定していて、その結果が表4.3.8のようになっていたとします。
群 | 患者ID | 収縮期血圧 | |||||
---|---|---|---|---|---|---|---|
投与前 | 投与1週後 | 投与2週後 | 投与1週後の変化量 | 投与2週後の変化量 | 変化量の平均値 | ||
P剤投与群 | 1-1 | 130 | 115 | 129 | -15 | -1 | -8 |
1-2 | 130 | 110 | 110 | -20 | -20 | -20 | |
1-3 | 121 | 129 | 135 | 8 | 14 | 11 | |
1-4 | 138 | 130 | 125 | -8 | -13 | -10.5 | |
1-5 | 133 | 132 | 132 | -1 | -1 | -1 | |
平均値 | 130.4 | 123.2 | 126.2 | -7.2 | -4.2 | -5.7 | |
A剤投与群 | 2-1 | 116 | 106 | 108 | -10 | -8 | -9 |
2-2 | 128 | 102 | 100 | -26 | -28 | -27 | |
2-3 | 129 | 108 | 108 | -21 | -21 | -21 | |
2-4 | 137 | 118 | 114 | -19 | -23 | -21 | |
2-5 | 140 | 116 | 110 | -24 | -30 | -27 | |
平均値 | 130 | 110 | 108 | -20 | -22 | -21 | |
平均値 | 130.2 | 116.6 | 117.1 | -13.6 | -13.1 | -13.35 |
時期が3つ以上になると、繰り返し測定型二元配置分散分析の群と時期の交互作用は変化量ではなくなります。 例えば図4.3.5の(2)の場合、P剤投与群における投与1週後の変化量と投与2週後の変化量を平均した値はほぼ0になり、A剤投与群における投与1週後の変化量と投与2週後の変化量を平均した値もほぼ0になります。 そのため2群の平均的な変化量はほぼ同じと評価するはずです。 ところがこの場合も「群ごとの時期変動パターンは異なる」つまり「群と時期の交互作用有り」になります。
また図4.3.5の(3)の場合、時期変動パターンの違いに初期値の違いも含まれて、やはり「交互作用有り」になってしまいます。 初期値は薬剤が投与される前の値であり、薬効を反映する値ではなく背景因子のひとつです。 そのため初期値の違いも含まれた時期変動パターンを評価指標にしてはいけません。 時期が2つの時は交互作用の検定が変化量の検定になるので、時期が3つ以上の時も交互作用の検定を変化量の検定と誤解してしまうことがあるので注意が必要です。
表4.3.8のデータにおいて、投与1週後も投与2週後も評価時点だとします。 すると初期値の比較は表4.3.4と同じですが、群ごとの群内比較は対応のあるt検定の代わりに被検者と時期に関する繰り返しのない二元配置分散分析を適用するか、投与前と投与1週後、投与前と投与2週後の変化量平均値の検定としてダネット型多重比較を適用します。 そして変化量平均値の群間比較は、サノサの検定の代わりに投与1週後の変化量と投与2週後の変化量をデータにして繰り返し測定型二元配置分散分析を適用します。 表4.3.8の変化量のデータに繰り返し測定型二元配置分散分析を適用すると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
要因A:群 | 1170.45 | 1 | 1170.45 | 6.24407 |
SR:被験者残差 | 1499.6 | 8 | 187.45 | |
SUB:被験者 | 2670.05 | 9 | 296.672 | 18.8363 |
要因B:時期 | 1.25 | 1 | 1.25 | 0.0793651 |
A×B:群と時期の交互作用 | 31.25 | 1 | 31.25 | 1.98413 |
SRxB:被験者残差と時期の交互作用 | 126 | 8 | 15.75 | |
全体 | 2828.55 | 19 |
この場合の要因Aの検定はP群における2つの時期を合わせた平均変化量平均値-5.7と、A群における2つの時期を合わせた平均変化量平均値-21が異なっているかどうかの検定、つまり平均変化量平均値に関するレベルの検定になります。 そして要因Bの検定は投与1週後における2群の変化量平均値-13.6と、投与2週後における2群の変化量平均値-13.1が異なっているかどうかの検定になります。
また群と時期の交互作用の検定はP群における投与1週後の変化量平均値と投与2週後の変化量平均値の差(-4.2) - (-7.2) = 3と、A群における投与1週後の変化量平均値と投与2週後の変化量平均値の差(-22) - (-20) = -2が異なっているかどうかの検定つまり変化量平均値に関するパターンの検定になります。 この検定結果は有意水準5%で有意ではありません。 そのため2群の変化量平均値の時期変動パターンは似ていてると考えられます。
したがって要因Aの検定結果と要因Bの検定結果は正確であり、変化量平均値は投与1週後も2週後もあまり変わらず、全体としてP群よりもA群の方が15.3ほどより低下していると解釈できます。 つまり群ごとに変化量平均値の時期変動グラフを描くと、それは図4.3.3の上段の左から2番目のようなグラフになるわけです。 そして15.3という低下量に医学的な意義があれば全体としてプラセボよりも実薬の方が薬効が大きい、つまり実薬には降圧効果があると結論できます。
群と時期の交互作用が大きい時は変化量平均値の時期変動パターンがP群とA群で異なっている、つまり薬効の発現時期がプラセボと実薬で異なっていると解釈できます。 その場合、要因Aの検定結果と要因Bの検定結果は不正確になります。 そのため投与1週後と投与2週後の2時点で、P群とA群の変化量平均値を群間比較する必要があります。
その際、どちらか1時点でも変化量平均値に違いがあれば、それを採用して「薬効に違いがある」という”いいとこ取りの評価”をする時は評価時点ごとの検定に多重性の調整が必要になります。 それに対して2時点をそれぞれ独立に評価するなら多重性の調整は必要ありません。 しかし薬効比較の場合は複数時点の結果を総合して薬効を評価することが多いので、多重性の調整をしておいた方が無難でしょう。
参考までに表4.3.8の投与1週後の2群の変化量平均値と、投与2週後の2群の変化量平均値をそれぞれ群間比較すると次のようになります。 要因Aの検定結果つまり投与1週後と2週後を合わせた時の平均変化量平均値を2群間で比較した検定結果は有意水準5%で有意ですが、時点ごとに変化量平均値を群間比較するとどちらも有意ではありません。 これは時点ごとに群間比較して、その結果を総合的に評価する方がより詳細な比較であり、より高い信頼性が必要だからです。
この場合、2群の初期値が異なっている時は繰り返し測定共分散分析(repeated measures analysis of covariance)を用いて、初期値の補正をして複数時点の変化量を比較することができます。 ただしこの手法も通常の共分散分析と同様に後知恵であり、潜在因子の補正をすることはできないので注意が必要です。 (→12.9 時系列共分散分析)
このように評価時点が複数ある時は、時点ごとの変化量に繰り返しのある二元配置分散分析と多重比較を適用することによって薬効を詳細かつ総合的に比較することができます。 しかしこれらの手法を適用するのは面倒であり、結果の解釈も解釈も複雑なので、できれば評価時点を1つにして単純な解析手法を適用できるような試験デザインにするのが賢明です。
薬効を比較する試験では同じ被検者に時期を変えて2種類の薬剤を投与し、被検者内で2種類の薬剤の効果を比較することがたまにあります。 例えば表4.3.4のデータが5名の患者に時期を変えてプラセボPと実薬Aを投与し、投与前と投与2週後に収縮期血圧を測定したものだとします。 すると表4.3.4は次のような表になります。
患者ID | 収縮期血圧 | |||||
---|---|---|---|---|---|---|
P薬投与期間 | A薬投与期間 | |||||
投与前 | 投与2週後 | 投与前後の変化量 | 投与前 | 投与2週後 | 投与前後の変化量 | |
1 | 130 | 129 | -1 | 116 | 108 | -8 |
2 | 130 | 110 | -20 | 128 | 100 | -28 |
3 | 121 | 135 | 14 | 129 | 108 | -21 |
4 | 138 | 125 | -13 | 137 | 114 | -23 |
5 | 133 | 132 | -1 | 140 | 110 | -30 |
平均値 | 130.4 | 126.2 | -4.2 | 130 | 108 | -22 |
このデータは被検者を要因A、薬剤の種類を要因B、投与時期を要因Cとした三元配置デザインになるので、繰り返しのない三元配置分散分析を適用することができます。 しかし三元配置分散分析は要因A、要因B、要因Cに加えて、AとBの交互作用、AとCの交互作用、BとCの交互作用、さらにAとBとCの交互作用まで分析する非常に複雑な手法です。 そのためまともに三元配置分散分析を適用せず、重要度の低い要因を潰して二元配置デザインにして解析するのが普通です。
例えば変化量平均値を薬効の評価指標とする時は、表4.3.10のように投与前後の変化量を求めることによって投与時期を潰し、変化量に関する被検者と薬剤の種類の二元配置デザインにして解析します。 この場合は薬剤が2種類だけなので、変化量に対応のあるt検定を適用した方が簡単です。 でも後の説明のために繰り返しのない二元配置分散分析を適用すると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:被検者 | 629.4 | 4 | 157.35 | 1.81174 |
要因B:薬剤 | 792.1 | 1 | 792.1 | 9.12032 |
残差 | 347.4 | 4 | 86.85 | |
全体 | 1768.9 | 9 |
比較のために、表4.3.10の実測値に繰り返しのない三元配置分散分析を適用すると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:被検者 | 409.3 | 4 | 102.325 | 2.35636 |
要因B:薬剤 | 432.45 | 1 | 432.45 | 9.95855 |
要因C:時期 | 858.05 | 1 | 858.05 | 19.7594 |
AxB:被検者と薬剤の交互作用 | 92.3 | 4 | 23.075 | 0.531376 |
AxC:被検者と時期の交互作用 | 314.7 | 4 | 78.675 | 1.81174 |
BxC:薬剤と時期の交互作用 | 396.05 | 1 | 396.05 | 9.12032 |
AxBxC:残差 | 173.7 | 4 | 43.425 | |
全体 | 2676.55 | 19 |
表4.3.11-aと表4.3.12を比べると、表4.3.11-aの「要因A:被検者」の検定結果と表4.3.12の「AxC:被検者と時期の交互作用」の検定結果が一致し、表4.3.11-aの「要因B:薬剤」の検定結果と表4.3.12の「BxC:薬剤と時期の交互作用」の検定結果が一致していることがわかります。 表4.3.11-aは時期の変化量つまり実測値の時期変動パターンをデータにしているので「要因A:被検者」は実測値における被検者と時期の交互作用に相当し、「要因B:薬剤」は実測値における薬剤と時期の交互作用に相当するからです。
また表4.3.11-aは変化量をデータにしているので、総平均値はP薬投与期間の変化量とA薬投与期間の変化量を合わせた変化量平均値になります。 そしてその変化量平均値は2種類の薬剤投与期間を合わせて収縮期血圧がどの程度変化したか、つまり投与時期によってデータが変化したかどうかの指標になります。 そこで通常の分散分析では分散分析表に入れない総平均値の要因を入れた特殊な分散分析表を作成し、要因の内容を表4.3.12に対応させたものにすると次のようになります。 この分散分析表の「要因C:時期(総平均値)」が表4.3.12の「要因C:時期」に相当するので両者の分散比が一致している、つまり検定結果が一致することがわかると思います。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
C:時期(総平均値) | 1716.1 | 1 | 1716.1 | 19.7594 |
AxC:被検者と時期の交互作用 | 629.4 | 4 | 157.35 | 1.81174 |
BxC:薬剤と時期の交互作用 | 792.1 | 1 | 792.1 | 9.12032 |
残差 | 347.4 | 4 | 86.85 | |
全体 | 3485 | 10 |
このようなデータで表4.3.8のように評価時点が2つ以上になると、投与前後の変化量をデータにしても対応のある三元配置になります。 その場合、三元配置分散分析の代わりに評価時点ごとに変化量をデータにして表4.3.11-bのような二元配置分散分析を行い、多重性の調整をした検定をする方法が考えられます。 しかしこの方法は計算が煩雑で、しかも結果の解釈が複雑になります。
そこでそのような場合は複数の評価時点の実測値を1つに要約し、それを評価指標にすると便利です。 例えば複数の評価時点の実測値の平均値(レベル)を評価指標にしたり、最大値と最小値の差(パータン)を評価指標にすることが考えられます。 そうすると時期が潰れて要因がひとつ減り、二元配置になって計算と結果の解釈が簡単になります。
ただし厳密にいえば、このような試験デザインは時期によって薬剤の影響は変わらないことと、最初に投与した薬剤1の影響が後で投与する薬剤2の結果に影響を与えない──つまり薬剤1の持ち越し効果が無いことが前提になっています。 しかし実際には時期によって薬剤の影響が変わることは大いに有り得ますし、薬剤の持ち越し効果も有り得ます。 したがってこのような試験デザインは不適切であり、本来は表4.3.8のような並行群間比較試験デザインにするべきです。 (→14.5 生物学的同等性試験)
ここで繰り返し測定データの評価方法についてまとめておきましょう。 繰り返し測定データの評価方法と薬効評価の時の繰り返し測定データの模式図は次のようになります。
表4.3.8のようなデータについて、投与後の全ての観測時点を評価時点にして時間変動を検討したい時の評価方法です。 探索型研究ではデータの時間変動を検討し、薬効が安定しない過渡期と安定した安定期の目安をつけるためにこの評価方法を用いることがよくあります。 ただし探索型研究では仮説を設定しない(設定できない)ので検定は必要ありません。 この評価方法では図4.3.6-(i)のA、B、Cはそれぞれ別々の評価になります。
薬剤の効果はすぐには発現せず、図4.3.7のように普通はある程度の時間がかかります。 そのため複数の時点でデータを測定するものの、過渡期は経過観察だけを目的にし、安定期の最終時点だけを評価時点にする評価方法です。 薬効評価の場合はこれが最も合理的な評価方法です。 この評価方法では図4.3.6-(ii)のA、B、Cは全て同じ評価になります。
薬効が発現していても、体調などの影響でデータが変動することは大いに考えられます。 そこで薬効を正確に評価するために投与後の全時点のデータを平均し、その平均変化量平均値を評価指標にする評価方法です。 ただし薬効評価の場合は安定期だけを評価時点にするのが普通です。 この評価方法では図4.3.6-(iii)のA、B、Cはそれぞれ別々の評価になります。
例えば血圧の日内変動のようにデータの時間的変動に周期性がある時は、それを三角関数で近似します。 そして三角関数のパラメーターであるメサーと周期と振幅を評価指標にします。 適当な関数が不明な時はとりあえず1次関数つまり直線で近似し、その傾きを評価指標にします。 時系列回帰分析や時系列共分散分析や繰り返し測定混合効果モデルを利用した分散分析はこの原理を応用した手法であり、広義の時系列解析の一種です。 これは過渡期だけを評価したい時に適していますが、過渡期だけの評価では医学的な意義は少ないでしょう。 この評価方法では図4.3.6-(iv)のA、B、Cはほぼ同じ評価になります。
繰り返し測定データは時系列データの一種ですから、時間的な変動を検討したい時は時系列解析を適用することが考えられます。 しかし臨床試験で繰り返し測定データを扱う時は、たいていデータの時間的な変動を検討するよりも薬効を評価するのが主目的です。 つまり図4.3.7の過渡期のデータよりも安定期のデータを重視します。 そのため無闇に時系列解析を適用するよりも、(ii)や(iii)のような単純な評価方法にして簡単な統計手法を適用するのが実際的です。 (→第12章 時系列解析)
臨床試験では色々な理由で途中脱落例が発生し、脱落後の繰り返し測定データが欠測値(missing data、欠損値)になります。 また脱落しなくても、何らかの理由で欠測値が生じることがあります。 そのため現実の臨床試験では欠測値の取り扱いがしばしば問題になります。 統計学では欠測値を次のように分類することがあります。 そしてMCAとMARは色々な方法で他のデータから補完(imputation)することができるのに対して、MNARは他のデータから補完できないとされています。
欠測値があると非釣り合い型データ(unbalanced data)になり、被験者または群と時期の間に関連性が生じます。 そのため繰り返し測定型二元配置分散分析の代わりに、時期をダミー変数で表して共変数扱いした繰り返し測定共分散分析を適用する必要があります。 繰り返し測定共分散分析では欠測値を考慮した修正平均値(最小二乗平均値)を求め、それを用いて結果を評価します。 ただし修正平均値が正当性を持つのは欠測値がMCAまたはMARの時だけです。 (注2) (→8.5 共分散分析と二元配置分散分析、→12.9 時系列共分散分析)
またや時系列回帰分析や時系列共分散分析や繰り返し測定混合効果モデルを利用した分散分析等の時系列解析は、データの時期変動を適当な関数で近似して分析します。 その場合、測定時点は絶対的なものではなく、被験者によって測定時点が違ってもかまいません。 そのため途中にMCAまたはMARの欠測値があっても解析できる(MNARの欠測値も解析可能だが結果の信頼性が低い)ので、これらの手法を欠測値がある時の解析手法として流用することがあります。 (→12.9 時系列共分散分析 (注4))
さらに原理的にはそれらの手法と同じですが、何らかの方法で欠測値を補完する方法もあります。 単純な方法としては、繰り返し測定型二元配置分散分析において欠測値を周囲のデータから推測して補完し、自由度を増やさずに解析する方法や、回帰分析を利用して欠測値を推測値で補完し、その補完値を用いた回帰分析を繰り返すことによって補完値を修正していく繰り返し補完法があります。 また観測データに基づいて欠測値の事後分布を構築し、その事後分布から無作為抽出を行って欠測値を補完した複数のデータセットを作成し、それらを用いた複数の解析結果を補完の不確実性を考慮しながら統合して検討する多重補完法(multiple imputation method)も開発されています。
しかし薬効評価では測定時点は評価時点という意味合いが強く、全ての被験者で同一の方が合理的です。 例えば過渡期と安定期がはっきりしている薬剤または疾患では、評価時点を明確に規定し、それに合わせて測定時点を設定する必要があります。 そして図4.3.7のように過渡期と安定期がはっきりしている時、時系列解析は全体の時期変動を評価するには適していません。
例えば図4.3.8の1週までが過渡期で、それ以後が安定期とします。 すると1週までの過渡期に欠測値があっても、時期変動の様子はあまり変わりません。 しかし2週後に欠測値があると、黒色の実線のように時期変動の様子が変わってしまいます。 つまり過渡期だけの解析や安定期だけの解析は何とか可能ですが、過渡期と安定期を合わせた解析は不可能なのです。 そして安定期は値があまり変動しないので単に平均値を求めるだけで評価可能であり、わざわざ時系列解析を適用する意義は薄くなります。
欠測値にはMCAやMARやMNAR以外の問題もあります。 例えば図4.3.8のように1週後までは脱落例がなく、その後に脱落例が発生して2週後のデータに欠測値が生じたとします。 この場合、全てのデータについて平均値を求めると黒色の実線のように1週後の平均値はある程度低下し、2週後の平均値はさらに低下したように見えてしまいます。 しかし脱落しない症例は青色の折れ線で描いたように1週後から2週後は変化しておらず、2週後の平均値が低下したのは欠測値が発生したためです。
このように欠測値のある症例を含めて解析すると、平均値の変動が時間によるものか被験者の違いによるものか区別できません。 そのため時期変動を正確に評価したい時は欠測値のある被験者を解析から除外するのが無難です。 また被験者が過渡期で脱落すると安定期のデータが得られず、薬効を正確に評価することはできません。 したがって薬効評価の場合、原則として過渡期で脱落した被験者は解析から除外するのが無難です。
安定期に入ってから脱落した場合、最終観測データの値がほぼそのまま持続すると判断して良い時があります。 その場合は最終観測データによって以後のデータを補完するLOCF(Last Observation Carried Forward、引き延ばし)という処理をし、その値を解析に用いる時があります。 例えば図4.3.8で1週以後は安定期と考えて脱落例についてLOCF処理をし、2週後のデータを1週後のデータで補完します。 すると黒色の破線のように全体の平均値は1週後と2週後が同じ値になり、データの変動をうまく反映します。
臨床試験における脱落例はランダムに発生するのではなく、たいていは試験と関連性のある何らかの原因で発生します。 そのため試験目的から考えて脱落例を解析に含めるべきか含めないべきかという、欠測値の種類以前のことが大きな問題になります。 したがって外れ値と同じように脱落例を除外して解析した(Complete case解析)結果と脱落例を含めて解析した(Available data解析)結果、さらに必要に応じてLOCF処理をして解析した(LOCF解析)結果を比較し、総合的に検討する感度分析(sensitivity analysis)を行うのが常套手段です。
ただし欠測値が全体の10%未満なら、どのような取り扱いをしてもその影響は無視できる程度です。 そのため欠測値の取り扱い方法にこだわる必要はあまりありません。 そして欠測値が20%以上ある時は試験計画に何らかの欠陥があり、そのせいで欠測値が生じやすくなっている可能性があります。 そのため欠測値の取り扱い方法を検討する以前に、試験計画の欠陥を検討する必要があります。 したがってやはり欠測値の取り扱い方法にこだわる必要はあまりありません。
ということは欠測値が全体の10〜20%の時だけその処理方法に注意する必要があるということになります。 そして欠測値の取り扱い方法によって結果があまり変わらなようなら、その試験はかろうじて成功と解釈します。 しかし欠測値の取り扱い方法によって結果が変わる場合は信頼性の低い試験結果と解釈し、再試験や追加試験を行って正確な結果を得る必要があります。 つまり感度分析を行うのは正しい結果を得るためではなく再試験や追加試験が必要がどうかを検討するためなのです。
試験の目的が整理されていないと、えてして試験デザインや評価指標が複雑になり、欠測値が生じやすくなります。 そうすると適用する統計手法が複雑になり、結果の解釈も複雑になります。 研究目的を整理して1つの試験は目的を1つにしぼり、評価指標も1つにして欠測値が生じにくくし、できるだけ単純な試験デザインと評価方法にするのが賢明です。
対応のある繰り返し測定型データが得られる試験デザインのひとつにクロスオーバーデザイン(cross-over design)があり、このデザインを用いた試験をクロスオーバー試験(cross-over trial)といいます。 クロスオーバーデザインは例数が半分で済むので、以前はよく用いられました。 しかしこのデザインは医学分野の試験には原理的に向いていないことが知られてきたため、あまり用いられなくなりました。
現在、クロスオーバーデザインが用いられるのはほとんど生物学的同等性試験(Bioequivalence Study、BE試験、生同試験)だけです。 そのためこれについては第14章・第5節を参照してください。 (→14.5 生物学的同等性試験)
要因A | B1 | … | Bj | … | Bb | 計 | 平均値 |
---|---|---|---|---|---|---|---|
A1 | y111 | … | y1j1 | … | y1b1 | T1.1 | m1.1 |
: | : | : | : | : | : | : | |
y11k | … | y1jk | … | y1bk | T1.k | m1.k | |
: | : | : | : | : | : | : | |
y11r1 | … | y1jr1 | … | y1br1 | T1.r1 | m1.r1 | |
A1内計 | T11. | … | T1j. | … | T1b. | T1.. | − |
A1内平均 | m11. | … | m1j. | … | m1b. | − | m1.. |
: | : | : | : | : | : | : | : |
Ai | yi11 | … | yij1 | … | yib1 | Ti.1 | mi.1 |
: | : | : | : | : | : | : | |
yi1k | … | yijk | … | yibk | Ti.k | mi.k | |
: | : | : | : | : | : | : | |
yi1ri | … | yijri | … | yibri | Ti.ri | mi.ri | |
Ai内計 | Ti1. | … | Tij. | … | Tib. | Ti.. | − |
Ai内平均 | mi1. | … | mij. | … | mib. | − | mi.. |
: | : | : | : | : | : | : | : |
Aa | ya11 | … | yaj1 | … | yab1 | Ta.1 | ma.1 |
: | : | : | : | : | : | : | |
ya1k | … | yajk | … | yabk | Ta.k | ma.k | |
: | : | : | : | : | : | : | |
ya1ra | … | yajra | … | yabra | Ta.ra | ma.ra | |
Aa内計 | Ta1. | … | Taj. | … | Tab. | Ta.. | − |
Aa内平均 | ma1. | … | maj. | … | mab. | − | ma.. |
計 | T.1. | … | T.j. | … | T.b. | TT | − |
平均 | m.1. | … | m.j. | … | m.b. | − | mT |
データyijkを繰り返しのある二元配置分散分析の基本式に従って分解し、平方和と自由度と分散を求めて分散分析表にまとめると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A | SA | φA | VA | FA=VA/VR |
B | SB | φB | VB | FB=VB/VR |
A×B | SAxB | φAxB | VAxB | FAxB=VAxB/VR |
残差 | SR | φR | VR | |
全体 | ST | φT |
SABは要因Aの第i水準と要因Bの第j水準におけるri個のデータを、それらの平均値mij.ただ1つで代表させた時の全変動であり、級間平方和と呼ばれています。 繰り返し数が1の時つまり繰り返しのない二元配置分散分析では、級間平方和は全変動の平方和になります。
交互作用の多重比較はシェッフェ型一般対比の考え方を応用して次のようになります。 (→4.1 多標本の計量値 (注4))
交互作用が小さくてFAxBが1より小さい時は、交互作用を残差に含めて繰り返しのない二元配置分散分析にした方が誤差が小さくなり効率が良くなります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A | SA | φA | VA | FA = VA/VR' |
B | SB | φB | VB | FB = VB/VR' |
残差 | SR'=SAxB+SR | φR' = φAxB+φR | VR' | |
全体 | ST | φT |
表4.3.1のデータについて実際に計算してみましょう。
要因B:食餌 | 平均値 | |||
---|---|---|---|---|
無 | 有 | |||
要因A:薬物 | 無 | 群1効果 | 群2効果 | 4.78 |
1 | 6 | |||
2 | 7 | |||
- | 7 | |||
2 | 7 | |||
3 | 8 | |||
平均値=2 | 平均値=7 | |||
有 | 群3効果 | 群4効果 | 16 | |
10 | 17 | |||
11 | 18 | |||
12 | 20 | |||
13 | 22 | |||
14 | 23 | |||
平均値=12 | 平均値=20 | |||
平均値 | 7.56 | 13.5 | 10.68 |
表4.3.1のようなデータを釣り合い型データ(balanced data)と呼ぶのに対して、このようなデータを非釣り合い型データ(unbalanced data)と呼びます。 このデータについて、(注1)の計算式を用いて平方和を計算すると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 596.55 | 1 | 596.55 | 223.706 |
要因B:食餌 | 167.383 | 1 | 167.383 | 62.7686 |
AxB:薬物と食餌の交互作用 | 48.172 | 1 | 48.172 | 18.0645 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 19 |
以上のように、2通りの方法で計算したSAxBの平方和は一致しません。 (注1)で説明した平方和の計算式は要因Aと要因Bが独立で平方和の間に相加性があることを前提にした式だからです。 そのためこのような時は表4.3.17の関連性を無視した分散分析表は不適切であり、分散分析ではなく重回帰分析を適用する必要があります。 重回帰分析の章で詳しく説明しますが、この場合は次のような重回帰モデルを当てはめて計算します。 (→7.1 重回帰モデル (注2))
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
回帰 | 812.105 | 3 | 270.702 | 101.513 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 18 |
偏回帰平方和は他の変数を全て重回帰モデルに入れた上で各変数を追加した時の回帰平方和の増加分=全ての変数を重回帰モデルに入れた上で各変数を除外した時の残差平方和の減少分を表し、偏回帰係数の検定と区間推定に利用される値です。 この場合は変数間に関連性があるのでこれらの偏回帰平方和には相加性が成り立たず、合計が重回帰式全体の回帰平方和と一致しません。
ところがこれらの偏回帰平方和を利用して、強引に分散分析表を作成してしまおうという乱暴な考え方があります。 統計ソフトSASやSPSSはこの考え方に従って、これらの偏回帰平方和をタイプIII平方和(Type III SS)と呼んで分散分析表を強引に作成します。 ただしタイプIII平方和を求める場合は、次のように「無=-1 有=1」という値を取るダミー変数を用いた重回帰モデルを当てはめます。 これはダミー変数の中心を0にし、本来の分散分析の結果に強引に近づけるためです。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
回帰 | 812.105 | 3 | 270.702 | 101.513 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 18 |
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 622.353 | 1 | 622.353 | 233.382 |
要因B:食餌 | 198.824 | 1 | 198.824 | 74.5588 |
AxB:薬物と食餌の交互作用 | 10.5882 | 1 | 10.5882 | 3.97059 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 19 |
この結果とダミー変数を「無=0 有=1」で表した通常の重回帰分析結果を比較すると、b1とb2の偏回帰平方和が大きくなり、b3の偏回帰平方和は変わらないことがわかります。 これは薬物効果と食餌効果の計算方法からわかるように、b1とb2に交互作用の影響が含まれているからです。 このように交互作用を含めた重回帰モデルは交互作用だけ正確な結果が得られ、主効果の結果は不正確になります。
もちろんこれらの平方和には相加性が成り立たないので、4種類の平方和の合計が全体の平方和と一致せず、非合理な分散分析表になります。 そのためタイプIII平方和を用いた分散分析表は重回帰分析の結果を擬似的な分散分析表で表したものと解釈した方が良いでしょう。 ただしこの重回帰モデルはタイプIII平方和を強引に求めるための特殊なものであり、合理的な重回帰式を求めるには通常のダミー変数を用いた重回帰モデルの方が適しています。
これらの偏回帰平方和をタイプIII平方和と呼ぶ理由は、これとは別の方法で計算した偏回帰平方和を利用して強引に分散分析表を作成する方法が他に2通りあるからです。 そのひとつは主効果と交互作用を別々に計算する方法です。 通常の二元配置分散分析は主効果つまり要因Aと要因Bの平方和は交互作用を無視して計算し、交互作用の平方和は主効果の平方和を利用して計算します。 そこで、まず交互作用を含めない重回帰モデルによって主効果の偏回帰平方和を求め、次に交互作用を含めた重回帰モデルによって交互作用の偏回帰平方和を求め、それら2種類の重回帰モデルの偏回帰平方和を合成して分散分析表を作成するのです。
この時の偏回帰平方和をタイプII平方和(Type II SS)と呼び、表4.3.16のデータの場合は次のような分散分析表になります。 これらの平方和にも相加性が成り立たないので、4種類の平方和の合計が全体の平方和と一致せず、やはり非合理な分散分析表になります。 これは後述するように共分散分析の結果をシミュレートした分散分析表と解釈できます。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 634.134 | 1 | 634.134 | 237.8 |
要因B:食餌 | 204.967 | 1 | 204.967 | 76.8627 |
AxB:薬物と食餌の交互作用 | 10.5882 | 1 | 10.5882 | 3.97059 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 19 |
もうひとつは主効果と交互作用を順番に計算する方法です。 この方法ではまず要因Aだけを入れた重回帰モデルによって要因Aの偏回帰平方和を求め、次に要因Bを追加した重回帰モデルによって要因Bの偏回帰平方和を求め、最後に交互作用を追加した重回帰モデルによって交互作用の偏回帰平方和を求め、それら3種類の重回帰モデルの偏回帰平方和を合成して分散分析表を作成するのです。
この時の偏回帰平方和をタイプI平方和(Type I SS)と呼び、表4.3.16のデータの場合は次のような分散分析表になります。 これは平方和の間に一応の相加性が成り立っていて、本来の分散分析に近い分散分析表です。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 596.55 | 1 | 596.55 | 223.706 |
要因B:食餌 | 204.967 | 1 | 204.967 | 76.8627 |
AxB:薬物と食餌の交互作用 | 10.5882 | 1 | 10.5882 | 3.97059 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 19 |
ただしタイプI平方和は要因を重回帰モデルに追加する順番によって値が変わります。 例えば要因B→要因A→交互作用という順番で計算した時の分散分析表は次のようになります。 この分散分析表も一応の相加性が成り立っているものの、要因Aと要因Bの平方和の値は表4.3.21とは異なります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
要因A:薬物 | 634.134 | 1 | 634.134 | 237.8 |
要因B:食餌 | 167.383 | 1 | 167.383 | 62.7686 |
AxB:薬物と食餌の交互作用 | 10.5882 | 1 | 10.5882 | 3.97059 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 19 |
タイプIII平方和の特別な場合として欠測値を理論的推定値で補完し、強引にバランスを取った上で分散分析表を作成する方法があります、 その時の平方和はタイプIV平方和(Type IV SS)と呼ばれていますが、これはタイプIII平方和以上に強引で恣意的な方法ですから、めったに使われないようです。
本来、分散分析は要因同士が独立になるように計画された試験デザインから得られた、釣り合い型データを解析するために開発された手法です。 そのため表4.3.16のような非釣り合い型データに無理に分散分析を適用するのは非合理です。 それよりも変数間に関連性がある時の解析手法である重回帰分析か共分散分析を適用する方が合理的です。 表4.3.16の場合、薬物の有無を群扱いし、食餌の有無を共変数扱いして、共分散分析を適用することができます。 その結果は次のようになります。 (→8.5 共分散分析と二元配置分散分析)
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差(薬物) | 596.55 | 1 | 596.55 | 223.706 |
共通回帰(食餌) | 204.967 | 1 | 204.967 | 76.8627 |
修正群差(薬物) | 634.134 | 1 | 634.134 | 237.8 |
全体回帰(食餌) | 167.383 | 1 | 167.383 | 62.7686 |
非平行性(交互作用) | 10.5882 | 1 | 10.5882 | 3.97059 |
残差 | 40 | 15 | 2.66667 | |
全体 | 852.105 | 18 |
表4.3.17〜表4.3.22と表4.3.23を比較すると、それぞれの分散分析表の関係がわかると思います。 表4.3.23の「群差(薬物)」と「共通回帰(食餌)」は表4.3.21の「要因A:薬物」と「要因B:食餌」に一致し、要因A→要因Bの順番で計算したタイプI平方和に相当します。 そのため要因A:薬物の平方和は食餌の影響を無視した値になり、要因B:食餌の平方和は薬物の影響を補正した値になります。
そして表4.3.23の「修正群差(薬物)」と「全体回帰(食餌)」は表4.3.22の「要因A:薬物」と「要因B:食餌」に一致し、要因B→要因Aの順番で計算したタイプI平方和に相当します。 そのため要因A:薬物の平方和は食餌の影響を補正した値になり、要因B:食餌の平方和は薬物の影響を無視した値になります。
また表4.3.23の「修正群差(薬物)」と「共通回帰(食餌)」は表4.3.20の「要因A:薬物」と「要因B:食餌」に一致し、要因Aと要因Bを同時に入れて計算したタイプII平方和に相当します。 そのため要因A:薬物の平方和は食餌の影響を補正した値になり、要因B:食餌の平方和は薬物の影響を補正した値になります。
表4.3.23には表4.3.19の「要因A:薬物」または「要因B:食餌」の平方和と一致するものはありません。 タイプIII平方和は主効果と交互作用を同時に入れて計算した平方和なので、特殊な重回帰モデルを使用した重回帰分析の偏回帰平方和と一致するからです。
それから表4.3.23の「非平行性(交互作用)」と「残差」は、表4.3.19〜表4.3.22の「AxB:薬物と食餌の交互作用」と「残差」に一致します。 このことから、これらの解析手法は交互作用の検定だけが正確であり、主効果の検定結果は不正確になるので交互作用があるかどうかを検討するためのものと割り切って考えた方が良いことがわかります。
そして交互作用がなければ、交互作用を残差に含めた分散分析表を作成して再検定します。 交互作用がないということはお互いに相手の状態とは無関係に効果を検討することができるという意味なので、交互作用をモデルに入れる必要はないわけです。 この場合、タイプII平方和とタイプIII平方和は一致し、それは非平行性を残差にプールした共分散分析の結果とも一致します。 タイプII平方和とタイプIII平方和の違いは交互作用の処理方法だけだからです。
もし交互作用があればその検定結果だけ採用して、主効果の検定結果は採用しません。 そして食餌無における薬物の効果と食餌有における薬物の効果、または薬物無における食餌の効果と薬物有における食餌の効果を科学的に検討します。 薬物と食餌の間に交互作用があるということは、お互いに相手の状態を考慮に入れなければ正確な効果は検討できないという意味だからです。
その場合、食餌の有無で層別して薬物の効果を一元配置分散分析で解析したり、薬物の有無で層別して食餌の効果を一元配置分散分析で解析するという方法も考えられます。 すでに交互作用の検定を行っているので、本来は二重に検定する必要はないのですが、何でもかんでも検定をしなければ気がすまない有意症患者を納得させるためには層別解析を行うのもひとつの対処法ではあるでしょう。
また図4.3.2を見ながら薬物無群と有群の群別回帰式と共通回帰式を見ると、その意味するところがわかると思います。 つまり群別回帰式は薬物無群の食餌無平均値→有平均値のグラフと、薬物有群の食餌無平均値→有平均値のグラフを表していて、この2本のグラフが平行なら交互作用はないわけです。 そして共通回帰式は2本のグラフが平行と仮定した時の理論的グラフを表していて、この式から求められる薬物有・無−食餌有・無の各修正平均値のことを最小二乗平均(LSM:Least Square Mean)と呼ぶことがあります。
釣り合い型データに共分散分析を適用すると「群差」と「修正群差」が一致し、「共通回帰」と「全体回帰」が一致します。 そしてダミー変数「無 = -1 有 = 1」を用いた重回帰分析と共分散分析が一致します。 その結果、タイプI平方和およびタイプII平方和およびタイプIII平方和による分散分析表が一致し、それは通常の二元配置分散分析表と一致します。 そうなるようにデータのバランスを取り、各要因を独立にして簡単に計算できるようにした手法が分散分析ですから、これは当然のことです。
また繰り返しのない二元配置分散分析は釣り合い型に相当するので、3種類の平方和が全て一致します。 また一元配置分散分析は要因がひとつだけなので、やはり3種類の平方和が全て一致します。 そのため平方和のタイプの違いが問題になるのは繰り返しのある二元配置以上で、しかもバランスの崩れた試験デザインの時ということになります。
実際の研究限場では結果に影響を与える要因をひとつずつ検討し、研究目的に最適な条件を探索してから、できるだけその条件で検証試験を行うというように段階的に研究を進めます。 そのため二元配置以上の複雑なデザインの試験を行うのは避け、できるだけ単純なデザインの試験を段階的に行うのが賢明です。 ということは分散分析の平方和のタイプの違いが問題になるような場面は現実の研究現場ではほとんどなく、もしあったとしたらその時は試験デザインを見直すべきだということになります。
そしてどうしても非釣り合い型のデータを解析しなければならない時は分散分析ではなく共分散分析を適用し、非平行性が小さければ非平行性を残差に含めた共分散分析表を作成して検討し、非平行性が大きければ要因B(またはA)の水準ごとに要因A(またはB)の効果を検討するのが合理的です。 本来適用すべきではないデータに無理に分散分析を適用して、「平方和が3種類もあるけど、一体、どれを採用すれば良いのだろう…?」などと、あまり意味のないことに頭を悩ますのはやめましょう。 (→8.5 共分散分析と二元配置分散分析)
要因A(群) | 被験者 | 時期B1 | … | 時期Bj | … | 時期Bb | 計 | 平均値 |
---|---|---|---|---|---|---|---|---|
A1 | 1 | y111 | … | y1j1 | … | y1b1 | T1.1 | m1.1 |
: | : | : | : | : | : | : | : | |
k | y11k | … | y1jk | … | y1bk | T1.k | m1.k | |
: | : | : | : | : | : | : | : | |
r1 | y11r1 | … | y1jr1 | … | y1br1 | T1.r1 | m1.r1 | |
小計 | T11. | … | T1j. | … | T1b. | T1.. | − | |
平均 | m11. | … | m1j. | … | m1b. | − | m1.. | |
: | : | : | : | : | : | : | : | : |
Ai | 1 | yi11 | … | yij1 | … | yib1 | Ti.1 | mi.1 |
: | : | : | : | : | : | : | : | |
k | yi1k | … | yijk | … | yibk | Ti.k | mi.k | |
: | : | : | : | : | : | : | : | |
ri | yi1ri | … | yijri | … | yibri | Ti.ri | mi.ri | |
小計 | Ti1. | … | Tij. | … | Tib. | Ti.. | − | |
平均 | mi1. | … | mij. | … | mib. | − | mi.. | |
: | : | : | : | : | : | : | : | : |
Aa | 1 | ya11 | … | yaj1 | … | yab1 | Ta.1 | ma.1 |
: | : | : | : | : | : | : | : | |
k | ya1k | … | yajk | … | yabk | Ta.k | ma.k | |
: | : | : | : | : | : | : | : | |
ra | ya1ra | … | yajra | … | yabra | Ta.ra | ma.ra | |
小計 | Ta1. | … | Taj. | … | Tab. | Ta.. | − | |
平均 | ma1. | … | maj. | … | mab. | − | ma.. | |
計 | T.1. | … | T.j. | … | T.b. | TT | − | |
平均 | m.1. | … | m.j. | … | m.b. | − | mT |
データyijkを繰り返し測定型二元配置分散分析の基本式に従って分解し、平方和と自由度と分散を求めて分散分析表にまとめると次のようになります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A:群 | SA | φA | VA | FA = VA/VSR |
SR:被験者残差 | SSR | φSR | VSR | |
SUB:被験者 | Ssub | φsub | Vsub | Fsub = Vsub/VSRxB |
B:時期 | SB | φB | VB | FB = VB/VSRxB |
A×B | SAxB | φAxB | VAxB | FAxB = VAxB/VSRxB |
SR×B:残差 | SSRxB | φSRxB | VSRxB | |
全体 | ST | φT |
群ごとの時期変動パターンの違いが小さくてFAxBが1より小さい時は、群と時期との交互作用A×BをSR×Bにプールした方が誤差が小さくなり効率が良くなります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A:群 | SA | φA | VA | FA = VA/VSR |
SR:被験者残差 | SSR | φSR | VSR | |
SUB:被験者 | Ssub | φsub | Vsub | Fsub = Vsub/VSxB |
B:時期 | SB | φB | VB | FB = VB/VSxB |
SUB×B:残差 | SSxB=SAxB+SSRxB | φSxB = φAxB+φSRxB | VSRxB | |
全体 | ST | φT |
また個体差が少なくてFsubが1より小さい時は、SRをSR×Bにプールして一般的な繰り返しのある二元配置分散分析にした方が誤差が小さくなり効率が良くなります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms | 分散比F |
---|---|---|---|---|
A:群 | SA | φA | VA | FA = VA/VR |
B:時期 | SB | φB | VB | FB = VB/VR |
A×B | SAxB | φAxB | VAxB | FAxB = VAxB/VR |
残差 | SR = SSR+SSRxB | φSRxB = φSR+φSRxB | VR | |
全体 | ST | φT |
表4.3.4のデータについて実際に計算してみましょう。