前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 | 4 | 5 |
第4節で説明した交互作用という言葉は第4章の繰り返しのある二元配置分散分析にも出てきました。 今度はこれらの間の関係を調べてみましょう。 まず表8.1.1の投与前後の収縮期血圧を1列に並べ、薬剤の投与前後を「0:投与前 1:投与後」というダミー変数で表してこれを共変数にし、薬剤を群項目、収縮期血圧を目的変数にして共分散分析を適用してみましょう。 (→4.3 繰り返しのある多標本・多時期の計量値)
患者No. | 薬剤 | 時期 (0:投与前 1:投与後) | 収縮期血圧 |
---|---|---|---|
1 | A | 0 | 140 |
2 | A | 0 | 140 |
3 | A | 0 | 145 |
4 | A | 0 | 145 |
5 | A | 0 | 150 |
6 | A | 0 | 150 |
7 | A | 0 | 155 |
8 | A | 0 | 160 |
1 | A | 1 | 126 |
2 | A | 1 | 132 |
3 | A | 1 | 127 |
4 | A | 1 | 132 |
5 | A | 1 | 130 |
6 | A | 1 | 135 |
7 | A | 1 | 132 |
8 | A | 1 | 140 |
9 | B | 0 | 160 |
10 | B | 0 | 165 |
11 | B | 0 | 165 |
12 | B | 0 | 165 |
13 | B | 0 | 170 |
14 | B | 0 | 170 |
15 | B | 0 | 170 |
16 | B | 0 | 175 |
17 | B | 0 | 175 |
18 | B | 0 | 180 |
19 | B | 0 | 180 |
20 | B | 0 | 185 |
9 | B | 1 | 142 |
10 | B | 1 | 152 |
11 | B | 1 | 155 |
12 | B | 1 | 150 |
13 | B | 1 | 155 |
14 | B | 1 | 150 |
15 | B | 1 | 148 |
16 | B | 1 | 155 |
17 | B | 1 | 150 |
18 | B | 1 | 157 |
19 | B | 1 | 160 |
20 | B | 1 | 158 |
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 4743.7 | 1 | 4743.7 | 124.135 |
共通回帰 | 3222.03 | 1 | 3222.03 | 84.315 |
修正群差 | 4743.7 | 1 | 4743.7 | 124.135 |
全体回帰 | 3222.03 | 1 | 3222.03 | 84.315 |
非平行性 | 16.5375 | 1 | 16.5375 | 0.433 |
残差 | 1375.71 | 36 | 38.2141 | |
全体 | 9357.98 | 39 |
この場合の共変数xは時期を表すダミー変数なので、群別回帰式においてxに0を代入した時は投与前平均値になり、xに1を代入した時は投与後の平均値になり、回帰係数は投与前後の平均値の差になります。 そして、当然、これらの値は実際のデータから求めた平均値とその差に一致します。
また2群の投与前後のデータ数が等しいので、2群の共変数の平均値は等しくなって総平均値に一致します。 そのため図8.2.1のように2群のプロットの重心を総平均値の位置までずらす必要がなく、全体回帰式と全体の共通回帰式は一致します。 その結果、共通回帰の検定と全体回帰の検定が同じものになります。 またyの平均値も補正する必要がなくなり、群差の検定と修正群差の検定も同じものになります。
次に表8.1.1の薬剤を要因A、時期を要因Bとして、繰り返しのある二元配置分散分析を適用すると次のようになります。
要因 | 平方和 | 自由度 | 平均平方和 | F値F |
---|---|---|---|---|
群(A) | 4743.7 | 1 | 4743.7 | 124.135 |
時期(B) | 3222.03 | 1 | 3222.03 | 84.315 |
交互作用(A×B) | 16.5375 | 1 | 16.5375 | 0.433 |
残差 | 1375.71 | 36 | 38.2141 | |
全体 | 9357.98 | 39 |
表8.5.2と表8.5.3を比べると、共分散分析表の群差が二元配置分散分析表の群(A)に相当し、共通回帰または全体回帰が時期(B)に相当し、非平行性が交互作用(A×B)に相当することがわかります。 (注1)
二元配置分散分析における交互作用は群ごとの時期変動パターンの違いを表すものであり、時期が2つだけの時は2つの時期の平均値の差が群ごとに異なっているかどうかを表します。 それに対して共分散分析における非平行性は、共変数と目的変数の群別回帰直線の傾きが異なっているかどうかを表すものです。 そして共変数が2つの時期を表すダミー変数の時は、群別回帰直線の傾きは2つの時期の平均値の差になり、非平行性は2つの時期の平均値の差が群ごとに異なっているかどうかを表します。 その結果、共分散分析の非平行性と二元配置分散分析の交互作用が一致します。
逆にいうと共分散分析において共変数をダミー変数にし、各群の共変数の平均値が同じになるように例数のバランスを取り、群ごとの平均値を補正しなくても比較できるようにしたものが二元配置分散分析ということになります。 このようにバランスの取れたデータのことを釣り合い型データ(balanced data)といい、バランスの崩れたデータのことを非釣り合い型データ(unbalanced data)といいます。 元々、分散分析は要因同士が独立になるように計画された試験デザインから得られた釣り合い型データを解析するためにフィッシャーによって開発された手法です。 そして分散分析の原理を応用してバランスの取れた試験デザインを計画するための手法が実験計画法です。
共分散分析は群項目をダミー変数で表して、共変数と一緒に説明変数にした重回帰分析に相当します。 それと同様に二元配置分散分析は要因Aも要因Bもダミー変数で表して、それらを説明変数にした重回帰分析に相当します。 ただしこの場合は例数のバランスを取って説明変数同士が独立になるようにデザインされているので、重回帰分析のように説明変数間の相関関係を考慮した複雑な計算をする必要はないのです。
第4章で説明したように、時期が3つ以上の時は薬剤投与後の変化量をデータにし、繰り返し測定型二元配置分散分析によって薬剤の効果を比較します。 この時、データの中に欠測値があると非釣り合い型データになるので繰り返し測定型二元配置分散分析は適用できません。 そこでそのような時は時期をダミー変数で表し、これを共変数にした共分散分析を適用します。 共分散分析は共変数の影響を考慮した手法であり、非釣り合い型データにも適用できるので欠測値があっても適用することができるのです。 (→4.3 繰り返しのある多標本・多時期の計量値)
例えば第4章の表4.3.8で、患者ID1-2の投与2週後のデータが欠測値だったとします。 するとこれは非釣り合い型データになるので、繰り返し測定型二元配置分散分析は適用できません。
群 | 患者ID | 収縮期血圧 | |||||
---|---|---|---|---|---|---|---|
投与前 | 投与1週後 | 投与2週後 | 投与1週後の変化量 | 投与2週後の変化量 | 変化量の平均値 | ||
P剤投与群 | 1-1 | 130 | 115 | 129 | -15 | -1 | -8 |
1-2 | 130 | 110 | - | -20 | - | -20 | |
1-3 | 121 | 129 | 135 | 8 | 14 | 11 | |
1-4 | 138 | 130 | 125 | -8 | -13 | -10.5 | |
1-5 | 133 | 132 | 132 | -1 | -1 | -1 | |
平均値 | 130.4 | 123.2 | 126.2 | -7.2 | -0.25 | -5.7 | |
A剤投与群 | 2-1 | 116 | 106 | 108 | -10 | -8 | -9 |
2-2 | 128 | 102 | 100 | -26 | -28 | -27 | |
2-3 | 129 | 108 | 108 | -21 | -21 | -21 | |
2-4 | 137 | 118 | 114 | -19 | -23 | -21 | |
2-5 | 140 | 116 | 110 | -24 | -30 | -27 | |
平均値 | 130 | 110 | 108 | -20 | -22 | -21 | |
平均値 | 130.2 | 116.6 | 117.1 | -13.6 | -13.1 | -13.35 |
そこで投与1週後の変化量と投与2週後の変化量を1列に並べ、時期を「0:投与1週後 1:投与2週後」というダミー変数で表してこれを共変数にし、薬剤を群項目、収縮期血圧の変化量を目的変数にして共分散分析を適用すると次のようになります。
患者ID | 薬剤 | 時期 (0:投与2週後 1:投与2週後) | 収縮期血圧変化量 |
---|---|---|---|
1-1 | P | 0 | -15 |
1-2 | P | 0 | -20 |
1-3 | P | 0 | 8 |
1-4 | P | 0 | -8 |
1-5 | P | 0 | -1 |
1-1 | P | 1 | -1 |
1-2 | P | 1 | - |
1-3 | P | 1 | 14 |
1-4 | P | 1 | -13 |
1-5 | P | 1 | -1 |
2-1 | A | 0 | -10 |
2-2 | A | 0 | -26 |
2-3 | A | 0 | -21 |
2-4 | A | 0 | -19 |
2-5 | A | 0 | -24 |
2-1 | A | 1 | -8 |
2-2 | A | 1 | -28 |
2-3 | A | 1 | -21 |
2-4 | A | 1 | -23 |
2-5 | A | 1 | -30 |
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 1351.11 | 1 | 1351.11 | 15.4289 |
共通回帰 | 23.1007 | 1 | 23.1007 | 0.263796 |
修正群差 | 1366.61 | 1 | 1366.61 | 15.6059 |
全体回帰 | 7.6 | 1 | 7.6 | 0.0867877 |
非平行性 | 94.2382 | 1 | 94.2382 | 1.07615 |
残差 | 1313.55 | 15 | 87.57 | |
全体 | 2782 | 18 |
この場合の共変数xは時期を表すダミー変数なので、群別回帰式においてxに0を代入した時は投与1週後の変化量平均値になり、xに1を代入した時は投与2週後の変化量平均値になり、回帰係数は投与1週後と2週後の変化量平均値の差になります。 そして、当然、これらの値は実際のデータから求めた表8.5.4の変化量平均値とその差に一致します。
それに対して共通回帰式においてxに0を代入した時は投与1週後の修正変化量平均値になり、xに1を代入した時は投与2週後の修正変化量平均値になり、回帰係数は投与1週後と2週後の修正変化量平均値の差になります。 これらの修正変化量平均値は2群の回帰直線が平行と仮定した共通回帰式から求めた値であり、最小二乗法によって求めた理論値なので最小二乗平均値(LSM:Least Square Mean)と呼ばれることがあります。
群別回帰式から求めたP剤投与群の投与1週後と2週後の変化量平均値は-7.2と-0.25であり、投与2週後は低下量が6.95だけ減っています。 それに対して群別回帰式から求めたA剤投与群の投与1週後と2週後の変化量平均値は-20と-22であり、投与2週後は低下量が2だけ増えています。 そのためどちらの時期もA薬剤投与群の方がより低下していますが、投与1週後の変化量平均値の差が-12.8であるのに対して投与2週後の変化量平均値の差は-21.75であり、投与2週後の差の方が大きくなっています。
このように2群の変化量平均値の差が時期によって異なるのは2群の群別回帰直線が非平行だからであり、変化量平均値に関して群と時期の間に交互作用があることになります。
一方、P剤投与群の投与1週後と2週後の修正変化量平均値は-5.09412と-2.88236、A剤投与群の投与1週後と2週後の修正変化量平均値は-22.1059と-19.89414で、どちらも投与2週後は低下量が2.21176だけ減っています。 そのためどちらの時期も2群の修正変化量平均値の差は同じであり、それは-17.01178です。 そして2群の共通回帰直線は平行ですから、この値は共通回帰式の切片の差とも一致します。
このように2群の例数が異なる非釣り合い型データの場合は、群別回帰式から求めた投与1週後および2週後の変化量平均値と、共通回帰式から求めた投与1週後および2週後の修正変化量平均値の値が一致するとは限りません。 そして2群の回帰直線が非平行と考えられる時は実際のデータから求めた変化量平均値の方が正確であり、2群の回帰直線が平行と考えられる時は修正変化量平均値の方が正確です。
上記の共分散分析の結果では非平行性の検定結果は有意水準5%で有意ではないものの、これは例数が少なくて検出力が足らないことが主な原因です。 2群の群別回帰式の回帰係数は6.95と-2であり、少し異なっているので、この場合は2群の群別回帰直線は非平行と考えておいた方が無難です。 したがって2群の変化量平均値の差は時期によって少し異なり、投与2週後の方が差が大きい可能性が高いと考えられます。
共分散分析結果中の群差の検定は、投与1週後と2週後の変化量を平均した平均変化量の平均値を2群間で比較した結果です。 これは表8.5.4に記載してあるP剤投与群の平均変化量平均値-5.7と、A剤投与群の平均変化量平均値-21を比較したものです。 修正群差の検定は投与1週後と2週後の修正平均変化量平均値を2群間で比較した結果です。 これはP剤投与群の修正平均変化量平均値(-5.09412 - 2.88236)/2=-3.98824と、A剤投与群の修正平均変化量平均値(-22.1059 - 19.89414)/2=-21を比較したものであり、その差は修正変化量平均値の差と同じく-17.1101178です。
これらはどちらも平均変化量平均値を評価指標にした時の検定結果です。 そして非釣り合い型のデータでは平均変化量平均値は不正確になるので、修正平均変化量平均値と修正群差の検定結果を採用しなければなりません。 ただし2群の回帰直線が非平行の時は修正平均変化量平均値も不正確になるので、変化量平均値を評価指標にして時期ごとに変化量平均値を群間比較する必要があります。
全体回帰と共通回帰の検定は二元配置分散分析における要因Bの検定に相当し、この場合は2群を合わせた時の変化量平均値が時期によって異なっているかどうかの検定です。 全体回帰式の回帰係数1.26667は2群を合わせて変化量平均値を求めた時の投与1週後と投与2週後の差を表し、全体回帰の検定はこれが0かどうかを検定します。 共通回帰式の回帰係数2.21176は投与1週後と投与2週後の修正変化量平均値の差を表し、共通回帰の検定はこれが0かどうかを検定します。
非釣り合い型のデータでは、2群の回帰直線が平行でも非平行でも全体回帰の検定結果は不正確になります。 そして2群の回帰直線が非平行の時は、釣り合い型でも非釣り合い型でも全体回帰の検定結果と共通回帰の検定結果が不正確になります。 したがって2群の回帰直線がほぼ平行で、共通回帰の検定結果が有意あるいはF値が大きく、しかも回帰直線に医学的な意義がある時だけ修正変化量平均値と修正平均変化量平均値が正確になります。
以上のように欠測値のある非釣り合い型データの場合は、繰り返し測定型二元配置分散分析の代わりに共分散分析を適用する必要があります。 ただし繰り返し測定型二元配置分散分析は複数時期のデータを対応のあるデータとして扱い、個人差を残差から分離して効率の良い分析を行います。 しかし共分散分析は複数時期のデータを対応のないデータとして扱うので、個人差を残差から分離できずに分析の効率が少し悪くなります。 また欠測値のある被験者を解析対象にすると、時期変動に被験者の違いが混入して結果の解釈が難しくなります。
そのため繰り返し測定データの連続性に欠測値が好ましくない影響を与える時とか、欠測値のある被験者が非常に少数で、それらの被験者を解析から除外する方が効率的な時は欠測値のある被験者を解析から除外して釣り合い型データにし、繰り返し測定型二元配置分散分析を適用するのが合理的です。 また被験者の状態が安定していて前後のデータから欠測値を推測できる時はLOCF(Last Observation Carried Forward、引き延ばし)という処理をして欠測値を補完し、釣り合い型データにして繰り返し測定型二元配置分散分析を適用するという方法もあります。 (→4.3 繰り返しのある多標本・多時期の計量値 (注1)、4.3 繰り返しのある多標本・多時期の計量値 (6) 欠測値の処理方法)
繰り返し測定データに共分散分析を適用する時、背景因子を共変数に入れることによって背景因子で補正して薬効の比較を行うことができます。 例えば第4章の表4.3.8の投与前値を共変数に入れると、初期値で補正して投与後の変化量を比較することができます。 その場合、表8.5.5と同じように投与1週後と投与2週後の変化量を1列に並べ、時期を「0:投与1週後 1:投与2週後」というダミー変数で表し、さらに投与1週後と投与2週後の変化量に対応する投与前値を1列に並べてこれらを共変数にし、薬剤を群項目、収縮期血圧の変化量を目的変数にして共分散分析を適用すると次のようになります。
患者ID | 薬剤 | 時期 (0:投与2週後 1:投与2週後) | 収縮期血圧 | |
---|---|---|---|---|
投与前 | 投与後変化量 | |||
1-1 | P | 0 | 130 | -15 |
1-2 | P | 0 | 130 | -20 |
1-3 | P | 0 | 121 | 8 |
1-4 | P | 0 | 138 | -8 |
1-5 | P | 0 | 133 | -1 |
1-1 | P | 1 | 130 | -1 |
1-2 | P | 1 | 130 | -20 |
1-3 | P | 1 | 121 | 14 |
1-4 | P | 1 | 138 | -13 |
1-5 | P | 1 | 133 | -1 |
2-1 | A | 0 | 116 | -10 |
2-2 | A | 0 | 128 | -26 |
2-3 | A | 0 | 129 | -21 |
2-4 | A | 0 | 137 | -19 |
2-5 | A | 0 | 140 | -24 |
2-1 | A | 1 | 116 | -8 |
2-2 | A | 1 | 128 | -28 |
2-3 | A | 1 | 129 | -21 |
2-4 | A | 1 | 137 | -23 |
2-5 | A | 1 | 140 | -30 |
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 1170.45 | 1 | 1170.45 | 17.051 |
共通回帰 | 607.643 | 2 | 303.821 | 4.42604 |
修正群差 | 1217.47 | 1 | 1217.47 | 17.736 |
全体回帰 | 560.623 | 2 | 280.311 | 4.08355 |
非平行性 | 89.4418 | 2 | 44.7209 | 0.65149 |
残差 | 961.016 | 14 | 68.644 | |
全体 | 2828.55 | 19 |
群別回帰式と共通回帰式を利用して、投与前値が全体の平均値である130.2の時の投与1週後と投与2週後の変化量平均値および修正変化量平均値を求めると次のようになります。
群別回帰式から求めたP剤投与群の投与1週後と2週後の変化量平均値は、実際のデータから求めた投与1週後と2週後の変化量平均値である-7.2と-4.2に近い値であり、投与2週後は低下量が3だけ減っています。 それに対して群別回帰式から求めたA剤投与群の投与1週後と2週後の変化量平均値は、実際のデータから求めた投与1週後と2週後の変化量平均値である-20と-22に近い値であり、投与2週後は低下量が2だけ増えています。
このように群別回帰式から求めた変化量平均値は投与前値が130.2の時の理論値なので、実際のデータから求めた値と少し異なっています。 しかし投与1週後と2週後の差は実際のデータから求めた値と一致しています。 これはx1が時期を表すダミー変数であり、その偏回帰係数は実際のデータから求めた投与1週後と2週後の変化量平均値の差に一致するからです。
一方、共通回帰式から求めた2群の投与1週後と2週後の修正変化量平均値は群別回帰式から求めた値とは少し異なり、投与2週後はどちらの群も低下量が0.5だけ減っています。 そして2群の修正変化量平均値の差は投与1週後も2週後も15.6105であり、これは2群の共通回帰式の切片の差と一致します。 それに対して実際のデータから求めた投与1週後の2群の変化量平均値の差は-7.2 - (-20) = 12.8、投与2週後の2群の変化量平均値の差は-4.2 - (-22) = 17.8、2群の平均変化量平均値の差は-5.7 - (-21) = 15.3です。
したがって投与前値と時期で補正すると、投与1週後と2週後の変化量平均値の差は少し変わりますが、平均変化量平均値の差はあまり変わりません。 そのため群差の検定結果と修正群差の検定結果もあまり変わりません。 これは2群の投与前の平均値が130.4と130であり、あまり変わらないからです。
このデータでは非平行性の検定結果は有意水準5%で有意ではなく、群別回帰式の偏回帰係数も大きくは異なっていないので、2群の群別回帰直線はほぼ平行と考えられます。 そして共通回帰の検定結果が有意ですから、修正変化量平均値と修正平均変化量平均値そして修正群差の検定結果を採用するのが妥当と考えられます。
このように共分散分析を利用すると、非釣り合い型データの分析だけでなく、繰り返し測定データを背景因子で補正して分析することもできるので便利です。 さらに共分散分析の原理を応用すると、平均値だけでなく順位平均値や出現率の共分散分析を行うことができます。 それが第4章で説明した一般化拡張マンテル検定、拡張マンテル検定、マンテル・ヘンツェル検定等の手法です。 これらの手法では時期よりも層別項目を要因Bにすることが多く、たいていは非釣り合い型データになります。 そのためこれらの手法は層別項目の影響を補正して順位平均値や出現率を比較するための共分散分析相当の手法として利用するのが普通です。 (→4.4 繰り返しのある多標本・多時期の計数値)
上記のように共分散分析の全体回帰と共通回帰が同じものになり、同時に二元配置分散分析の時期(要因B)とも一致します。 そして共分散分析の群差と修正群差が同じものになり、同時に二元配置分散分析の群(要因A)とも一致します。 さらに非平行性が二元配置分散分析の交互作用と一致します。 つまりこの時の共分散分析は繰り返しのある二元配置分散分析に相当します。
表8.5.1のデータについて実際に計算すると次のようになります。
これらの統計量を共分散分析表にまとめると本文中の表8.5.2になります。