前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
周期回帰分析と同様に、周期共分散分析も周期関数を一般的な関数にして一般化することができます。 その手法を時系列共分散分析(time series analysis of covariance)と呼ぶことにしましょう。 例として表12.6.1の平均値に最も簡単な一次関数つまり直線を用いた時系列共分散分析を適用すると次のようになります。 (注1)
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 30.8802 | 1 | 30.8802 | 0.13273 |
共通回帰 | 2167.14 | 1 | 2167.14 | 9.31489 |
修正群差 | 30.8802 | 1 | 30.8802 | 0.13273 |
全体回帰 | 2167.14 | 1 | 2167.14 | 9.31489 |
非平行性 | 1145.16 | 1 | 1145.16 | 4.92215 |
残差 | 10236.8 | 44 | 232.654 | |
全体 | 13579.9 | 47 |
表12.9.1および図12.9.1と第6節の表12.6.2および図12.6.1を比較すると、時系列回帰直線の適合度が低いので残差分散が大きくなり、検定結果の有意確率が大きくなっています。 表12.6.1のデータは日内変動を検討するためのものなので、適合度が低いのは致し方ありません。 この手法を用いると、時系列で繰り返し測定された血圧の平均的なレベルと時間的なトレンドを分離して群間比較することができます。 そのため繰り返し測定データの評価方法のひとつとして利用することができます。 (→4.3 繰り返しのある多標本・多時期の計量値 (5) 繰り返し測定データの評価方法)
次に表12.6.1を被験者と時期を要因にした二元配置型データと捉えて、直線を用いた二元配置型時系列共分散分析を適用すると次のようになります。 (注2)
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 74.1125 | 1 | 74.1125 | 0.384155 |
個体残差 | 578.771 | 3 | 192.924 | |
個体 | 652.883 | 4 | 163.221 | 1.437 |
全体回帰 | 3957.03 | 1 | 3957.03 | 34.8286 |
非平行性 | 2748.37 | 1 | 2748.37 | 24.1904 |
ズレ合計 | 22733.1 | 44 | 516.662 | 4.5475 |
残差 | 7839.4 | 69 | 113.614 | |
全体 | 37930.8 | 119 |
単純な時系列共分散分析の結果と比較すると、群別時系列回帰式と寄与率は同じですが、回帰と非平行性の分散比が非常に大きくなっています。 そしてこの手法では残差からズレ合計を分離して検定することができます。 また表12.9.2と第6節の表12.6.3を比較すると、全体回帰と非平行性とズレ合計以外は同じであることがわかります。 この手法は周期回帰曲線の代わりに直線を当てはめただけなので、変わるのは回帰に関係した部分だけなのです。
次は表12.6.1を測定時点ごとに独立した被験者で測定された一元配置型データと捉えて、直線を用いた一元配置型時系列共分散分析を適用すると次のようになります。 (注3)
要因 | 平方和 | 自由度 | 平均平方和(分散) | F値 |
---|---|---|---|---|
群差 | 74.1125 | 1 | 74.1125 | 0.634 |
共通回帰 | 3957.03 | 1 | 3957.03 | 33.8442 |
修正群差 | 74.1125 | 1 | 74.1125 | 0.634 |
全体回帰 | 3957.03 | 1 | 3957.03 | 33.8442 |
非平行性 | 2748.37 | 1 | 2748.37 | 23.5067 |
ズレ合計 | 22733.1 | 44 | 516.662 | 4.41897 |
時期 | 29512.6 | 47 | 627.928 | 5.37063 |
残差 | 8418.17 | 72 | 116.919 | |
全体 | 37930.8 | 119 |
二元配置型時系列共分散分析の結果と比較すると、群別および共通時系列回帰式と寄与率は同じですが、回帰の分散比も非平行性の分散比もズレの分散比も少し小さくなっています。 そして表12.9.3と第6節の表12.6.4を比較すると、共通および全体回帰と非平行性とズレ合計以外は同じであることがわかります。 この手法は周期回帰曲線の代わりに直線を当てはめただけなので、変わるのは回帰に関係した部分だけなのです。
ちなみにこの手法と同じ原理を用い、時期の代わりに用量を用いたものが用量反応解析で用いられる平行線検定法です。 平行線検定法については第13章で説明します。 (→13.2 平行線検定法)
また繰り返し測定混合効果モデルを利用した分散分析も、この手法とほぼ同じ原理を用いた手法です。 そのためどちらの手法も繰り返し測定データの評価方法のひとつとして利用することができます。 また時期tを実測値ではなくダミー変数で表し、それを共変数にすると、途中に欠測値があっても適用可能な繰り返し測定型二元配置分散分析相当の手法になります。 それを繰り返し測定共分散分析(repeated measures analysis of covariance)といい、時系列共分散分析の一種です。 この手法で共変数に初期値や年齢などの背景因子を入れると、背景因子で補正した繰り返し測定型二元配置分散分析相当の手法になります。 (注4) (→4.3 繰り返しのある多標本・多時期の計量値 (3) 繰り返し測定データによる薬効比較、(5) 繰り返し測定データの評価方法)
群 | 時期 | 平均 | ||||
---|---|---|---|---|---|---|
t1 | … | tj | … | t(pi) | ||
1 | y11 | … | y1j | … | y1(p1) | m1. |
: | : | … | : | … | : | : |
i | yi1 | … | yij | … | yi(pi) | mi. |
: | : | … | : | … | : | : |
a | ya1 | … | yaj | … | ya(pa) | ma. |
全体 | m.1 | … | m.j | … | m.(pi) | mT |
時系列共分散分析ではデータyijに対して次のような時系列回帰モデルを当てはめて考えます。 これは重回帰モデルに相当し、直線を用いた時系列共分散分析では説明変数をひとつにして、x1 = tにします。 2番目以降の説明変数に第2節の(注1)で説明した周期成分を入れてx2 = cos(ω1t)、x3 = sin(ω1t)、…、x2m = cos(ωmt)、x2m+1 = sin(ωmt)とすると、時間的なトレンドと周期変動を組み合わせた時系列回帰モデルになります。 そのような時系列回帰モデルは、例えば長期間に渡る血圧の変動をトレンドと日内変動に分離して分析する時などに用いることができます。
以上の時系列回帰モデルに共分散分析の原理を適用します。 まず3通りの時系列回帰モデルによる推定値を用いてデータyijを3通りに分解し、その基本式に対応する平方和と自由度を求めると次のようになります。
表12.6.1のA群とB群の平均値について、x1 = tだけを入れた時系列回帰式を用いて実際に計算してみましょう。
これらの統計量を用いて表12.9.1の時系列共分散分析表を作成することができます。
群 | 被験者 | 時期 | 平均 | ||||
---|---|---|---|---|---|---|---|
t1 | … | tj | … | tp | |||
1 | 1 | y111 | … | y1j1 | … | y1p1 | m1.1 |
: | : | … | : | … | : | : | |
n1 | y11(n1) | … | y1j(n1) | … | y1p(n1) | m1.(n1) | |
平均 | m11. | … | m1j. | … | m1p. | m1.. | |
: | : | : | … | : | … | : | : |
i | 1 | yi11 | … | yij1 | … | yip1 | mi.1 |
: | : | … | : | … | : | : | |
ni | yi1(n1) | … | yij(n1) | … | yip(n1) | mi.(n1) | |
平均 | mi1. | … | mij. | … | mip. | mi.. | |
: | : | : | … | : | … | : | : |
a | 1 | ya11 | … | yaj1 | … | yap1 | ma.1 |
: | : | … | : | … | : | : | |
na | ya1(na) | … | yaj(na) | … | yap(na) | ma.(na) | |
平均 | ma1. | … | maj. | … | map. | ma.. | |
全体 | N | m.1. | … | m.j. | … | m.p. | mT |
表12.6.1のデータについて、x1 = tだけを入れた時系列回帰式を用いて実際に計算してみましょう。
これらの統計量を用いて表12.9.2の周期共分散分析表を作成することができます。
表12.6.1のデータについてx1 = tだけを入れた時系列回帰式を用いて実際に計算すると、群別時系列化回帰式と共通時系列回帰式は(注2)と同じ値になり、群差と修正群差の平方和と自由度は(注2)の群差の平方和と自由度と同じ値になり、共通回帰と全体回帰の平方和と自由度は(注2)の全体回帰の平方和と自由度と同じ値になり、非平行性とズレ合計と全体の平方和と自由度は(注2)と同じ値になります。 これは表12.6.1のデータが同じ被験者について繰り返し測定したものであり、時期ごとの例数が揃っているからです。
時期と残差の平方和と自由度は次のような値になり、これは一元配置分散分析独自の値です。 これらの統計量と(注2)の統計量を用いて、表12.9.3の周期共分散分析表を作成することができます。
このモデルに最尤法を適用してβとγの最良線形普遍推定量(BLUE解)を求めると、次のようになります。 (→7.1 重回帰モデル (注1)、9.3 1変量の場合 (注1))
bは∑-1を重みとした重み付け最小2乗法のBLUE解に相当します。 そのため∑つまりGとRが決まればデータから求められることがわかると思います。 そしてGとRは次の尤度関数に最尤法を適用することによって求めます。
この対数尤度関数の値を最大にする時のGとRが最尤解になります。 しかしbに∑-1つまりGとRが含まれているので、このままでは最尤解をうまく求められません。 そこで色々と工夫してbとGとRを分離し、色々な制約条件を付けた繰り返し計算によって近似解を求めます。 しかしその制約条件はどうしても作為的になり、現実には有り得ないような条件になりがちです。
そのためどうせ現実には有り得ない作為的な条件が必要なら「Z=0かつRは等分散で互いに独立」という通常の線形モデルと同じ簡単な条件の方が便利です。 したがって線形混合効果モデルは理論的には厳密であるものの、あまり実用的ではなく、従来の線形モデルつまり分散分析や共分散分析や重回帰分析を用いた方が実際的ということになります。
繰り返し測定混合効果モデル(MMRM:Mixed effect Models for Repeated Measures)は表12.9.4の群を被験者にした繰り返し測定データに線形混合モデルを適用したものであり、次のように記述されます。
この場合のγiは被験者iの個体差ベクトルであり、全体からの偏差ベクトルになります。 線形混合効果モデルを利用した分散分析ではデータの時期変動を直線で近似し、全体と被験者ごとに回帰直線を当てはめるのが普通です。 そして全体に当てはめた回帰直線を固定効果にし、その回帰直線の回帰係数(定数も含む)と被験者ごとの回帰直線の回帰係数の偏差を変量効果にすると、この時のモデルは次のようになります。
これは「被験者ごとの回帰直線が全て異なる」という仮定で組み立てたモデルであり、単純な時系列共分散分析と同様の分析をすることができます。 その場合、固定効果であるβが共通回帰に相当し、変量効果であるγが回帰係数の個人差つまり非平行性に相当します。
また回帰直線の定数項だけを用いる、つまり全体の定数項と被験者ごとの定数項の偏差を個体差として、それを変量効果にする時もあります。 そのモデルは次のようになり、時系列共分散分析において被験者ごとの回帰直線が平行な時に相当します。
これらのモデルに固定効果として群と時期を追加すると、一元配置型時系列共分散分析に相当する手法になります。 さらに被験者ごとの時期1〜pが全て等しく、固定効果に被験者を追加すると、二元配置型時系列共分散分析に相当する手法になります。 また固定効果も変量効果も定数項だけを用いるモデルで、被験者ごとの時期1〜pが全て等しく、固定効果に被験者と時期と交互作用を追加すると、繰り返し測定型二元配置分散分析に相当する手法になります。 (→4.3 繰り返しのある多標本・多時期の計量値 (5) 繰り返し測定データの評価方法)
このように線形混合効果モデルは、色々な統計手法で用いられる数学モデルを一般化したものです。 そのため線形混合モデル用のソフトウェアを作成しておくと、そのソフトウェアを利用して色々な統計手法を行うことができます。 そこで既存の統計ソフトは線形混合効果モデルをサポートし、まるで万能ツールのように宣伝しています。 そのせいか医学論文などでも、往々にして「統計手法として線形混合効果モデルを用いた」と記述してしまうことがあるようです。
しかし上記の説明からわかるように線形混合効果モデルは数学モデルの名称であり、統計手法の名称ではありません。 線形混合効果モデル用のソフトウェアを用いた時は具体的なモデルを記述する必要がありますし、それが従来の統計手法に相当する時はモデル名ではなく統計手法の名称を記述するべきです。
また線形混合効果モデルは、普通は最尤法を用いて繰り返し計算による近似計算によって結果を求めます。 そのため従来の統計手法に相当する時は従来の統計手法よりも結果の信頼性が低くなり、しかもその手法独自の有用な情報を出力することができません。 したがってそのような時はその手法専用のソフトウェアを用いるのが賢明です。 「何でもできる万能ツール」というものは、えてして「中途半端で何にも使えない器用貧乏ツール」になってしまうものです。