玄関雑学の部屋雑学コーナー統計学入門

12.8 時系列回帰分析

(1) 単純な時系列回帰分析

第2節で説明した周期回帰分析の原理は周期関数を一般的な関数にしても同じように成り立ちます。 そこでそのような手法を時系列回帰分析(time series regression analysis)と呼ぶことにしましょう。 例として表12.1.1の平均値に最も簡単な一次関数つまり直線を用いた時系列回帰分析を適用すると次のようになります。 (注1)

表12.8.1 収縮期血圧の時系列回帰分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
回帰3231.513231.58.91206
残差7977.1622362.598 
全体11208.723 
時系列回帰式:y = 109.66 + 1.6763t
寄与率:r2 = 0.288(28.8%)
回帰の検定:Fβ = 8.91206(p = 0.0068) > F(1,22,0.05) = 4.301 … 有意水準5%で有意
図12.8.1 収縮期血圧の経年変化

これは時間を説明変数にし、収縮期血圧平均値を目的変数にした回帰分析であり、時系列回帰直線は普通の回帰直線と同じように解釈できるのでわかりやすいと思います。 この場合の時系列回帰直線は収縮期血圧の周期変動ではなく、時間的な上昇(または下降)傾向つまりトレンドを表すものになります。 このデータは本来は日内変動を検討するためのものなので、時間的なトレンドはあまり意味がありません。 しかしデータが何日間も連続して測定されていれば、この時系列回帰直線と周期回帰曲線を組み合わせることによって日内変動と長期的なトレンドを合わせて分析することができます。 そのため繰り返し測定データの評価方法のひとつとして利用することができます。 (→4.3 繰り返しのある多標本・多時期の計量値 (5) 繰り返し測定データの評価方法)

(2) 二元配置型時系列回帰分析

次に表12.1.1を被験者と時期を要因にした二元配置型データと捉えて、直線を用いた二元配置型時系列回帰分析を適用すると次のようになります。 (注2)

表12.8.2 収縮期血圧の二元配置型時系列回帰分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
回帰6462.9916462.9959.6988
ズレ15954.322725.1966.69866
時期22417.323974.6669.00301
被験者275.5211275.5212.54499
残差2489.9823108.26 
全体25182.847 
○回帰
時系列回帰式:y = 109.66 + 1.6763t
平均値の変動に対する寄与率:r2 = 0.288(28.8%)
Fβ = 59.6988(p = 7.7496×10-8) > F(1,22,0.05) = 4.301 … 有意水準5%で有意
○ズレ:時系列回帰直線と平均値のズレ(LOF:Lack Of Fit)
FLOF = 6.69866(p = 1.2783×10-5) > F(22,23,0.05) = 2.025 … 有意水準5%で有意
○時期:二元配置分散分析における要因B
FP = 9.00301(p = 7.9257×10-7) > F(23,23,0.05) = 2.014 … 有意水準5%で有意
○被験者:二元配置分散分析における要因A
FSUB = 2.54499(p = 0.1243) < F(1,23,0.05) = 4.279 … 有意水準5%で有意ではない

単純な時系列回帰分析の結果と比較すると、時系列回帰式と寄与率は同じですが、回帰の分散比が非常に大きくなり、ズレの分散比も大きくなっています。 表12.1.1のデータは日内変動を検討するためのものなので、ズレが大きいのは致し方ありません。 そして表12.8.2と第3節の表12.3.2を比較すると、「時期」以下の二元配置分散分析に相当する部分は同じであることがわかります。 この解析では周期回帰曲線の代わりに直線を当てはめただけなので、二元配置分散分析に相当する部分は変わらないのです。

(3) 一元配置型時系列回帰分析

次は表12.1.1を測定時点ごとに独立した被験者で測定された一元配置型データと捉えて、直線を用いた一元配置型時系列回帰分析を適用すると次のようになります。 (注3)

表12.8.3 収縮期血圧の一元配置型時系列回帰分析表
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
回帰6462.9916462.9956.0882
ズレ15954.322725.1966.29351
時期22417.323974.6668.4585
残差2765.524115.229 
全体25182.847 
○回帰
時系列回帰式:y = 109.66 + 1.6763t
平均値の変動に対する寄与率:r2 = 0.288(28.8%)
Fβ = 56.0882(p = 9.9422×10-8) > F(1,22,0.05) = 4.301 … 有意水準5%で有意
○ズレ
FLOF = 6.29351(p = 1.6243×10-5) > F(22,24,0.05) = 2.003 … 有意水準5%で有意
○時期:一元配置分散分析における要因A
FP = 8.459(p = 9.457×10-7) > F(23,24,0.05) = 1.993 … 有意水準5%で有意

二元配置型時系列回帰分析の結果と比較すると、やはり時系列回帰式と寄与率は同じですが、回帰の分散比もズレの分散比も少し小さくなっています。 そして表12.8.3と第3節の表12.3.4を比較すると、「時期」以下の一元配置分散分析に相当する部分は同じであることがわかります。 この手法は一元配置型周期回帰分析と同様に、欠測値のある被験者を解析対象にすることができます。 ただし欠測値が多いと平均値の変動が時間によるものか被検者の違いによるものか厳密には区別できないという欠点を持つことも、一元配置型周期回帰分析と同様です。

ちなみにこの手法と同じ原理を用い、時期の代わりに用量を用いたものが用量反応解析で用いられる用量反応直線です。 用量反応解析については第13章で説明します。 (→第13章 用量反応解析)


(注1) 単純な時系列回帰分析で用いる時系列回帰モデルは一般的な重回帰モデルと同じであり、次のように記述できます。

重回帰モデル(時系列回帰式):
  
        

直線を用いた時系列回帰モデルは説明変数xが1つだけで、x1 = t(時期)にした単回帰分析になります。 そして2番目以降の説明変数に第2節の(注1)で説明した周期成分を入れてx2 = cos(ω1t)、x3 = sin(ω1t)、…、x2m = cos(ωmt)、x2m+1 = sin(ωmt)とすると、時間的なトレンドと周期変動を組み合わせた時系列回帰モデルになります。 そのような時系列回帰モデルは、例えば長期間に渡る血圧の変動をトレンドと日内変動に分離して分析する時などに用いることができます。

上記の時系列モデルの解析方法は第2節の(注1)で説明した解析方法と同じです。 表12.1.1の平均値について、x1 = tだけを入れたモデルを用いて実際に計算してみましょう。

        
Syy = 11208.7  φy = 23   SR = 7977.16  φR = 23 - 1 = 22   
Sβ = 11208.7 - 7977.16 = 3231.5  φβ = 1   Vβ = 3231.5  

これらの値を用いて表12.8.1の時系列回帰分析表を作成することができます。

(注2) 二元配置型時系列回帰分析を適用する一般的データは第3節(注1)の表12.2.5と同じであり、基本式も同様に記述することができます。

表12.8.4 二元配置型
時系列回帰分析の一般的データ
被験者時期平均
t1tjtp
1y11y1jy1pm1.
:::::
iyi1yijyipmi.
:::::
nyn1ynjynpmn.
平均m.1m.jm.pmT
基本式:
:時系列回帰式による推定値
時系列回帰式:
総例数:N = np
全体:  φT = N - 1   
時期:  φP = p - 1   
回帰:   
  φβ = q  
ズレ:   φLOF = φP - φβ   
被験者:   φSUB = n - 1  
残差:
φR = φT - φP - φSUB = φP×φSUB   
重寄与率:

表12.1.1のデータについて、x1 = tだけを入れたモデルを用いて実際に計算してみましょう。

        
ST = 1072 + … + 1012 - 48×128.93752=823177 - 797994.2 = 25182.8   φT = 48 - 1 = 47
SP = 2×103.52 + … + 2×1122 - 48×128.93752 = 820411.53 - 797994.2 = 22417.33
φP = 24 - 1 = 23   
Sβ = 2×3231.495 = 6462.99   φβ = 1  Vβ = 6462.99
SLOF = 22417.33 - 6462.99 = 15954.3   φLOF = 23 - 1=22  
SSUB = 24×126.54172 + 24×131.33332 - 48×128.93752 = 798269.721 - 797994.2 = 275.521
φSUB=2 - 1=1  VSUB=275.521
SR = 25182.8-22417.33 - 275.521 = 2489.979   φR = 47 - 23 - 1 = 23
  

これらの値を用いて表12.8.2の時系列回帰分析表を作成することができます。

(注3) 一元配置型時系列回帰分析を適用する一般的データは第3節(注2)の表12.2.7と同じであり、基本式も同様に記述することができます。

表12.8.5 一元配置型
時系列回帰分析の一般的データ
被験者時期平均
t1tjtp
1y11y1jy1p
::::
iyi1yijyip
::::
njyn1・1ynj・jynp・p
平均m.1m.jm.pmT
※njは時期ごとに異なっていても良い
基本式:
:時系列回帰式による推定値
時系列回帰式:
総例数:
全体:  φT = N - 1   
時期:  φP = p - 1   
回帰:   
  φβ = q  
ズレ:   φLOF = φP - φβ   
残差:   φR = φT - φP   
重寄与率:

表12.1.1のデータについて、x1 = tだけを入れたモデルを用いて実際に計算してみましょう。

        
ST = 1072 + … + 1012 - 48×128.93752 = 823177 - 797994.2 = 25182.8   φT = 48 - 1 = 47
SP = 2×103.52 + … + 2×1122 - 48×128.93752 = 820411.53 - 797994.2 = 22417.33
φP = 24 - 1 = 23   
Sβ = 2×3231.495 = 6462.99   φβ = 1  Vβ = 6462.99
SLOF = 22417.33 - 6462.99 = 15954.3  φLOF = 23 - 1=22   
SR = 25182.8 - 22417.33 = 2765.47  φR = 47 - 23 = 24   

これらの値を用いて表12.8.3の時系列回帰分析表を作成することができます。