玄関雑学の部屋雑学コーナー統計学入門

12.7 コホート分析

(1) コホート

第1章第8節で説明したようにコホート(cohort)とは共通した因子を持ち、時間を追って観察される集団のことです。 時間を追って連続観察されたデータは時系列データになるので、コホートを対象とした試験では時系列データがしばしば登場します。 (→1.8 科学的研究の種類とデザイン)

例えば同じ年または同じ期間内に生まれた人間をグループにし、それらのグループの血圧などを数年間観察して加齢変化を調査したとします。 この時、各グループは同一年または同一期間の生まれという共通した因子を持っているので出生コホート(birth cohort)と呼ばれます。 そして数年間にわたって連続測定された血圧は時系列データになります。

今、20歳から69歳までの被験者を10歳刻みでグループにし、それらのグループについて2000年から2009年までの10年間にわたって血圧と体重を測定し、それを平均した結果が表12.7.1のようになったとします。 この各グループは10年間という同一期間に生まれたので出生コホートになります。

表12.7.1 コホート別収縮期血圧と体重
コホート開始時年齢 例数収縮期血圧
2000年2001年2002年2003年2004年 2005年2006年2007年2008年2009年
120-29100 105.5105.1105.3105.2104.8 104.6104.4105.3105.7105.8
230-39100 109.9110.9110.7110.1110.2 110.9110.1110.9110.2110.9
340-49100 114.8114.7115.5115.1114.4 114.3114.5115.0114.9115.0
450-59100 120.6119.8120.4120.2120.4 120.6120.1120.6120.2120.5
560-69100 124.2124.3125.6124.1124.1 124.2125.0125.6125.8125.1
全体20-69500 115.0115.0115.5114.9114.8 114.9114.8115.5115.4115.5
コホート開始時年齢 例数体重
2000年2001年2002年2003年2004年 2005年2006年2007年2008年2009年
120-29100 55.055.255.555.956.2 57.057.358.258.559.0
230-39100 60.060.360.961.462.5 63.263.564.264.564.6
340-49100 65.065.365.365.465.9 66.065.865.965.465.5
450-59100 65.065.164.663.663.5 62.962.161.960.660.4
560-69100 60.059.859.058.557.5 57.456.956.356.256.0
全体20-69500 61.061.161.161.061.1 61.361.161.361.061.1

表12.7.1の全体の平均値を折れ線グラフで表すと、図12.7.1と図12.7.2のようになります。 これらのグラフでは血圧も体重も経年変化はほとんどないように見えます。

図12.7.1 収縮期血圧の経年変化 図12.7.2 体重の経年変化

また年齢と収縮期血圧の関係および年齢と体重との関係を検討するために、各コホートの2000年の開始時年齢と収縮期血圧の平均値および2000年の開始時年齢と体重の平均値をプロットすると図12.7.3と図12.7.4のようになります。 これらのグラフでは血圧は高齢になるにしたがって上昇し、体重は40〜50歳をピークにして、その前後は減少しているように見えます。 なおこれらのグラフでは、各コホートの開始時年齢として便宜的に各コホートの最も若い年齢を用いています。

図12.7.3 年齢と収縮期血圧の関係 図12.7.4 年齢と体重の関係

図12.7.1と図12.7.2、図12.7.3と図12.7.4を比べると、これらのグラフはお互いに矛盾しているように見えるので血圧と体重の加齢変化は本当はどうなっているのか判断に苦しむと思います。

(2) コホート分析

このような時は図12.7.5と図12.7.6のようなコホート別加齢変化グラフを描くと、血圧と体重の加齢変化を正確に表現することができます。 これらの図は横軸に年齢、縦軸に血圧または体重をとり、コホート別に平均値を折れ線で描いたものです。

図12.7.5 収縮期血圧のコホート別加齢変化グラフ 図12.7.6 体重のコホート別加齢変化グラフ

図12.7.5から、血圧は加齢変化はほとんどないものの、古い時代に生まれた被験者ほど血圧が高いことがわかります。 このことから血圧は生まれ育った時代の社会環境によって高低が決まり、ある程度の年齢になった後はあまり変化しないと推測できます。 つまり昔は食塩摂取量が多く、そのような社会環境で育った人はベースの血圧が高くなります。 そしてその後、社会環境が変化して食塩摂取量が減少していったので、後から生まれた人ほどベースの血圧が低くなったというわけです。 このような場合は、ある時点で色々な年齢の被験者の血圧を横断的に観測し、図12.7.3のように年齢と血圧の関係をプロットすると見かけ上の関連性が生じてしまいます。

一方、図12.7.6から、体重は40〜50歳の中年をピークとしたベル型の加齢変化をし、それは生まれた時代の影響をほとんど受けないと推測できます。 つまりいつの時代でも、人は中年太りに悩まされるというわけです。

もちろん表12.7.1のデータはコホート別加齢変化グラフの特徴を強調するために作為的に作ったものであり、実際の血圧と体重の加齢変化を正確に表しているわけではありません。 しかしこのようなデータは実際にも有り得るものであり、そのような場合は図12.7.5と図12.7.6のようなグラフを利用して、加齢変化と環境の変化を分離して検討する必要のあることがわかると思います。

コホート別加齢変化グラフには加齢変化と環境の変化の有無によって色々なパターンがあります。 その中の基本的なパターンを模式的に表すと図12.7.7のようになります。

図12.7.7 コホート別加齢変化グラフの各種パターン

(1)は加齢変化も環境の変化もない時の最も単純なパターンです。 (2)は加齢変化があり、時代的な社会環境の変化も観測中の環境変化もない時のパターンであり、図12.7.6はこのパターンに相当します。 (3)は加齢変化はなく、時代的な社会環境の変化がある時のパターンであり、図12.7.5はこのパターンに相当します。

(4)は加齢変化はなく、観測中の環境変化がある時のパターンです。 例えば観測中に急激に社会環境が変化した時とか、観測対象に対して介入をした時などにこのようなパターンになります。 また観測途中で項目の測定法が変わると、全てのコホートのグラフが途中でよく似たパターンの急激な変化をすることがあります。 この場合は図12.7.1や図12.7.2のようなグラフを描くことによって環境の変化または介入の効果を検討することができます。 一般的な臨床試験は、このパターンを想定して治療効果を検討します。

実際のデータは、これらの基本的なパターンを組み合わせた様々なパターンになります。 そしてそのパターンを注意深く検討すれば、加齢変化と環境の変化について様々な情報を得ることができます。 このコホート別加齢変化グラフのように、時系列データをコホート別に集計し、コホート内の変化を検討したり、コホート間で色々な比較したりする分析法のことをコホート分析(cohort analysis)といいます。 コホート分析は主として疫学分野で利用されます。