Table3の「Overall」以下の行は層別解析(サブグループ解析)――被験者を年齢や性別で複数の層(グループ)に分けて解析する方法――の結果です。 でもこの臨床試験は実質的に第2相試験のため、層別解析を行うようにデザインされていません。 そもそも感染者が170例しかおらず、そのうちBNT162b2接種群の感染者はたった8例です。 この例数で層別解析を行うのは、統計学的にはほとんど無意味です。 したがって層別解析は、一応、第3相試験らしく見せかけるために実施しただけで、今後、詳細な研究を行うための参考程度と考えた方が良いと思います。
ただし層によって極端に偏った結果になっている項目はないので、BNT162b2は人によって効果が特に強かったり弱かったりすることはなく、一応、どんな人にも満遍なく有効である可能性が高いことを示唆しています。 (層別解析については当館の「統計学入門第8章第3節 8.3 共分散分析と層別解析」参照)
Figure3はプラセボ接種群(青色の折れ線)とBNT162b2接種群(赤色の折れ線)の累積感染率曲線です。 このグラフの横軸は1回目のワクチン接種からの経過日数(Days after Dose 1)であり、縦軸は累積感染率(Cumulative Incidence)(%)です。 そして感染者を「□」または「○」で、その中の重症者を「■」または「●」でプロットしてあり、累積感染率は生存時間解析でよく用いられるカプラン・マイヤー(Kaplan-Meier)法で計算しています。
生存時間解析の場合、縦軸の累積感染率のスケールは0〜100%にするのが普通です。 でもこのグラフではプラセボ接種群とBNT162b2接種群の差を目立たせるためにスケールを0〜2.4%にしています。 これはデータ解析屋の常套手段であり、僕もよくやります。
上部に描いてある拡大グラフは、1回目のワクチン接種から2回目のワクチン接種までの0〜21日間を拡大したものです。 この部分をわざわざ拡大したのはワクチンを1回摂取するだけでワクチン有効率がある程度(52.4%)あることを強調するためです。 (カプラン・マイヤー法については当館の「統計学入門第11章第1節 11.1 生存率の計算方法」参照)
Table2に記載されたワクチン有効率(95.0%)は、2回目のワクチン接種から7日後以後の罹患率に基づいています。 罹患率=ハザード=感染率/年はBNT162b2接種群が0.361%/年、プラセボ接種群が7.29%/年でした。 そのためFigure3の2本の累積感染率曲線について、28日時点の累積感染率を0%に平行移動し、(27+365)日後まで外挿すると、BNT162b2接種群の累積感染率が0.361%、プラセボ接種群の累積感染率が7.29%になるわけです。
グラフの下に記載してある「Efficacy End-Point Subgroup」は、観測期間を区切って、それぞれの期間でワクチン有効率(VE)と、その95%信頼区間(95% CI)を求めた結果です。 これは層別解析の一種ですが、それぞれの観測期間ごとの被験者数が少なくなってしまうので非効率です。
それよりも、せっかく累積感染率曲線を描いたのならコックス・マンテル検定(Cox-Mantel test)などでハザード比つまり罹患率の比を求め、その検定と推定を行えば良いのに……と、生存時間解析に馴染みのある人なら首をかしげると思います。 さらにTable3のような層別解析を行う代わりに、層別項目を共変数にしたパラメトリック生存時間解析やコックスの比例ハザードモデルによる重回帰型生存時間解析を行う方が合理的なのに……と思うでしょう。
カプラン・マイヤー法による累積感染率曲線を描いたのですから、ファイザーの解析担当者が生存時間解析を知らないはずはありません。 でも第5章で説明したようにワクチンの臨床試験は疫学分野の研究者が担当することが多く、疫学分野では生存時間解析をあまり利用しないのです。 そのためファイザーの解析担当者はワクチン開発分野の慣習に従って、あえてこのような効率の悪い解析を行っているのではないかと思います。 (コックス・マンテル検定と、パラメトリック生存時間解析と、コックスの比例ハザードモデルによる重回帰型生存時間解析については当館の「統計学入門第11章第2節 11.2 生存率の比較方法、統計学入門第11章第6節 11.6 パラメトリック生命表解析、統計学入門第11章第4節 11.4 比例ハザードモデル」参照)