玄関雑学の部屋雑学コーナーワクチンの有効性と安全性

3.ワクチン有効率

論文のTable2には主要評価項目(primary end point)であるワクチン有効率VE(vaccine efficacy)が記載されています。 そして「METHODS」中の「EFFICACY」によると、この臨床試験は次のような2種類の主要評価項目を設定しています。

  1. COVID-19感染の既往の無い被験者36,523例を対象にし、2回目のワクチン接種から少なくとも7日以後に発症した被験者を「COVID-19発症者」とした時のワクチン有効率(Table2の上段の結果)
    ・BNT162b2接種群:例数=18,198 感染例数=8 観測期間(Surveillance Time)=2.214(追跡例数=17,411)
    ・プラセボ接種群:例数=18,325 感染例数=162 観測期間=2.222(追跡例数=17,511)
     ワクチン有効率=95.0% 95%ベイズ信用区間(Credible Interval)=90.3-97.6%
     ワクチン有効率が30%より大きい事後確率(Posterior Porbability)>0.9999
  2. COVID-19感染の既往の有無を問わずに被験者40,137例を対象にし、2回目のワクチン接種から少なくとも7日以後に発症した被験者を「COVID-19発症者」とした時のワクチン有効率(Table2の下段の結果)
    ・BNT162b2接種群:例数=19,965 感染例数=9 観測期間(Surveillance Time)=2.332(追跡例数=18,559)
    ・プラセボ接種群:例数=20,172 感染例数=169 観測期間=2.345(追跡例数=18,708)
     ワクチン有効率=94.6% 95%ベイズ信用区間(Credible Interval)=89.9-97.3%
     ワクチン有効率が30%より大きい事後確率(Posterior Porbability)>0.9999

これら2種類のワクチン有効率の違いは、1番がCOVID-19感染の既往の無い被験者だけを対象にした時の結果であり、2番がCOVID-19感染の既往が有る被験者も含めて対象にした時の結果です。 COVID-19感染の既往が有る被験者は抗体ができていて、感染しない可能性が高くなります。 そのためそのような被験者を含めるとプラセボ接種群の感染率は低くなり、BNT162b2接種群の感染率はあまり変わらないと考えられます。 その結果、2群の感染率の差が小さくなり、BNT162b2接種群のワクチン有効率が低くなります。

実際の医療現場では、すでにCOVID-19に感染したにもかかわらず無症状のために気が付かなかった人が、まだ感染していないと思ってワクチン接種を受けることは大いに有り得ます。 そのため実際の医療現場におけるワクチン有効率は2番の有効率に近いと考えられます。

医薬品開発では、第2相までは結果の精度を重視するので1番のようなワクチン有効率を採用します。 しかし第3相は結果の普遍性(一般化できる可能性)を重視するので、実際の臨床現場に近い2番のようなワクチン有効率を採用するのが普通です。 このBNT162b2治験は第1/2/3相試験であり、感染者の例数(2番の感染者数合計は178例)からすると実質的に第2相試験に相当します。 第3相試験なら感染者が少なくとも500例以上、できれば1000例程度欲しいところです。 しかしパンデミックという緊急事態中のため、178例という感染者数であるにもかかわらず強引に第3相扱いしています。

それに対する批判を考慮して、この臨床試験では第2相で採用する1番のワクチン有効率と、第3相で採用する2番のワクチン有効率の2つをわざわざ主要評価項目として設定したのではないかと思います。 そしてワクチン有効率を少しでも高く見せるために、第1主要評価項目を1番のワクチン有効率にし、第2主要評価項目を2番のワクチン有効率にしたのではないかと思います(主要評価項目は試験計画段階で設定することに注意!)。

もし僕がこの臨床試験にデータ解析屋として関わっていたら、やはり2種類の主要評価項目を設定し、第1主要評価項目を2番のワクチン有効率にし、第2主要評価項目を1番のワクチン有効率にするように提案したと思います。 でもその提案が採用される可能性は低く、2種類の主要評価項目の優先順序は、おそらくこの臨床試験と同じようになったのではないかと思います。

一般に、インフルエンザワクチンのワクチン有効率は60〜90%程度と言われています。 インフルエンザはたいてい毎年流行し、そのたびにワクチンを接種します。 その理由は、インフルエンザの免疫が6ヶ月程度で消失してしまうからです。 でも基礎的な免疫はある程度残ると考えられています。 そのためインフルエンザは基礎免疫を持っている人が多く、ワクチンを接種しない群の感染率が低くなってワクチン有効率が低くなりがちです。

それに対して麻疹ワクチンのワクチン有効率は80〜95%程度と言われています。 麻疹は1度免疫ができてしまえば、だいたい一生有効です。 そのため免疫を持っている人は臨床試験に参加せず、ワクチンを接種しない群の感染率が高くて本来のワクチン有効率が観察できます。 その結果、インフルエンザワクチンに比べてワクチン有効率が高くなると考えられています。

これらのワクチン有効率と比較すると、BNT162b2のワクチン有効率95.0%は最も高い方になります。 その理由は、現在はCOVID-19の免疫を持っている人がほとんどおらず、本来のワクチン有効率が観察できているからと考えられます。

ワクチン有効率は2群の感染率に基づいて求めます。 そして感染率には次のような3種類の計算方法があります。

  1. 有病率(prevalence):ある時点において対象集団の中で疾患(この場合は感染症)に罹患している人の割合
    有病率(P)=疾患に罹患している人の例数/対象集団の例数
  2. 累積罹患率(cumulative incidence):対象集団の中で一定の観測期間内に疾患に罹患した人の割合
    累積罹患率(CI)=観測期間内の疾患発症数/観測開始時の対象集団の例数
  3. 罹患率(incidence):対象集団の中で一定の観測期間内に疾患に罹患した人の単位時間あたりの割合
    罹患率(I)=観測期間内の疾患発症数/対象集団の観測時間合計

「対象集団の観測時間合計」は対象集団の一人一人の観測時間を合計した値であり、「人時間(person-time)」という単位で表します。 そのため疫学分野では罹患率のことを人時間に基づく罹患率(person-time incidence rate)と呼んでIR_P-Tという記号で表したり、罹患密度(incidence density)または罹患力(force of morbidity)と呼んだりします。 また腫瘍の解析に用いる生存時間解析では罹患率のことを瞬間危険率(瞬間死亡率)またはハザード(hazard)といい、データ解析屋は主にこちらの用語を用います。 (罹患率とハザードの関係については当館の「統計学入門・第11章第6節 11.6 パラメトリック生命表解析」参照)

以上の3種類の感染率は1番→3番の順に信頼性が高くなり、同時に観測するのが難しくなります。 1番の有病率は簡単に観測できるので、インフルエンザワクチンのワクチン有効率を検査陰性デザイン(test-negative design)を用いた症例対照研究(case-control study)によって調査する時などに利用されます。 2番の累積罹患率は世間一般の人達が「感染率」という言葉でイメージすることが多い、素人向けの値です。 3番の罹患率はワクチン開発などでワクチン有効率を厳密に評価する時に用いられる、専門家向けの値です。

一般に感染者数と観測期間は比例し、観測期間が長ければ感染者数は多くなり、短ければ少なくなります。 そのため単位時間あたりの感染率を表す3番の罹患率が最も公平で信頼性が高いと考えられます。

ワクチン有効率はプラセボ接種群の感染率とBNT162b2接種群の感染率の差をプラセボ接種群の感染率で割った値であり、次のように定義されています。

ワクチン有効率 = プラセボ接種群の感染率−BNT162b2接種群の感染率 プラセボ接種群の感染率 = 1 - BNT162b2接種群の感染率 プラセボ接種群の感染率

感染率として累積罹患率を用いた時、ワクチン有効率は次のようになります。

ワクチン有効率 = プラセボ接種群の累積罹患率−BNT162b2接種群の累積罹患率 プラセボ接種群の累積罹患率 = 1 - RR = RRR

RR(Relative Risk)相対危険度(相対リスク)のことで、RRR(Relative Risk Reduction)相対危険度減少率のことです。 この指標は疫学分野で用いられるものであり、累積罹患率が異なっても同じ値になることがあります。 そのためデータ解析屋は実際の累積罹患率と、次のような絶対危険度減少率(Absolute Risk Reduction)を必ず併記します。 (相対危険度減少率と絶対危険度減少率については当館の「統計学入門・第1章第9節 1.9 科学的研究のデザイン (3) 実験的研究」参照)

絶対危険度減少率:ARR=プラセボ接種群の累積罹患率−BNT162b2接種群の累積罹患率

また感染率として罹患率を用いた時、ワクチン有効率は次のようになります。

ワクチン有効率 = プラセボ接種群の罹患率−BNT162b2接種群の罹患率 プラセボ接種群の罹患率 = 1 - HR

ハザード比HR(Hazard Ratio)2群のハザードつまり瞬間危険率(単位時間あたりの危険率、この場合は罹患率)の比のことで、生存時間解析で用いる指標です。 ハザード比もハザードが異なっても同じ値になることがあるので、実際のハザードと2群のハザード差HD(Hazard Difference)を必ず併記します。 (ハザード比については当館の「統計学入門・第11章第6節 11.6 パラメトリック生命表解析」参照)

ハザード差:HD=プラセボ接種群のハザード(罹患率)−BNT162b2接種群のハザード(罹患率)

この2通りの計算方法でTable2の上段の感染率とワクチン有効率を求めると次のようになります。

・BNT162b2接種群
 累積罹患率=8/18198=0.00044(0.044%) → 0.44人/1000人
 罹患率=8/2214=0.00361/年(0.361%/年) → 8/2.214=3.61/1000人/1年(1000人年単位)
 ※一人の被験者の平均追跡時間=2214×365/17411≒46日
・プラセボ接種群
 累積罹患率=162/18325=0.00884(0.884%) → 8.84人/1000人
 罹患率=162/2222=0.0729/年(7.29%/年) → 162/2.222=72.9人/1000人/1年(1000人年単位)
 ※一人の被験者の平均追跡時間=2222×365/17511≒46日
・累積罹患率を用いたワクチン有効率(RRR)=1-0.00044/0.00884≒1-0.050=0.950(95.0%)
 絶対危険度減少率:ARR=0.00884-0.00044=0.0084(0.84%)
・罹患率を用いたワクチン有効率(1-ハザード比)=1-0.00361/0.0729≒1-0.050=0.950(95.0%)
 BNT162b2接種群とプラセボ接種群のハザード差:HD=0.0729-0.00361≒0.0693(6.93%)

BNT162b2接種群の場合、Table2の「観測期間(Surveillance Time)=2.214」が観測時間合計です。 ただしこの数値は1000人年単位(1000 person-years)です。 つまりBNT162b2接種群18,198例の中で追跡できた被験者(ar risk)が17,411例あり、その人達の観測時間を合計すると2,214年になり、これを1000人あたりにすると2.214年になるというわけです。 観測期間を1000人あたりにするのは、罹患率を現実的な数字にして実感しやすくするためです。

ちなみに2,214年は808,110日ですから808110/17411≒46日になり、1人の被験者の平均追跡期間は約46日になります。 そして累積罹患率が0.044%しかないのに罹患率が0.361%もあるのは、前者が約46/365=0.126年間の累積感染率を求めているのに対して、後者は1年間の累積感染率を求めているからです。

この臨床試験の場合、2群の観察期間がほとんど同じなので、累積罹患率を用いても罹患率を用いてもワクチン有効率はほとんど同じです。 でも絶対危険度減少率とハザード差は10倍ほどの違いがあり、受ける印象がかなり違います。 そして「ワクチン有効率は95%である」という表現と、「ワクチンによって累積罹患率が約0.8%低下する」または「ワクチンによって罹患率が約7%低下する」という表現は受ける印象がメチャクチャ違うと思います。 そのためデータ解析屋としては、Table2に2群の罹患率と罹患率の差を併記して欲しいところです。

ちなみに2020年末におけるアメリカの累積感染者数つまり罹患率は約573人/1万人/年=57.3人/1000人/1年(実数は約1,900万人)でした。 したがってこの臨床試験におけるプラセボ接種群の罹患率72.9人/1000人/1年は、アメリカの罹患率よりも少し高いと考えられます。 これは臨床試験であり、被験者の感染チェックをしっかり行っているので罹患率がこれくらい高くなっても不思議ではないと思います。

一方、2020年末における日本の累積感染数つまり罹患率は約18人/1万人/年=1.8人/1000人/1年(実数は約22万人)でした。 それに対してBNT162b2接種群の罹患率は3.61人/1000人/1年です。 したがってアメリカの全国民がBNT162b2を接種して罹患率が3.61人/1000人/1年に激減し、

「我々はCOVID-19に打ち勝った!」

と喜んだとしても、日本の罹患率はその半分程度であり、ワクチンを接種せずにCOVID-19に打ち勝っていることになります。