前口上 | 目次 | 第1章 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 | 第9章 | 第10章 |
第11章 | 第12章 | 第13章 | 第14章 | 第15章 | 第16章 | 第17章 | 第18章 | 第19章 | 第20章 | 付録 |
1 | 2 | 3-1 | 3-2 | 3-3 | 3-4 | 3-5 | 3-6 | 3-7 | 3-8 | 3-9 | 4 | 5 |
後発医薬品——先発医薬品の特許が切れるとゾロゾロ出てくるので、業界用語でゾロ品といいます。 でもイメージが悪いので、表向きはジェネリック医薬品と言い換えています(^_-)——が先発医薬品と同じ薬効を持つことを検証する試験として、生物学的同等性試験(Bioequivalence Study、BE試験、生同試験)というものがあります。 通常、この試験では薬物動態学的指標を比較することによって、先発品と後発品の生物学的な同等性を検証します。
本来は先発品と後発品の薬効を比較すべきですが、薬効の比較には大規模な臨床試験が必要であり、開発費が少ないことがメリットであるゾロ品でそれを行うのは困難です。 そこで薬物動態学的指標が同じなら薬効も同じだろうという想定のもとに、薬物動態学的指標を代理評価指標にした試験を行うのです。
BE試験では主として曲線下面積AUC、最大血中濃度Cmax、最大血中濃度時間tmaxを評価指標にします。 しかしこれらの指標をコンパートメントモデルを利用して求めるのは面倒なので、通常は実際のデータから近似的に求めます。 例えば第3節の表14.3.3のデータでは次のようになります。
時間(hr) | 0.07 | 0.32 | 0.57 | 0.72 | 1.07 | 1.57 | 2.07 | 2.57 | 3.57 | 4.57 | 5.57 |
---|---|---|---|---|---|---|---|---|---|---|---|
血中濃度 | 8.79 | 20 | 21.3 | 17 | 10.7 | 6.46 | 3.72 | 2.47 | 1.17 | 0.64 | 0.41 |
通常、BE試験は先発品を対照薬、後発品を試験薬として、クロスオーバーデザイン(cross-over design)で行います。 クロスオーバーデザインとは、表14.5.1のように同一の被験者に時期を変えて対照薬と試験薬を投与し、効率的な比較を行おうというデザインです。 このデザインでは被験者を無作為に2群に分け、一方の群は対照薬→試験薬の順で投与し、もう一方の群は試験薬→対照薬の順に投与し、同じ時期に対照薬と試験薬を投与します。 このように2つの薬剤をクロスして投与することによって、季節変動などで投与時期によって薬効が異なるという現象つまり時期効果を打ち消すことができます。
群 | 第1期 | 第2期 |
---|---|---|
群I:対照薬先行群 | 対照薬投与 | 試験薬投与 |
群II:試験薬先行群 | 試験薬投与 | 対照薬投与 |
このデザインは、先に投与した薬剤が後から投与する薬剤の効果に影響を及ぼすという現象つまり持ち越し効果がある時は公平な比較ができません。 例えば試験薬は原因療法であり、疾患を完治して被験者を健常人にするのに対して、対照薬は対症療法であり、薬剤を投与している間だけ被験者を一時的に健常人にする効果があるとします。 その場合、対照薬先行群では第1期は一時的に効果があるものの、それは第2期の試験薬の効果に影響を及ぼしません。 しかし試験薬先行群では第1期で被験者が完治してしまい、その効果が第2期にも持ち越されて対照薬の効果に影響を及ぼします。 その結果、対照薬の効果が本来の効果よりも過大に評価され、公平な比較ができません。
そもそも薬剤は疾患を完治して病人を健常人にするのが本来の目的です。 そのため持ち越し効果があるのが普通であり、持ち越し効果のない薬剤は良い薬剤とはいえません。 実際、現実の治療現場では最初に効果の強い薬剤を投与して疾患をある程度治療し、その後は効果は弱いものの副作用が少ない薬剤を長期間投与してじっくりと治療するという治療を行うことがよくあります。 これは、まさに薬剤の持ち越し効果を利用した治療法です。
このような理由から、一般的な臨床試験でこのザインが用いられることはほとんどありません。 しかし薬物が体内に蓄積されず、一定時間で体外に完全に排出される薬剤の場合、薬物の血中濃度に関してだけは持ち越し効果はないと考えられます。 そのためBE試験では、通常はクロスオーバーデザインが用いられます。
クロスオーバーデザインのモデルは少々ややこしいので、模式図によってその内容と解析方法を考えてみましょう。 話を簡単にするために、ここでは対照薬を薬効のないプラセボとします。
このモデルでは次のような3種類の効果を検討することができます。
上記の式から、クロスオーバーデザインによって薬剤効果を純粋に検出できるのは対照薬と試験薬の持ち越し効果が無いか、もしくは同等の時に限られることがわかります。 そして対照薬先行群と試験薬先行群の背景因子を群間比較し、それが同等なら順序効果は持ち越し効果の差だけになり、持ち越し効果の差を純粋に検出できます。 したがって対照薬先行群と試験薬先行群の背景因子が同等で、かつ順序効果が無ければ薬剤効果を純粋に検出することができます。 なおこれらの効果は本来の効果(βII - βI)、(τ2 - τ1)、αを2倍したものなので、信頼区間を計算する時に注意が必要です。
これらの効果の検出には、どれも2標本t検定とそれに対応する区間推定を適用することができます。 しかしこれらの分析を総合的に行うためのクロスオーバー用分散分析が開発されているので、普通はその手法を適用します。 ただしクロスオーバー用分散分析は対照薬先行群と試験薬先行群の例数が等しいという前提で組み立てられています。 そのため2群の例数が異なる時は2標本t検定とそれに対応する区間推定を用いる方が無難です。 でも検定と推定は2群の例数が同じ時に最も効率が高くなるので、クロスオーバーデザインでは2群の例数をできるだけ揃えることが大切です。
今、先発品Aを対照薬、後発品Bを試験薬にして、18名の被験者を無作為に9例ずつの2群に分け、それぞれ対照薬先行群と試験薬先行群にしてクロスオーバーデザインのBE試験を行ったとします。 そして18名の血中濃度データに基いて台形法でAUC求めたところ、表14.5.2のようになったとします。
群 | 被験者ID | 第1期 | 第2期 |
---|---|---|---|
対照薬先行群 (A→B) | 101 | 101.245 | 162.947 |
102 | 132.748 | 180.26 | |
103 | 214.553 | 212.685 | |
104 | 99.9775 | 147.795 | |
105 | 101.175 | 98.45 | |
106 | 165.27 | 236.787 | |
107 | 158.31 | 185.81 | |
108 | 181.073 | 217.873 | |
109 | 94.0075 | 140.327 | |
試験薬先行群 (B→A) | 201 | 88.415 | 136.037 |
202 | 162.817 | 208.84 | |
203 | 182.82 | 151.745 | |
204 | 107.745 | 202.25 | |
205 | 151.98 | 223.492 | |
206 | 138.627 | 168.692 | |
207 | 183.407 | 236 | |
208 | 117.1 | 165.695 | |
209 | 99.88 | 159.17 |
このデータにクロスオーバー用分散分析を適用すると、次のような結果になります。 (注1)
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
順序効果 | 79.2664 | 1 | 79.2664 | 0.0297297 |
被験者残差 | 42659.7 | 16 | 2666.23 | |
被験者 | 42739 | 17 | 2514.06 | 5.46556 |
時期効果 | 15779.8 | 1 | 15779.8 | 34.3052 |
薬剤効果 | 198.599 | 1 | 198.599 | 0.431753 |
残差 | 7359.7 | 16 | 459.981 | |
全体 | 66077 | 35 |
BE試験の場合、原則として順序効果はないという前提でクロスオーバーデザインを採用します。 そして対照薬先行群と試験薬先行群の例数を同じにします。 2群の例数が異なっても薬剤効果から時期効果を取り除くことができますが、順序効果と時期効果と薬剤効果の間に関連性が生じるので好ましくありません。 また合計例数が一定なら2群の例数が同じ時に効率が最も高くなるので、できるだけ例数を同じにします。
結果は対照薬と試験薬のAUC平均値の差の90%信頼区間が、対照薬のAUC平均値に対する比として±0.20(±20%)の範囲内に入っていれば生物学的に同等と評価します。 上記の結果ではAUC平均値の差の90%信頼区間はその範囲内に入っているので、生物学的に同等と評価されます。 また90%信頼区間つまり区間推定の代わりに統計的仮説検定を用い、薬剤効果の検定結果が有意水準10%で有意でなければ生物学的に同等と評価する時もあります。 上記の検定は全て有意水準10%で検定していますが、これは90%信頼区間つまり信頼係数を90%にすることに対応したものです。
信頼区間で同等性を評価する時も、統計的仮説検定で同等性を評価する時も、事前に信頼係数または有意水準と検出力、そして検出差を決め、母標準偏差を推測して、必要例数を求めてから試験を実施する必要があります。 BE試験の場合は原則として信頼係数を90%、有意水準を10%、検出力を80%とし、検出差を対照薬のAUC平均値に対する比として±0.20(±20%)にします。 そして母標準偏差は先行研究の結果や予備試験の結果から推測します。 (注2)
統計的仮説検定で結果が有意でなければ、「『AUC平均値の差は検出差未満である』ということが80%の確率で断言できる」ということになります。 しかし検定結果が有意の時は「『AUC平均値の差が0ではない』ということが90%以上の確率で断言できる」ということになり、「『AUC平均値の差が検出差以上である』ということが90%以上の確率で断言できる」という意味ではありません。 そのためたとえ検定結果が有意になっても、90%信頼区間が検出差の範囲内に入っていれば同等と評価できます。 したがって、やはり検定結果ではなく推定結果で同等性を評価する方が理にかなっています。 (→1.7 ハンディキャップ方式の検定 (注2))
BE試験ではあまり問題になりませんが、薬剤効果を正当に評価するためには本来は順序効果があるかどうかを検討する必要があります。 BE試験に限らずクロスオーバーデザインを用いた試験では、順序効果の検定結果が有意水準10〜20%程度で有意にならなければ「順序効果はない」と評価することがよくあります。 しかしこの場合も検定ではなく、順序効果の信頼区間が許容範囲内に入っているかどうかで順序効果の有無を評価する方が理にかなっています。
上記の結果では、対照薬先行群と試験薬先行群のAUC平均値の差の90%信頼区間の上限が±20%の許容範囲からほんのわずかに外れています。 しかしこの程度なら「順序効果はない」と評価しても良いと思います。
ちなみに同じデータに2標本t検定を用いると次のような結果になります。 分散分析の結果と比較すると、検定結果は同じで平均値の差とその90%信頼区間の値が2倍になっていることがわかると思います。
BE試験の場合、原則としてtmax以外の評価項目は対数変換してから解析することになっています。 その理由は「tmax以外の評価項目は対数正規分布することが多い」からだとされています。 しかし平均値等の統計量はデータがどんな分布をしていても中心極限定理によって近似的に正規分布をし、検定はその性質を利用しています。 また検定に必要な正規性はデータそのものの正規生ではなく、検定誤差つまり残差の正規性です。 したがって「データが対数正規分布することが多い」という数学的な理由で評価項目を対数変換せず、評価項目の医学的意義をよく考えて変数変換するかどうかを決めるべきです。 (→2.2 データの分布と統計手法、2.3 パラメトリック手法とノンパラメトリック手法)
AUCについては、この指標が薬効をどのように反映するかをよく考える必要があります。 第1節と第2節で説明したように、AUCは初期濃度C0を排出速度定数keで割った値として求めることができます。 そしてkeは最も直接的に薬効を反映すると考えられる有効血中濃度持続時間tEDと反比例するので、AUCとtEDは比例します。
またkeに分布容積Vdを掛けると全クリアランスClTになります。 クリアランスは薬剤を浄化する能力を表し、クレアチニン・クリアランスは腎機能を表す臨床評価項目としてよく用いられます。 そしてクレアチニン・クリアランスは腎機能を正比例的に反映すると考えられるので、普通は実測値のまま解析します。 (→14.1 コンパートメントモデル、14.2 内服モデル)
これらのことを考慮するとAUCは実測値のまま解析するか、たとえ変換するにしても対数ではなく逆数にして解析するのが合理的ということになります。 またCmaxはkeと吸収速度定数kaの差の逆数との間に指数関係があるので対数変換して解析し、tmaxはkeとkaの差との間に反比例関係があるので実測値のまま解析するのが合理的ということになります。
参考までに、表14.5.2のデータを自然対数変換してから解析すると次のような結果になります。
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
順序効果 | 0.00697921 | 1 | 0.00697921 | 0.0598471 |
被験者残差 | 1.86588 | 16 | 0.116617 | |
被験者 | 1.87286 | 17 | 0.110168 | 5.18909 |
時期効果 | 0.697902 | 1 | 0.697902 | 32.8723 |
薬剤効果 | 0.00775544 | 1 | 0.00775544 | 0.365294 |
残差 | 0.339691 | 16 | 0.0212307 | |
全体 | 2.9182 | 35 |
AUCを対数変換して解析した場合、対照薬と試験薬の対数変換後のAUC平均値の差の90%信頼区間が±0.2231436の範囲内に入っていれば生物学的に同等と評価します。 これはAUC幾何平均値の比の許容範囲を0.8〜1.25にしたものであり、実測値の場合の平均値の差が±0.20という許容範囲に対応したものです。 なおAUCを常用対数変換した時は、幾何平均値の比が0.8〜1.25という許容範囲は対数変換後のAUC平均値の差が±0.09691001という許容範囲になるので注意が必要です。
上記の結果では、対照薬先行群と試験薬先行群のAUC幾何平均値の比の90%信頼区間の上限が1.25からほんのわずかに外れています。 しかしこの程度なら「順序効果はない」と評価しても良いと思います。 そして対照薬と試験薬のAUC幾何平均値の比は0.8〜1.25の許容範囲内に入っているので、生物学的に同等と評価されます。
BE試験の評価指標は全て計量尺度ですが、クロスオーバーデザインの一般的な試験では評価指標が順序尺度や名義尺度になることも有り得ます。 その場合、クロスオーバー用分散分析に対応するノンパラメトリック手法はまだ開発されていないので、2標本t検定に対応するノンパラメトリック手法を適用します。 例えば表14.5.2のデータを順序尺度扱いして、ウィルコクソンの順位和検定(マン・ホイットニィのU検定)を適用すると次のような結果になります。
通常のBE試験では評価指標が計量尺度ばかりなので、順位平均値の差の90%許容範囲は規定されていません。 仮に計量尺度として扱った時の許容範囲である±20%を適用すると、上記の結果では順位平均値の差の90%信頼区間の幅が±20%以上つまり40%以上あるので、生物学的に同等かどうか評価することはできないという結論になります。 パラメトリック手法に比べてノンパラメトリック手法は検出力が低いので、このようなことが起きても不思議ではありません。
またデータが順序尺度の場合、厳密にいえばt1とt2の和や差を求めることはできません。 そのため上記のような解析は順序尺度を計量尺度のように扱っていることになり、理論的に好ましくありません。 もしt1とt2の和や差の順位を合理的に定義することができれば、その順位を利用して解析する方が合理的です。 しかし順序尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的だと思います。
データが名義尺度の場合も、普通はt1とt2の和や差を求めることができません。 そこでもしt1とt2の和や差の分類を合理的に定義することができれば、その分類に2群の出現率の検定を適用して上記のような解析をすることができます。 しかしこの場合も名義尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的でしょう。
群 | 被験者 | 第1期 | 第2期 | 計 | 平均 |
---|---|---|---|---|---|
G1 | 1 | y1111 | y1221 | T1..1 | m1..1 |
: | : | : | : | : | |
l | y111l | y122l | T1..l | m1..l | |
: | : | : | : | : | |
n1 | y111(n1) | y122(n1) | T1..(n1) | m1..(n1) | |
小計 | T111. | T122. | T1... | − | |
平均 | m111. | m122. | − | m1... | |
G2 | 1 | y2121 | y2211 | T2..1 | m2..1 |
: | : | : | : | : | |
l | y212l | y221l | T2..l | m2..l | |
: | : | : | : | : | |
n2 | y212(n2) | y221(n2) | T2..(n2) | m2..(n2) | |
小計 | T212. | T221. | T2... | − | |
平均 | m212. | m221. | − | m2... | |
計 | T.1.. | T.2.. | TT | − | |
平均 | m.1.. | m.2.. | − | mT | |
薬剤合計 | T..1. | T..2. | TT | − | |
薬剤平均 | m..1. | m..2. | − | mT |
要因 | 平方和SS | 自由度φ | 平均平方和Ms(分散V) | 分散比F |
---|---|---|---|---|
順序効果 | SG | φG | VG | FG=VG/VSR |
被験者残差 | SSR | φSR | VSR | |
被験者 | Ssub | φsub | Vsub | Fsub=Vsub/VR |
時期効果 | SP | φP | VP | FP=VP/VR |
薬剤効果 | SD | φD | VD | FD=VD/VR |
残差 | SR | φR | VR | |
全体 | ST | φT |
信頼区間を求めるための標準誤差の式で残差分散VSRとVRを2で割っているのは、クロスオーバー用分散分析では順序効果、時期効果、薬剤効果を実際の2倍にして解析しているからです。 このことは図14.5.2のクロスオーバーデザインのモデルを見れば納得できると思いますし、上記の式でデータ数が被験者数の2倍になり、平方和を求める式の平均値が2倍されているものがあることからもわかると思います。
またこれは2薬剤×2時期のクロスオーバーデザインですが、これを一般化してa薬剤×a時期のクロスオーバーデザインに拡張することもできます。 その場合は上記の式の添字i、j、kを1…aにすることによって同様の分散分析を行うことができます。
表14.5.2のデータについて実際に計算してみましょう。
これらを分散分析表にまとめることによって表14.5.3ができます。 なお分散分析は各要因が独立で各要因の平方和間に相加性がある、つまり各要因の平方和を合計すると全体の平方和に一致するという前提で組み立てられた手法です。 そのためn1とn2が異なっていると平方和を計算する順序によって結果が異なり、2標本t検定を用いた結果と食い違う時があります。 したがってn1とn2が異なっている時は2標本t検定を用いた方が無難です。
これは母平均値の差δが0の時に、(1-α)信頼区間が(1-β)の確率で-δ* 〜 +δ*の同等性範囲にすっぽり入る時の必要例数になります。 そしてこれは基準値を-δ*にした時の非劣性検定と、基準値を+δ*にした時の非優越性検定の両方が片側有意水準α/2、検出力(1-β)で同時に有意になる時の必要例数でもあります。 もし母平均値の差δが0ではないと考えられる時は、次のような方法で必要例数を求めます。
同等性を検証するのではなく非同値性を検証する時は、計量尺度・2標本の場合の必要例数の計算式を利用して求めます。 この時の必要例数は同等性の検証のための必要例数よりも少し少なくなります。 (→1.8 科学的研究の種類 (注1))
表14.5.2に関するクロスオーバー用分散分析の結果を用いて、信頼係数を90%(有意水準10%)、検出力を80%、検出差を対照薬の平均値の±20%、母標準偏差推定値を残差分散から推測して実際に計算してみましょう。