玄関雑学の部屋雑学コーナー統計学入門

14.5 生物学的同等性試験

(1) 生物学的同等性試験の評価指標

後発医薬品——先発医薬品の特許が切れるとゾロゾロ出てくるので、業界用語でゾロ品といいます。 でもイメージが悪いので、表向きはジェネリック医薬品と言い換えています(^_-)——が先発医薬品と同じ薬効を持つことを検証する試験として、生物学的同等性試験(Bioequivalence Study、BE試験、生同試験)というものがあります。 通常、この試験では薬物動態学的指標を比較することによって、先発品と後発品の生物学的な同等性を検証します。

本来は先発品と後発品の薬効を比較すべきですが、薬効の比較には大規模な臨床試験が必要であり、開発費が少ないことがメリットであるゾロ品でそれを行うのは困難です。 そこで薬物動態学的指標が同じなら薬効も同じだろうという想定のもとに、薬物動態学的指標を代理評価指標にした試験を行うのです。

BE試験では主として曲線下面積AUC、最大血中濃度Cmax、最大血中濃度時間tmaxを評価指標にします。 しかしこれらの指標をコンパートメントモデルを利用して求めるのは面倒なので、通常は実際のデータから近似的に求めます。 例えば第3節の表14.3.3のデータでは次のようになります。

表14.3.3 内服後の血中濃度データ(溶解時間補正後)
時間(hr)0.070.320.570.721.071.572.072.573.574.575.57
血中濃度 8.792021.31710.76.463.722.471.170.640.41
図14.5.1 実測値に基づいた指標
台形法によるAUC:
tmax = 0.57  Cmax = 21.3

(2) クロスオーバーデザイン

通常、BE試験は先発品を対照薬、後発品を試験薬として、クロスオーバーデザイン(cross-over design)で行います。 クロスオーバーデザインとは、表14.5.1のように同一の被験者に時期を変えて対照薬と試験薬を投与し、効率的な比較を行おうというデザインです。 このデザインでは被験者を無作為に2群に分け、一方の群は対照薬→試験薬の順で投与し、もう一方の群は試験薬→対照薬の順に投与し、同じ時期に対照薬と試験薬を投与します。 このように2つの薬剤をクロスして投与することによって、季節変動などで投与時期によって薬効が異なるという現象つまり時期効果を打ち消すことができます。

表14.5.1 2薬剤×2時期の
クロスオーバーデザイン
第1期第2期
群I:対照薬先行群対照薬投与試験薬投与
群II:試験薬先行群試験薬投与対照薬投与

このデザインは、先に投与した薬剤が後から投与する薬剤の効果に影響を及ぼすという現象つまり持ち越し効果がある時は公平な比較ができません。 例えば試験薬は原因療法であり、疾患を完治して被験者を健常人にするのに対して、対照薬は対症療法であり、薬剤を投与している間だけ被験者を一時的に健常人にする効果があるとします。 その場合、対照薬先行群では第1期は一時的に効果があるものの、それは第2期の試験薬の効果に影響を及ぼしません。 しかし試験薬先行群では第1期で被験者が完治してしまい、その効果が第2期にも持ち越されて対照薬の効果に影響を及ぼします。 その結果、対照薬の効果が本来の効果よりも過大に評価され、公平な比較ができません。

そもそも薬剤は疾患を完治して病人を健常人にするのが本来の目的です。 そのため持ち越し効果があるのが普通であり、持ち越し効果のない薬剤は良い薬剤とはいえません。 実際、現実の治療現場では最初に効果の強い薬剤を投与して疾患をある程度治療し、その後は効果は弱いものの副作用が少ない薬剤を長期間投与してじっくりと治療するという治療を行うことがよくあります。 これは、まさに薬剤の持ち越し効果を利用した治療法です。

このような理由から、一般的な臨床試験でこのザインが用いられることはほとんどありません。 しかし薬物が体内に蓄積されず、一定時間で体外に完全に排出される薬剤の場合、薬物の血中濃度に関してだけは持ち越し効果はないと考えられます。 そのためBE試験では、通常はクロスオーバーデザインが用いられます。

(3) クロスオーバーデザインのモデル

クロスオーバーデザインのモデルは少々ややこしいので、模式図によってその内容と解析方法を考えてみましょう。 話を簡単にするために、ここでは対照薬を薬効のないプラセボとします。

図14.5.2 対照薬先行群の模式図 図14.5.3 試験薬先行群の模式図
t0:開始時  t1:先行薬投与終了時   t2:後行薬投与終了時
μI0:対照薬先行群のt0における平均値(初期値、血中濃度の場合は0)
μI1:対照薬先行群のt1における平均値   μI2:対照薬先行群のt2における平均値
μII0:試験薬先行群のt0における平均値(初期値、血中濃度の場合は0)
μII1:試験薬先行群のt1における平均値   μII2:試験薬先行群のt2における平均値
π:プラセボ効果(プラセボが変化量に与える効果)
α:試験薬の効果(試験薬が変化量に与える効果からプラセボ効果を差し引いたもの)
βI:対照薬先行群の背景因子効果(背景因子が変化量に与える効果、主として初期値の効果)   βII:試験薬先行群の背景因子効果
τ1:t1における時期効果(時期が変化量に与える効果、季節変動等)   τ2:t2における時期効果
ωp:対照薬の持ち越し効果  ωa:試験薬の持ち越し効果
δI1 = μI1 - μI0 = π + βI + τ1:対照薬先行群のt1における変化量平均値
δI2 = μI2 - μI0 = π + α + ωp + βI + τ2:対照薬先行群のt2における変化量平均値
δII1 = μII1 - μII0 = π + α + βII + τ1:試験薬先行群のt1における変化量平均値
δII2 = μII2 - μII0 = π + ωa + βII + τ2:試験薬先行群のt2における変化量平均値

このモデルでは次のような3種類の効果を検討することができます。

○順序効果(群または持ち越し効果):t1とt2の和の群間比較
II1 + δII2) - (δI1 + δI2) = (2π + α + ωa + 2βII + τ1 + τ2) - (2π + α + ωp + 2βI + τ1 + τ2) = 2(βII - βI) + (ωa - ωp)
※順序効果は対照薬先行群と試験薬先行群の背景因子効果の差つまり群の効果と、試験薬と対照薬の持ち越し効果の差を合わせたものであり、2つの効果を分離して検出することはできない。
ただしβI = βIIの時、持ち越し効果の差を純粋に検出可能であり、ωa = ωpの時、背景因子効果の差を純粋に検出可能である。
○時期効果(期間効果):t1とt2のクロス差の群間比較
II2 - δII1) - (δI1 - δI2) = (-α + ωa + τ2 - τ1) - (-α - ωp + τ1 - τ2) = 2(τ2 - τ1) + (ωa + ωp)
※ωap = 0またはωa = -ωpの時、時期効果を純粋に検出可能。
※対照薬先行群と試験薬先行群を合わせたt1とt2の群内比較つまりt1とt2の差についての対応のあるt検定は次のようになり、2群の例数が等しい時だけ時期効果から試験薬の効果αを取り除くことができる。

n1:対照薬先行群の例数 n2:試験薬先行群の例数
n1 = n2 = nの時:
しかし2群の例数が異なると時期効果に試験薬の効果が入り込んでしまうので不適切。 それに対してt1とt2のクロス差の群間比較は(δII2 - δII1)の平均値と(δI1 - δI2)の平均値の差を求めるので、2群の例数が異なっても時期効果から試験薬の効果を取り除くことができる
○薬剤効果(処理効果):t1とt2の差の群間比較
II1 - δII2) - (δI1 - δI2) = (α - ωa + τ1 - τ2) - (-α - ωp + τ1 - τ2) = 2α + (ωp - ωa)
※ωa = ωpの時、薬剤効果を純粋に検出可能。
※対照薬先行群はt2からt1を引き、試験薬先行群はt1からt2を引き、それらを合わせた群内比較は次のようになり、時期効果と同様に2群の例数が等しい時だけ薬剤効果から時期効果(τ21)を取り除くことができる。

n1 = n2 = nの時:
しかし例数が異なると、薬剤効果に時期効果が入り込んでしまうので不適切。 それに対してt1とt2の差の群間比較は(δII1 - δII2)の平均値と(δI1 - δI2)の平均値の差を求めるので、2群の例数が異なっても薬剤効果から時期効果を取り除くことができる

上記の式から、クロスオーバーデザインによって薬剤効果を純粋に検出できるのは対照薬と試験薬の持ち越し効果が無いか、もしくは同等の時に限られることがわかります。 そして対照薬先行群と試験薬先行群の背景因子を群間比較し、それが同等なら順序効果は持ち越し効果の差だけになり、持ち越し効果の差を純粋に検出できます。 したがって対照薬先行群と試験薬先行群の背景因子が同等で、かつ順序効果が無ければ薬剤効果を純粋に検出することができます。 なおこれらの効果は本来の効果(βII - βI)、(τ2 - τ1)、αを2倍したものなので、信頼区間を計算する時に注意が必要です。

これらの効果の検出には、どれも2標本t検定とそれに対応する区間推定を適用することができます。 しかしこれらの分析を総合的に行うためのクロスオーバー用分散分析が開発されているので、普通はその手法を適用します。 ただしクロスオーバー用分散分析は対照薬先行群と試験薬先行群の例数が等しいという前提で組み立てられています。 そのため2群の例数が異なる時は2標本t検定とそれに対応する区間推定を用いる方が無難です。 でも検定と推定は2群の例数が同じ時に最も効率が高くなるので、クロスオーバーデザインでは2群の例数をできるだけ揃えることが大切です。

(4) BE試験の例題

今、先発品Aを対照薬、後発品Bを試験薬にして、18名の被験者を無作為に9例ずつの2群に分け、それぞれ対照薬先行群と試験薬先行群にしてクロスオーバーデザインのBE試験を行ったとします。 そして18名の血中濃度データに基いて台形法でAUC求めたところ、表14.5.2のようになったとします。

表14.5.2 BE試験のAUCデータ
被験者ID第1期第2期
対照薬先行群
(A→B)
101101.245162.947
102132.748180.26
103214.553212.685
10499.9775147.795
105101.17598.45
106165.27236.787
107158.31185.81
108181.073217.873
10994.0075140.327
試験薬先行群
(B→A)
20188.415136.037
202162.817208.84
203182.82151.745
204107.745202.25
205151.98223.492
206138.627168.692
207183.407236
208117.1165.695
20999.88159.17

このデータにクロスオーバー用分散分析を適用すると、次のような結果になります。 (注1)

表14.5.3 クロスオーバー用分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
順序効果79.2664179.26640.0297297
被験者残差42659.7162666.23 
被験者42739172514.065.46556
時期効果15779.8115779.834.3052
薬剤効果198.5991198.5990.431753
残差7359.716459.981 
全体6607735 
○順序効果
帰無仮説 H0:2群の背景因子効果は等しく、かつ対照薬と試験薬の持ち越し効果は等しい。
FG = 0.030(p = 0.8653) < F(1,16,0.10) = 3.048 … 有意水準10%で有意ではない
対照薬先行群のAUC平均値 = 157.294  試験薬先行群のAUC平均値 = 160.262
AUC平均値の差の90%信頼区間 = 2.96783 ± 30.05 → 下限 = -27.0822 上限 = 33.0178
対照薬先行群のAUC平均値に対する比 = 0.0188680±0.191044 → 下限 = -0.172176 上限 = 0.209911
○時期効果
帰無仮説 H0:時期1と時期2の時期効果は等しい。
FP = 34.305(p = 2.43×10-5) > F(1,16,0.10) = 3.048 … 有意水準10%で有意
時期1のAUC平均値 = 137.842  時期2のAUC平均値 = 179.714
AUC平均値の差の90%信頼区間 = 41.8725 ± 12.4814 → 下限=29.3911 上限=54.3539
時期1のAUC平均値に対する比 = 0.303772 ± 0.0905486 → 下限 = 0.2132231 上限 = 0.394320
○薬剤効果
帰無仮説 H0:対照薬と試験薬のAUC平均値は等しい。
FD = 0.432(p = 0.5205) < F(1,16,0.10) = 3.048 … 有意水準10%で有意ではない
対照薬のAUC平均値 = 161.127  試験薬のAUC平均値 = 156.429
AUC平均値の差の90%信頼区間 = -4.6975 ± 12.4814 → 下限 = -17.1789 上限 = 7.78393)
対照薬のAUC平均値に対する比 = -0.0291541 ± 0.07746312 → 下限 = -0.106618 上限 = 0.0483094

BE試験の場合、原則として順序効果はないという前提でクロスオーバーデザインを採用します。 そして対照薬先行群と試験薬先行群の例数を同じにします。 2群の例数が異なっても薬剤効果から時期効果を取り除くことができますが、順序効果と時期効果と薬剤効果の間に関連性が生じるので好ましくありません。 また合計例数が一定なら2群の例数が同じ時に効率が最も高くなるので、できるだけ例数を同じにします。

結果は対照薬と試験薬のAUC平均値の差の90%信頼区間が、対照薬のAUC平均値に対する比として±0.20(±20%)の範囲内に入っていれば生物学的に同等と評価します。 上記の結果ではAUC平均値の差の90%信頼区間はその範囲内に入っているので、生物学的に同等と評価されます。 また90%信頼区間つまり区間推定の代わりに統計的仮説検定を用い、薬剤効果の検定結果が有意水準10%で有意でなければ生物学的に同等と評価する時もあります。 上記の検定は全て有意水準10%で検定していますが、これは90%信頼区間つまり信頼係数を90%にすることに対応したものです。

信頼区間で同等性を評価する時も、統計的仮説検定で同等性を評価する時も、事前に信頼係数または有意水準と検出力、そして検出差を決め、母標準偏差を推測して、必要例数を求めてから試験を実施する必要があります。 BE試験の場合は原則として信頼係数を90%、有意水準を10%、検出力を80%とし、検出差を対照薬のAUC平均値に対する比として±0.20(±20%)にします。 そして母標準偏差は先行研究の結果や予備試験の結果から推測します。 (注2)

統計的仮説検定で結果が有意でなければ、「『AUC平均値の差は検出差未満である』ということが80%の確率で断言できる」ということになります。 しかし検定結果が有意の時は「『AUC平均値の差が0ではない』ということが90%以上の確率で断言できる」ということになり、「『AUC平均値の差が検出差以上である』ということが90%以上の確率で断言できる」という意味ではありません。 そのためたとえ検定結果が有意になっても、90%信頼区間が検出差の範囲内に入っていれば同等と評価できます。 したがって、やはり検定結果ではなく推定結果で同等性を評価する方が理にかなっています。 (→1.7 ハンディキャップ方式の検定 (注2))

BE試験ではあまり問題になりませんが、薬剤効果を正当に評価するためには本来は順序効果があるかどうかを検討する必要があります。 BE試験に限らずクロスオーバーデザインを用いた試験では、順序効果の検定結果が有意水準10〜20%程度で有意にならなければ「順序効果はない」と評価することがよくあります。 しかしこの場合も検定ではなく、順序効果の信頼区間が許容範囲内に入っているかどうかで順序効果の有無を評価する方が理にかなっています。

上記の結果では、対照薬先行群と試験薬先行群のAUC平均値の差の90%信頼区間の上限が±20%の許容範囲からほんのわずかに外れています。 しかしこの程度なら「順序効果はない」と評価しても良いと思います。

ちなみに同じデータに2標本t検定を用いると次のような結果になります。 分散分析の結果と比較すると、検定結果は同じで平均値の差とその90%信頼区間の値が2倍になっていることがわかると思います。

○順序効果:第1期と第2期の和の群間比較
tG = 0.172(p = 0.8653) < t(16,0.10) = 1.746 … 有意水準10%で有意ではない
対照薬先行群のAUC和平均値 = 314.588  試験薬先行群のAUC和平均値 = 320.524
AUC和平均値の差の90%信頼区間 = 5.93556 ± 60.0998 → 下限 = -54.1643 上限 = 66.0354
○時期効果:第1期と第2期のクロス差の群間比較
tP = 5.857(p = 2.43×10-5) > t(16,0.10) = 1.746 … 有意水準10%で有意
時期1のAUCクロス差平均値 = -37.175  時期2のAUCクロス差平均値 = 46.57
AUCクロス差平均値の差の90%信頼区間 = 83.745 ± 24.9629 → 下限 = 58.7821 上限 = 108.708
○薬剤効果:第1期と第2期の差の群間比較
tD = 0.657(p = 0.5205) < t(16,0.10) = 1.746 … 有意水準10%で有意ではない
対照薬のAUC差平均値 = -37.175  試験薬のAUC差平均値 = -46.57
AUC差平均値の差の90%信頼区間 = -9.395 ± 24..9629 → 下限 = -34.3579 上限 = 15.5679

(5) 評価項目の変数変換

BE試験の場合、原則としてtmax以外の評価項目は対数変換してから解析することになっています。 その理由は「tmax以外の評価項目は対数正規分布することが多い」からだとされています。 しかし平均値等の統計量はデータがどんな分布をしていても中心極限定理によって近似的に正規分布をし、検定はその性質を利用しています。 また検定に必要な正規性はデータそのものの正規生ではなく、検定誤差つまり残差の正規性です。 したがって「データが対数正規分布することが多い」という数学的な理由で評価項目を対数変換せず、評価項目の医学的意義をよく考えて変数変換するかどうかを決めるべきです。 (→2.2 データの分布と統計手法2.3 パラメトリック手法とノンパラメトリック手法)

AUCについては、この指標が薬効をどのように反映するかをよく考える必要があります。 第1節第2節で説明したように、AUCは初期濃度C0を排出速度定数keで割った値として求めることができます。 そしてkeは最も直接的に薬効を反映すると考えられる有効血中濃度持続時間tEDと反比例するので、AUCとtEDは比例します。

またkeに分布容積Vdを掛けると全クリアランスClTになります。 クリアランスは薬剤を浄化する能力を表し、クレアチニン・クリアランスは腎機能を表す臨床評価項目としてよく用いられます。 そしてクレアチニン・クリアランスは腎機能を正比例的に反映すると考えられるので、普通は実測値のまま解析します。 (→14.1 コンパートメントモデル14.2 内服モデル)

これらのことを考慮するとAUCは実測値のまま解析するか、たとえ変換するにしても対数ではなく逆数にして解析するのが合理的ということになります。 またCmaxはkeと吸収速度定数kaの差の逆数との間に指数関係があるので対数変換して解析し、tmaxはkeとkaの差との間に反比例関係があるので実測値のまま解析するのが合理的ということになります。

参考までに、表14.5.2のデータを自然対数変換してから解析すると次のような結果になります。

表14.5.4 クロスオーバー用分散分析表(自然対数変換後)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
順序効果0.0069792110.006979210.0598471
被験者残差1.86588160.116617 
被験者1.87286170.1101685.18909
時期効果0.69790210.69790232.8723
薬剤効果0.0077554410.007755440.365294
残差0.339691160.0212307 
全体2.918235 
○順序効果
帰無仮説 H0:2群の背景因子効果は等しく、かつ対照薬と試験薬の持ち越し効果は等しい。
FG = 0.060(p = 0.8098) < F(1,16,0.10) = 3.048 … 有意水準10%で有意ではない
対照薬先行群のAUC平均値 = 5.01464  試験薬先行群のAUC平均値 = 5.04249
AUC平均値の差の90%信頼区間 = 0.0278467 ± 0.198736 → 下限=-0.170889 上限=0.226583
指数変換後の90%信頼区間(試験薬先行群と対照薬先行群のAUC幾何平均値の比):下限 = 0.8429151  上限 = 1.254307
○時期効果
帰無仮説 H0:時期1と時期2の時期効果は等しい。
FP = 34.872(p = 3.08×10-5) > F(1,16,0.10) = 3.048 … 有意水準10%で有意
時期1のAUC平均値 = 4.88933  時期2のAUC平均値 = 5.1678
AUC平均値の差の90%信頼区間 = 0.278468 ± 0.0847962 → 下限 = 0.193672 上限 = 0.363264
指数変換後の90%信頼区間(時期2と時期1のAUC幾何平均値の比):下限 = 1.213698  上限 = 1.438015
○薬剤効果
帰無仮説 H0:対照薬と試験薬のAUC平均値は等しい。
FD = 0.365(p = 0.5541) < F(1,16,0.10) = 3.048 … 有意水準10%で有意ではない
対照薬のAUC平均値 = 5.04324  試験薬のAUC平均値 = 5.01389
AUC平均値の差の90%信頼区間 = -0.029355 ± 0.0847962 → 下限 = -0.114151 上限 = 0.0554412
指数変換後の90%信頼区間(試験薬と対照薬のAUC幾何平均値の比):下限 = 0.892123  上限 = 1.05701

AUCを対数変換して解析した場合、対照薬と試験薬の対数変換後のAUC平均値の差の90%信頼区間が±0.2231436の範囲内に入っていれば生物学的に同等と評価します。 これはAUC幾何平均値の比の許容範囲を0.8〜1.25にしたものであり、実測値の場合の平均値の差が±0.20という許容範囲に対応したものです。 なおAUCを常用対数変換した時は、幾何平均値の比が0.8〜1.25という許容範囲は対数変換後のAUC平均値の差が±0.09691001という許容範囲になるので注意が必要です。

上記の結果では、対照薬先行群と試験薬先行群のAUC幾何平均値の比の90%信頼区間の上限が1.25からほんのわずかに外れています。 しかしこの程度なら「順序効果はない」と評価しても良いと思います。 そして対照薬と試験薬のAUC幾何平均値の比は0.8〜1.25の許容範囲内に入っているので、生物学的に同等と評価されます。

(6) ノンパラメトリックな手法

BE試験の評価指標は全て計量尺度ですが、クロスオーバーデザインの一般的な試験では評価指標が順序尺度や名義尺度になることも有り得ます。 その場合、クロスオーバー用分散分析に対応するノンパラメトリック手法はまだ開発されていないので、2標本t検定に対応するノンパラメトリック手法を適用します。 例えば表14.5.2のデータを順序尺度扱いして、ウィルコクソンの順位和検定(マン・ホイットニィのU検定)を適用すると次のような結果になります。

○順序効果:t1とt2の和の順位の群間比較
帰無仮説 H0:順位に対する2群の背景因子効果は等しく、かつ対照薬と試験薬の持ち越し効果は等しい。
z = 0(p = 1) < t(∞,0.10)=1.645 … 有意水準10%で有意ではない
対照薬先行群の順位平均値 = 9.44444  試験薬先行群の順位平均値 = 9.55556
順位平均値の差の90%信頼区間 = -0.111111(-0.617283%) ± 4.13946 → 下限 = -4.25057(-23.6143%) 上限 = 4.02835(22.3797%)
U値の90%信頼区間 = 40(49.3827%) ± 18.6276 → 下限 = 21.3724(26.3857%) 上限 = 58.6276(72.3797%)
○時期効果:t1とt2のクロス差の順位の群間比較
帰無仮説 H0:順位に対する時期1と時期2の時期効果は等しい。
z = 3.31133(p = 0.0009) > t(∞,0.10) = 1.645 … 有意水準10%で有意
時期1の順位平均値 = 5.33333  時期2の順位平均値 = 13.6667
順位平均値の差の90%信頼区間 = -8.33333(-46.2963%) ± 4.13946 → 下限 = -12.4728(-69.2933%) 上限 = -4.19388(-23.2993%)
U値の90%信頼区間 = 3(3.7037%) ± 18.6276 → 下限 = 0(0%) 上限 = 21.6276(26.7007%)
○薬剤効果:t1とt2の差の順位の群間比較
帰無仮説 H0:対照薬と試験薬の順位平均値は等しい。
z = 0.883022(p = 0.3772) < t(∞,0.10) = 1.645 … 有意水準10%で有意ではない
対照薬の順位平均値 = 10.6667  試験薬の順位平均値 = 8.33333
順位平均値の差の90%信頼区間 = -2.33333(-12.9629%) ± 4.13946 → 下限 = -6.47279(-35.9599%) 上限 = 1.80612(10.034%)
U値の90%信頼区間 = 30(37.037%) ± 18.6276 → 下限 = 11.3724(14.0401%) 上限 = 48.6276(60.034%)

通常のBE試験では評価指標が計量尺度ばかりなので、順位平均値の差の90%許容範囲は規定されていません。 仮に計量尺度として扱った時の許容範囲である±20%を適用すると、上記の結果では順位平均値の差の90%信頼区間の幅が±20%以上つまり40%以上あるので、生物学的に同等かどうか評価することはできないという結論になります。 パラメトリック手法に比べてノンパラメトリック手法は検出力が低いので、このようなことが起きても不思議ではありません。

またデータが順序尺度の場合、厳密にいえばt1とt2の和や差を求めることはできません。 そのため上記のような解析は順序尺度を計量尺度のように扱っていることになり、理論的に好ましくありません。 もしt1とt2の和や差の順位を合理的に定義することができれば、その順位を利用して解析する方が合理的です。 しかし順序尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的だと思います。

データが名義尺度の場合も、普通はt1とt2の和や差を求めることができません。 そこでもしt1とt2の和や差の分類を合理的に定義することができれば、その分類に2群の出現率の検定を適用して上記のような解析をすることができます。 しかしこの場合も名義尺度のデータを近似的に計量尺度化して、クロスオーバー用分散分析によって解析する方が実際的でしょう。


(注1) 表14.5.2を一般化すると次のようになります。

表14.5.5 クロスオーバーデザインの一般的データ
 群 被験者第1期第2期平均
G11y1111y1221T1..1m1..1
:::::
ly111ly122lT1..lm1..l
:::::
n1y111(n1)y122(n1)T1..(n1)m1..(n1)
小計T111.T122.T1...
平均m111.m122.m1...
G21y2121y2211T2..1m2..1
:::::
ly212ly221lT2..lm2..l
:::::
n2y212(n2)y221(n2)T2..(n2)m2..(n2)
小計T212.T221.T2...
平均m212.m221.m2...
T.1..T.2..TT
平均m.1..m.2..mT
薬剤合計T..1.T..2.TT
薬剤平均m..1.m..2.mT
i:群(i = 1,2)  j:時期(j = 1,2)  k:薬剤(k = 1,2)  l:被験者(l = 1,…,ni)
被験者数:   総データ数:n = 2N
T..1. = T111. + T221. T..2.=T122. + T212.      
全体:  φT = n - 1   
群:  φG = 2 - 1 = 1   
被験者:   φsub = N - 1   
被験者残差:
φSR = φsub - φG = N - 2   
時期:  φP = 2 - 1 = 1   
薬剤:  φD = 2 - 1 = 1   
残差:
φR = φT - φsub - φP - φD = N - 2   
表14.5.6 クロスオーバー用分散分析表(ANOVA table)
要因平方和SS自由度φ平均平方和Ms(分散V)分散比F
順序効果SGφGVGFG=VG/VSR
被験者残差SSRφSRVSR 
被験者SsubφsubVsubFsub=Vsub/VR
時期効果SPφPVPFP=VP/VR
薬剤効果SDφDVDFD=VD/VR
残差SRφRVR 
全体STφT 
○順序効果の100(1-α)%信頼区間:対照薬先行群と試験薬先行群の平均値の差の信頼区間
標準誤差:   上下限:δG = (m2...-m1...) ± t(φSR,α)SESR
○時期効果の100(1-α)%信頼区間:時期1と時期2の平均値の差の信頼区間
標準誤差:   上下限:δP = (m.2..-m.1..) ± t(φR,α)SER
○薬剤効果の100(1-α)%信頼区間:対照薬と試験薬の平均値の差の信頼区間
標準誤差:   上下限:δD = (m..2.-m..1.) ± t(φR,α)SER

信頼区間を求めるための標準誤差の式で残差分散VSRとVRを2で割っているのは、クロスオーバー用分散分析では順序効果、時期効果、薬剤効果を実際の2倍にして解析しているからです。 このことは図14.5.2のクロスオーバーデザインのモデルを見れば納得できると思いますし、上記の式でデータ数が被験者数の2倍になり、平方和を求める式の平均値が2倍されているものがあることからもわかると思います。

またこれは2薬剤×2時期のクロスオーバーデザインですが、これを一般化してa薬剤×a時期のクロスオーバーデザインに拡張することもできます。 その場合は上記の式の添字i、j、kを1…aにすることによって同様の分散分析を行うことができます。

表14.5.2のデータについて実際に計算してみましょう。

N = 9 + 9 = 18  n = 2×18 = 36
ST = 973652 - 36×158.7782 ≒ 66077   φT = 36 - 1 = 35
SG = 18×157.2942 + 18×160.2622 - 36×158.7782 ≒ 79.2664 = VG   φG = 2 - 1 = 1
Ssub = 950314 - 36×158.7782 ≒ 42739   φsub = 18 - 1 = 17   
SSR = 42739 - 79.2664 = 42659.7   φSR = 18 - 2 = 16   
SP = 18×137.8422 + 18×179.7142 - 36×158.7782 ≒ 15779.8 = VP   φP = 2 - 1 = 1
SD = 18×161.1272 + 18×156.4292 - 36×158.7782 ≒ 198.599 = VD   φD = 2 - 1 = 1
SR = 66077 - 42739 - 15779.8 - 198.599 = 7359.7   φR = 18 - 2 = 16   
○順序効果の95%信頼区間

δG = (160.262-157.294) ± 1.74588×17.21185 = 2.968 ± 30.05
○時期効果の95%信頼区間

δP = (179.714-137.842) ± 1.74588×7.149056 = 41.872 ± 12.4814
○薬剤効果の95%信頼区間

δD = (156.429-161.127) ± 1.74588×7.149056 = -4.698 ± 12.4814

これらを分散分析表にまとめることによって表14.5.3ができます。 なお分散分析は各要因が独立で各要因の平方和間に相加性がある、つまり各要因の平方和を合計すると全体の平方和に一致するという前提で組み立てられた手法です。 そのためn1とn2が異なっていると平方和を計算する順序によって結果が異なり、2標本t検定を用いた結果と食い違う時があります。 したがってn1とn2が異なっている時は2標本t検定を用いた方が無難です。

(注2) クロスオーバーデザインにおける必要例数は、同等性の検証のための必要例数の計算式を利用して求めます。 (→1.7 ハンディキャップ方式の検定 (注2))


n1 = n2:G1群とG2群の例数   N = n1 + n2 = 2n1:全例数
nc = 1 または 2:t分布を正規分布で近似したことによる補正
1-α:信頼係数(α:有意水準)  1-β:検出力  δ*:同等性範囲幅/2 = 検出差   σ:母標準偏差
VR:残差分散  φR = N - 2:残差自由度

これは母平均値の差δが0の時に、(1-α)信頼区間が(1-β)の確率で-δ* 〜 +δ*の同等性範囲にすっぽり入る時の必要例数になります。 そしてこれは基準値を-δ*にした時の非劣性検定と、基準値を+δ*にした時の非優越性検定の両方が片側有意水準α/2、検出力(1-β)で同時に有意になる時の必要例数でもあります。 もし母平均値の差δが0ではないと考えられる時は、次のような方法で必要例数を求めます。

P((-δ* - δ) + t(φR,α)SER ≦ d ≦ (δ* - δ) - t(φR,α)SER) ≧ 1-β を満足する時のn1
0 ≦ δ < δ*   (残差分散VRを2で割るのは薬剤効果が2倍されているため)
※この時の必要例数はδ = 0の時の必要例数以上になるので、上記のδ = 0時の必要例数n1を初期値として、n1を増やしながら上式を満足する時のn1を求める。

同等性を検証するのではなく非同値性を検証する時は、計量尺度・2標本の場合の必要例数の計算式を利用して求めます。 この時の必要例数は同等性の検証のための必要例数よりも少し少なくなります。 (→1.8 科学的研究の種類 (注1))


※クロスオーバーデザインではn1 = n2にし、σ2 ≒ VR/2と推測する。

表14.5.2に関するクロスオーバー用分散分析の結果を用いて、信頼係数を90%(有意水準10%)、検出力を80%、検出差を対照薬の平均値の±20%、母標準偏差推定値を残差分散から推測して実際に計算してみましょう。

δ* = 161.127×0.2=32.2254  VR = 459.981
○同等性の検証のための必要例数
  n2 = 5  N = 10
※δ ≒ d = 4.6975の時の必要例数:n1 = 5を初期値にしてn1 = 6の時
  t(φR) = t(10):自由度10のt分布の値
P((-32.2254 - 4.6975) + 1.812×8.7556 ≦ d ≦ 32.2254 - 4.6975 - 1.812×8.7556) = P(-21.058 ≦ d ≦ 11.663)
 = P(-2.405 ≦ t(10) = d/SER ≦ 1.332) = 0.8938 - 0.0185 = 0.8753 ≧ 0.8
∴n1 = n2 = 6  N = 12
○非同値性の検証のための必要例数
  n2 = 4  N = 8