玄関雑学の部屋雑学コーナー統計学入門

付録4 多施設共同臨床試験における終了施設数曲線のシミュレート

1.前提

多施設共同臨床試験を次のような条件で実施することを前提にします。

(1) 症例数

m施設において1施設あたりr例で実施、全例数 = m×r例。

例:m = 100、r = 5 → n = 100×5 = 500例

(2) 試験期間と単位時間

1例の試験期間(観測期間〜終了後観察期間)を単位時間と定義する。

例:観測期間4週間、薬剤投与期間12週間、終了後観察期間4週間 → 単位時間 = 4 + 12 + 4 = 20w

2.仮定

試験実施に関して次のような仮定を置きます。

(1) 症例発生頻度

各施設は平均してh時間間隔で対象症例が発生する。

例:h = 0.1単位時間 → 1単位時間 = 20wとすると、h = 0.1×20 = 2w(2例/月)

(2) 準備期間

各施設に臨床試験を依頼してから実際に臨床試験を開始するまでに準備期間としてc時間が必要。

例:c = 0.4単位時間 → 1単位時間 = 20wとすると、c = 0.4×20 = 8w(2ヶ月)

(3) 遅延ファクター

各施設での試験進行を1単位時間遅らせる遅延ファクターが単位時間あたり確率aで発生する。

例:a = 0.01 → 1単位時間 = 20wとすると、試験進行を20w遅らせる遅延ファクターが100施設に1施設発生する

遅延ファクターとしては試験開始時の契約トラブル、施設で開かれるIRB(治験審査委員会)トラブル、施設への薬剤搬入トラブル、対象症例の脱落、有害事象の発生、症例データのQCチェックトラブル、データのフィードバックトラブル等が考えられます。 これらの遅延ファクターは種類によって遅延時間が異なるのが普通です。 しかし例えば遅延時間0.1単位時間の遅延ファクターが確率0.1で発生する時、遅延時間1単位時間の遅延ファクターが確率0.01で発生すると考えれば、遅延時間を単位時間に固定した発生確率として統一的に定義することができます。 そしてそれによって全施設の平均的な遅延ファクター発生確率を定義することが可能になります。

3.演繹結果

(1) 遅延ファクターが全く発生しない時

遅延ファクターが全く発生しない時の、各施設における理想的な試験終了時間は次のようになります。

終了時間 = c + h(r - 1) + 1 単位時間

例えばr = 5、c = 0.4、h = 0.1、1単位時間 = 20wの時は次のようになります。

終了時間 = {0.4 + 0.1×(5 - 1) + 1}×20 = 1.8×20 = 36w(9ヶ月)
図 付録4.1 遅延ファクターが全く発生しない時(1施設)

以上より、全施設が遅延ファクターなしで終了する理想的な試験の場合、試験終了までの時間は次のようになります。

全施設終了時間 = 1施設終了時間 = c + h(r - 1) + 1 単位時間

例えばm = 100、r = 5、c = 0.4、h = 0.1、1単位時間 = 20wの時は次のようになります。

全施設終了時間 = {0.4 + 0.1×(5 - 1) + 1}×20 = 1.8×20 = 36w(9ヶ月)
図 付録4.2 遅延ファクターが全く発生しない時(全施設)

遅延ファクターが平均してb種類ある時、遅延ファクターが全く発生しない確率λは次のようになります。

1つの遅延ファクターが発生しない確率 = 1 - a
∴b種類の遅延ファクターが全く発生しない確率 λ = (1 - a)b

例えばa = 0.1、b = 5の時は次のようになります。

λ = (1 - 0.1)5 = 0.95 = 0.59049 ≒ 0.6
∴1つ以上の遅延ファクターが発生する確率 = 1 - λ ≒ 0.4

以上のように、個々の遅延ファクターの発生率が低くても、それが複数あると1つ以上の遅延ファクターが発生する確率は意外に高くなります。 そのため遅延ファクターが全く発生しない理想的な試験は現実にはほとんど有り得ないことがわかります。

(2) 遅延ファクターが1つ以上発生する時

遅延ファクターが全く発生しない確率をλとすると、t = c + h(r - 1) + 1単位時間までは1施設も終了せず、t = c + h(r - 1) + 1の時点で遅延ファクターが全く発生しなかったλ×m施設が終了します。 そして次に1単位時間遅れてλ(m - λm)施設が終了し、以後は同様のことを繰り返します。 これはポアソン過程になるので、t = c + h(r - 1) + 1以後の終了施設数関数は近似的に次のような式で表されます。

y = f(T = t - {c + h(r - 1) + 1}) = m - m e-λT = m{1 - exp(-λT)}
※λは速度定数の性質を持ち、y = f(T)の曲率を決めるパラメーターになる。
図 付録4.3 遅延ファクターが発生する時

普通の臨床試験では原則としてλは1にならないので、t = c + h(r - 1) + 1以後は必然的に指数関数的になります。 そしてその関数はmとλだけに依存する、つまり施設数mと遅延ファクター発生率aと遅延ファクターの平均的な数bだけに依存します。

(3) 全施設中100g%が終了するまでの時間

全施設中100g%の施設が終了するまでの時間は次のようになります。

y = g m = m{1 - exp(-λT)}  exp(-λT) = 1 - g
  

例えばr = 5、c = 0.4、h = 0.1、λ = 0.6、1単位時間 = 20wとすると次のようになります。

・g = 0.5の時(半減期)
(約1.1年)
・g = 0.8の時
(約1.7年)
・g = 0.9の時
(約2.2年)

(4) 全施設が終了するまでの時間

全施設中が終了するまでの時間はまともに指数関数で計算すると無限大になってしまうので、まず最後の1施設になるまでの時間を求めます。

y = m - 1 = m{1 - exp(-λT)}  m・exp(-λT) = 1
  

最後の1施設は遅延ファクターのために1単位時間遅れて終了するので、全施設が終了するまでの時間は次のようになります。

  

例えばm = 100、r = 5、c = 0.4、h = 0.1、λ = 0.6、1単位時間 = 20wとすると次のようになります。

(約4年)

(5) 100g%が終了するまでの相対時間

全施設が終了するまでの時間と100g%が終了するまでの時間の比、つまり100g%が終了するまでの相対時間は次のようになります。


t = c + h(r-1) + 1以後に限ると

つまり100g%が終了するまでの相対時間は近似的に施設数mと割合gだけで決まり、遅延ファクター発生率aや遅延ファクターの平均的な数bとは無関係になります。

・m = 100、g = 0.8の時

・m = 100、g = 0.9の時

・m = 50、g = 0.9の時

・m = 10、g = 0.9の時

※実際には{c + h(r - 1) + 1}の項があるので1よりも大きくなる

したがって10施設程度の臨床試験では全施設が終了するまでの時間は90%の施設が終了するまでの時間プラスαですが、100施設程度の臨床試験では全施設が終了するまでの時間は80%の施設が終了するまでの約3倍、90%の施設が終了するまでの約2倍かかります! この原因は、試験開始初期に100施設で50例終了するのに1ヶ月程度かかったとすれば、試験末期に残っている10施設で50例終了するには理論上は10ヶ月程度かかるという点にあります。

臨床試験の担当者は、経験上、80〜90%程度終了するまでの期間をだいたいの試験期間ととらえ、最後の10〜20%は特別なトラブルが発生した例外と考えやすいと思います。 しかし遅延ファクターが全く発生しない臨床試験は現実的にはほとんど有り得ず、必ずどこかの施設で何らかのトラブルが発生します。 そしてその場合、トラブルの発生率や発生数とは無関係に、最後の10〜20%が終了する時間は80〜90%が終了するまでの時間の1〜2倍もかかるのです。

そのため100施設程度の臨床試験では、全施設終了予定期間の半分が過ぎた時点で全施設の90%が終了していないと予定通り終了しません。 つまり全施設終了予定期間の半分が過ぎた時点で80%程度が終了していたとしたら、予定以上に順調に進行していると考えず、予定よりも遅れているので何らかの対策を施す必要があると考えなければならないのです。

最も効果的な対策は施設を追加することであり、次に考えられる対策は遅延ファクターをできるだけ無くすようにすることです。 しかし試験途中で施設を追加することは難しいので、最初から施設数を必要数の1〜2割増しにしておくことが考えられます。 例えば必要施設数m = 100、g = 0.8として、最初からm×(1/g) = 100/0.8 = 125施設にしておけば、80%の施設が終了した時点で必要例数が確保できることになります。

実際の臨床試験では試験開始時は遅延ファクターが比較的多く、試験進行中は少なくなり、試験終了時にまた増えると考えられます。 また試験開始初期はプールされた症例を導入するので比較的速く進行し、試験末期になるほど症例が減り、しかも問題症例が増えると考えられます。 そのため実際の終了施設数関数y = f(T)は試験開始初期は増え方が急であり、試験末期になるほど増え方が緩やかになると考えられます。

(6) 終了施設数関数の平均値と中央値

終了施設数関数y = f(T)は指数分布に相当するので、その期待値つまり平均値と中央値は次のようになります。

平均値:   中央値:

このことから施設の平均終了時間と中央終了時間は次のようになります。

平均終了時間:   中央終了時間:

例えばr = 5、c = 0.4、h = 0.1、λ = 0.6、1単位時間 = 20wとすると次のようになります。

(約1.3年)
(約1.1年)
・t = c + h(r-1) + 1以後に限った時の相対時間
  
・m = 100の時
  

つまりt = c + h(r-1) + 1以後に限れば、平均終了時間Tmの施設をm施設集めて臨床試験を行った場合、全施設が終了するまでの時間はTmのln(m)倍になります。 これは施設の中に特に遅い施設があるからではなく、平均終了時間よりもたまたま速く終了する施設と、たまたま遅く終了する施設が確率的に発生することが原因です。

以上のような理論は、多施設共同臨床試験に限らず、多くの施設または人が共同してひとつの仕事を行う時にはたいてい当てはまると思います。 そこで、

多施設で共同作業をする時、全施設が作業を終了するまでの時間と100g%の施設が作業を終了するまでの時間の比は施設数だけに依存し、施設数が多くなるほど大きくなる。 そして100施設程度なら、全施設が作業を終了するまでの時間は80%の施設が作業を終了するまでの時間の約3倍かかる。

または、より具体的に、

100施設程度の共同作業では、全施設が作業を終了する予定期間の半分が過ぎた時点で約80%の施設が作業を終了していたとしたら、予定以上に順調に進行していると考えず、予定よりも遅れているので何らかの対策を施す必要がある、と考えなければならない!

という原理を、私は多施設共同作業の基本原理と名付けました。