本研究の本当の目的を憶測したところで、いよいよこれからがデータ解析屋の腕の見せ所です。 第1節で紹介したグラフのパーセンテージから例数を逆算してみましょう。
このグラフにはパーセンテージが記載されていて、しかも2群の合計例数が41例と記載されているので例数を逆算するのはわりと簡単です。 以前、パーセンテージが記載されていないグラフのチェックを依頼された時、プリントしてグラフの長さを物差しで測り、それによってパーセンテージを推測して例数を逆算したこともあります。
プロトコールの「7.試験デザイン」の部分を見ると、最初の計画では「ポビドンヨード通常含嗽群15例、ポビドンヨード遅延含嗽群15例をランダムに割り付ける」となっています。 そして割付方法は「ホテル療養の奇数室を通常含嗽群、偶数室を遅延含嗽群に割り付ける」となっています。
また「11.目標患者数」の部分にも「ポビドンヨード含嗽通常群、含嗽遅延含嗽群ともに15例、計30例」と記載されています。 そしてその下の文章が黒塗りされていますが、通常、ここには例数の設定根拠を記載します。
検証研究の場合、設定根拠は例えば次のように記載します。
ところが本研究は探索研究なので上記のような記載はできません。 しかも1群15例の場合、有意水準5%、検出力80%とし、ポビドンヨード遅延含嗽群の陰性化率を50%と仮定すると、ポビドンヨード通常含嗽群の陰性化率が5%以下でないと2群の陰性化率の差が検出できません。 そのため設定根拠としては、せいぜい次のように記載するのが精一杯だと思います。
このように本研究の計画段階では2群合計30例だったのに、実際には2群合計41例も実施したということは、結果が予想よりも悪く、良い結果が出るまで例数を追加したと考えられます。 例数を増やせば検定結果が有意になりやすいので、探索型の予備試験ではこれはよくあることです。 本研究の割付方法は「ホテル療養の奇数室を通常含嗽群、偶数室を遅延含嗽群に割り付ける」ですから、2群ともほぼ同じ例数と考えられます。 その前提で2群の例数を18〜22例の範囲で色々と試しましたが、どうしてもグラフのようなパーセンテージになりません。
そこで第1節で紹介した最初の研究成果公表案のグラフをよく見たところ、ポビドンヨード含嗽無群におけるDay4の陽性率が40.0%になっていて、しかも有意水準5%で有意(p=0.030)になっています。 計画段階ではこの群のDay4の陽性率は50%程度と予想していたのではないかと思うので、これは少し低すぎます。 2群の陽性率の差が小さいと、例数を相当に増やさないと有意になりません。
そのためポビドンヨード含嗽有群だけ例数を増やし、しかも開始日のウイルス量が少ない被験者を選べば、ポビドンヨード含嗽有群の陽性率が低くなり、2群の陽性率の差が大きくなるはず……と、良からぬことを考えたのではないかと憶測しました。 その前提でポビドンヨード含嗽無群の例数を14〜16例の範囲で試したところ、16例にするとDay1〜Day3はグラフのパーセンテージになることがわかりました。 そしてポビドンヨード含嗽有群の例数を25〜27例の範囲で試したところ、25例にするとDay1〜Day3はグラフのパーセンテージになることがわかりました。
肝心のDay4については少々手こずりましたが、ポビドンヨード含嗽無群の例数を15例、ポビドンヨード含嗽有群の例数を21例にすると見事にグラフのパーセンテージに一致し、次節で説明するように検定結果のp値が一致しました! Day4だけ例数が減っているのは「脱落」といい、ヒトを対象にした臨床試験ではよくあることです。 でもたった8日間の試験で、しかもホテル療養中の被験者を対象にしていて4日目に5例も脱落したというのは少々不自然です。
しかもグラフを見るとDay4におけるポビドンヨード含嗽有群の陽性率は9.5%であり、Day1〜3における2群の陽性率の低下傾向から見て不自然に低くなっています。 この不可解な現象を見て、グラフに例数を記載できなかった理由が何となく理解できた気がしました。 つまり例数を記載すると、ホテルの室番号の奇数と偶数で2群を割り付けたにもかかわらず2群の例数がこれほど偏り、しかもDay4だけ例数が減っている不自然さがすぐにわかってしまうからではないかと思います。