玄関小説とエッセイの部屋小説コーナーいつかどこかで

【2.推計学とは何ぞや?】

「推計学って言葉も聞いたことがあるけど、統計学とどこがどー違うんだい、伴ちゃん?」
「その違いを説明するには、統計学の歴史から話さなきゃならないんだけど……」
「レキシーッ!?」と、ミミちゃんがすっとんきょうな声を上げ、「やだなー、あたし、歴史大っっ嫌いだもんね。 年号見ただけで、ジンマシン出ちゃうのよねー」
「そんなに大したことないから、我慢して聞いてなよ。 すぐ終わるからさぁ」
「すおう? なるたけ早くしてよね、目つぶって我慢してるから……」

などと、ミミちゃんはまるで子供が注射される時のような表情だ。

「統計学の歴史は、けっこう古いんだよ。 紀元前3000年頃の古代エジプトで、例のピラミッド建設のための基礎調査や、紀元前2300年頃の中国で、人口調査なんかに使われたのが始まりとされているんだよ」
「4000年の歴史を秘めた、幻の学問ってわけね」
「幻ってわけじゃないけど、統計学はね、英語でstatisticsっていうんだよ。 この言葉と概念が確立したのは17世紀頃で、国勢調査を研究するものとして、ラテン語の国家、つまりstatnsに由来して発展したそうだよ」
「すっごーい! 伴ちゃん、ラテン語知ってんのォ?」
「知ってるわけないよ、この言葉だけだよ、知ってるのは。 僕が語学が苦手なの、知ってるくせに……」
「あら、そーだったかしらン? そー言えば、あたしが助けてあげたから、ドイツ語も英語も、どーにか単位取れたんだったわねー」
「ハイ、ハイ、いつもお世話になってますです、小山内先生様」
「科学のオールマイティ伴ちゃんの、唯一の弱点だからね、語学は」と、僕。

本当に伴ちゃんの語学力の無さはひどいもんで、クラスでも有名なんだ。 ある時、講義中に(どういうわけか、英語の講義だったんだけど)、伴ちゃんが空で「デァ、デス、デム、デン」と言えたもんだから、教室中から盛大な拍手が沸き起こったくらいだった。

「友則君だって、人のこと言えたもんじゃないでしょー? あたしの英語のノート、全部コピーしたくせにィ」
「ひえぇーっ、おありがとーごぜーますだぁ、お代官様ぁ! おかげで、無事、年が越せますだぁ〜!」

「そ、それでね、統計学の話なんだけどね……」と伴ちゃん、辛くも立ち直って、 「その後、確率論を取り入れて、19世紀末から20世紀の初めにかけて、ゴールトンやピアソンといった人達によって整理されて、体系化されたんだよ」
「それが、今の統計学なわけ?」
「ううん、この時代の統計学は、データを要約して数学的に記述するのが中心で、『記述統計学』とか『古典統計学』って呼ばれているんだよ」
「手品やったり、ぶっ倒れたりする統計学ってわけね」
「何だい、それは?」と、すかさず僕が突っ込みを入れる。
「だって、キジュチュトーケーにコテントーケーでしょ?」
「舌っ足らずのくせに、無理してダジャレ言わんでもいいよ、ミミちゃん」
「どんな学問でもそうなんだけど、ある画期的な出来事が起こって、それ以前と以後でその学問の内容が大きく変わってしまった場合、普通、以前のものを『古典』と呼んで、以後のものを『近代』って呼ぶんだよ」

と、ミミちゃんと僕の掛け合いをあっさり無視して、伴ちゃんは続けた。

「そー言えば、物理学なんかもそーだね」
「そうだよ。 1900年のプランクによる量子論と、1905年と1915年のアインシュタインによる相対論によって、それまでのニュートン力学が古典物理学になっちゃって、近代物理学が始まったのは有名だよね」
「あっ、その人知ってる!」と、ミミちゃんが誇らしげに口を挟み、「人造人間で、首んところに、こんな太い、杭みたいなのが刺さってる人でしょー?」
「あれは、フランケンシュタイン!」と、僕はミミちゃんの天然ボケに突っ込んでやった。
「あれ? そーだっけ? そー言えば友規君、『戦艦ポチョムキン』って映画作った監督って、そんなふーな名前じゃなかった?」
「あれは、エイゼンシュタイン」
「じゃ、ベートーベンのピアノ曲で、何かそんな感じなのあったでしょ?」
「ピアノソナタ、ワルトシュタイン」
「それじゃ、遠くからだと、けっこーそんな感じに聞こえる曲は?」
「ピアノかなた、わりとシュタイン」
「ハーイ、良くできましたー、さすがはトリオ・ザ・ペンチ!」
「あのねえ、二人とも、連想ゲームやってるんじゃないんだからね」

と、科学以外のことには全く無知な伴ちゃん、何のことやらさっぱりわからないといった顔付きで、

「それで、統計学でもその画期的な出来事が起こったんだよ。 ロンドン郊外にあったロザムステッド農事試験場の、統計技士をやっていたフィッシャーって人が、1925年に『研究者のための統計的方法』って本を発表して、それによって、統計学は画期的な変化をすることになったんだよね」
「どんなことしたんだい、そのフィッシャーって人?」
「フィッシャーはね、研究者がやる実験とか試験とかは、ものすごく沢山の例からできている、ある理想的な集団の標本に過ぎないってことに気付いたんだよ」
「理想的な集団って?」
「例えば、さっきの体重の例で言えば、体重を測定した100人の人達は、日本人全体ってわけじゃないよね?」
「うん、そりゃ当然だね」
「だから平均値の60kgって値も、その人達の平均値ではあるけど、日本人全体の平均値ってわけじゃないよね」
「うん、そいつも当然だな」
「だけど僕等が知りたいのは、本当は日本人全体の平均値の方なんだよ。 僕等がやる実験だって、これと同じだよね?」
「そーかなァ。 だって、相手は人間じゃないわよ」と、ミミちゃんが異議を唱えた。
「人間じゃなくても同じだよ。 生物の実験のことを考えてみれば、すぐわかると思うよ。 マウスやラットを何匹か使って実験するけど、本当に知りたいのは、全部のマウスやラットを使った時の実験結果だよね?」
「つまり、どんなマウスやラットにも当てはまるような、普遍的な結果が知りたいってわけだね?」
「そうそう、そのとおり。 よくわかってるね、友則」
「つまり、『ああ、ホントのことってなんだろー? 青い海なんて大っ嫌いだーっ!』ってわけね?」
「ほとんどわかってないね、ミミちゃんは」
「んまァ、ひっどーい! いーわよ、いーわよ、夕日に向かって『バカヤローッ!』って叫んでやるからァー」
「ま、そういうわけで、その日本人全体のような、すごく大きな集団のことを『母集団』って呼び、そこから選んだ小さな集団のことを『標本集団』って呼んで、はっきりと区別したんだよ、フィッシャーは」
「募集団? 募集して集めた、アルバイトみたいな集団なわけ?」
「母の集団って書くんだよ」
「あの、恐ろしいPTAのことね!」
「母なる集団って意味だよ。 本当は母集団について色々と調べたいんだけど、何しろ相手が大きすぎるから、仕方なく手近な標本集団を調べて、その結果から母集団の様子を推測することで我慢しているんだよね、普通は」
「普通はってことは、フツーじゃない、ほとんどビョーキのようなこともあるわけ?」
「別に病気とは限らないけど、例えば国勢調査みたいに、日本人全体を調べちゃうこともあって、そんな場合は、母集団そのものを調べていることになるよね」
「フムフム、そー言えば、何年かに一度、氏名小山内ミミ、性別女、年齢妙齢、身長高からず低からず、体重秘密、スリーサイズは80・60・80なんて、いちいち調査しに来るわねェ」
「誰も、ミミちゃんのスリーサイズなんか聞いとりゃせんよ」と、僕。
「でも、僕等がやる実験なんかは、相手が自然だから、理屈から言っても母集団を調べるなんてできっこないよね。 何しろ相手は、実験条件なんかで無限に変化しちゃうもんね」
「でも、実験やる時って、そんなことあんまし意識してないけどな、あたし。 やっぱ誰でもみんな、おんなし相手を調べてるって思っちゃうわよ」
「フィッシャー以前の統計学も、そうだったんだよ。 実験結果をそのまま要約して、数学的に記述するだけだったんだよね。 それが古典統計学、つまり記述統計学なんだよ」
「国勢調査から発達したんなら、当然だろうね、それは」と、今度は僕。
「それに対して、フィッシャーが考え出した新しい統計学は、標本集団の要約値から母集団の要約値を確率的に推測して、それによって母集団の様子を数学的に記述するというもので、『推測統計学』、または真ん中を省略して、『推計学』って呼ばれているんだよ」
「それが『近代統計学』ってわけだね?」
「うん。 だから現在では、単に『統計学』って言えば、『近代統計学』つまり『推測統計学』を指すことになっていて、昔風の統計学を指すには、わざわざ『記述統計学』とか『古典統計学』とか言うことになっているんだよ」
「でも、ほんとに母集団を調べたわけじゃないんだもん、推測統計学って、あんまし信用できないんじゃないのォ?」

と、ミミちゃんは胡散臭げな顔付きだ。

「実は、そのとおりなんだよ。 推測統計学を適用するためには、母集団の正しい代表となるように、母集団から、それなりの方法で標本集団を選び出す必要があるんだよ」
「それなりの方法って?」
「『無作為抽出法』といってね、変な偏りがないように、乱数を利用して、デタラメに標本を抽出する方法なんだよ」
「デタラメに選ぶなんて、無責任もいーとこねェ」
「デタラメと言っても、ムチャクチャなわけじゃないんだよ。 母集団のどの標本も同じような確率で選ばれるように、偏った標本集団にならないように、ちゃんと計算されたデタラメさなんだよ」
「それじゃ、『無作為抽出法』じゃなくって、『作為抽出法』じゃないの?」
「うん、本当はそうなんだよ。 でも、一応、習慣で無作為抽出法って呼んでるけどね」
「まあ、国会議員の選挙と違って、賄賂もコネも入らないからいいよね。 それこそ『公明正大』な方法だね」と、僕。
「ところが、この方法にも色々と問題があるんだよ。 無作為抽出するためには、母集団を全部集めておく必要があるんだけど、実験なんかではそんなこと不可能な場合が多いよね」
「多い、多い。 そんなことできたら、何も標本を選ばなくても、母集団を全部使って実験やっちゃえばいいもんな」
「うん、だから普通は、適当な標本集団で実験をやっちゃってから、その標本集団の背景因子とか実験条件なんかを調べて、実験結果を当てはめるべき母集団を逆に規定することになるんだよ。 そんな母集団のことを『準母集団』っていうんだよね」
「背景因子って、何?」と、ミミちゃん。
「例えば人間で言えば、性とか年齢とかいった、その集団を特徴づけるような因子で、実験結果そのものじゃなくて、実験結果に影響を及ぼしそうな因子のことだよ。 けっこう重要なんだよね、これが」
「なるほどー、だから『ハイケイ』っていって、うやまってるわけね」
「んでもって、実験結果に影響を及ぼしそうな実験器具のことを、『ケーグ因子』ってゆーんだよねー」と、僕。
「う〜ん、苦しいダジャレねェ。 寒いぜ、トリオ・ザ・ポンチ!」
「ヘイ、すんません、もっと修行して出直しますぅ〜!」

「それで、僕等がやる実験の母集団は、たいてい準母集団なんだよね。 同じ実験をやっても、違う結果になっちゃうことがあるけど、あれはデータの誤差によるものじゃなくて、標本集団の違いによることが多いんだよ。 結果を当てはめるべき準母集団が違うんだから、違う結果になっても、別に矛盾しているわけじゃないんだよね」
「そーかァ、だからみんなとおんなしよーに実験してても、あたしだけ違う結果が出ちゃうのねー。 あたしはまた、あたしに超能力でもあって、自然法則変えちゃうのかと思ってたわァ」
「ミミちゃんのは、どっちかってーと準母集団の違いじゃなくて、やっぱり超能力じゃないかなぁ。 何しろ、ちょっと触っただけで実験器具をブッ壊せる人なんて、めったにいないからねー」

と僕が突っ込むと、ミミちゃんは、

「悪かったわね、超能力者で! いーもん、あたしは理論派だもんね、”歌って踊れる”理論物理学者を目指すんだもんねー」

と、すねたように言った。 彼女のすねた表情もなかなか可愛いんだな、これが。

「そー言えば、伴ちゃんの超能力もすごいよね。 ほら、この間、伴ちゃんが生化の実験室に入っていったら、とたんに遠心分離器がぶっ壊れちゃったの覚えてるだろ? あれ以来、伴ちゃん、『四条効果』って呼ばれて、生化の連中から恐れられてんだぜ」
「あら、あれは、ほんとは『四条−小山内効果』って呼ぶべきなのよね。 だってあの時、生化の人達、あたしと伴ちゃんが仲良さそーに話してるのポケーッと眺めてて、遠心分離器の操作、間違えちゃったみたいなんだもん」
「そりゃあ、伴ちゃんとミミちゃんが仲良く並んでるのを見たら、誰だってショック受けるさ。 僕だって、最近、よーやく慣れたばっかりなんだからね」
「あら、そーなの? じゃ、みんなが早く慣れるよーに、仲いいとこ、うーんと見せびらかさなくちゃー。 ね、伴ちゃん?」
「あのねー、それでねー、準母集団の話なんだけどねー」

伴ちゃん、苦手な話題になったもんだから、躍起になって話を元に戻そうとした。

「実験の準母集団がどんな特徴を持っているのかってことをよく把握しておくことは、ものすごく大事なことなんだよ」
「あれ? 顔が赤くなってるよ、伴ちゃん。 一体、どしたんだい?」
「大学生にもなって、カワユイもんでしょー? だから好きなんだ、伴ちゃんって」
「あのねー、真面目に聞かないんだったら、もうよすよ、僕」

伴ちゃん、とうとう真っ赤になってすねてしまった。 伴ちゃんのすねた表情は、もちろん、ミミちゃんと違って可愛くとも何ともない。

「へへーっ、何とぞお許しを、四条大明神様ーっ!」
「つまり、実験結果を当てはめられるのは、その実験の準母集団とおんなしよーな特徴持ってる集団だけだからってこと?」
「うん、まさしくそのとおりなんだよ」

伴ちゃん、嘘みたいにケロッとした顔色になって説明を続けた。 さすがはミミちゃん、伴ちゃんの操縦法を十分心得ている。

「しかも、実験結果はあくまでも標本集団についての結果だから、それから準母集団の様子を推測する時には、どうしても確率的になっちゃうんだよ」
「てことは、実験結果からは、確率的にしか物が言えないってことなの?」
「うん、その実験だけについて言えば、確定的な、確実なことが言えるんだけど、それを準母集団にまで広げて、ある程度普遍的なことを言おうとすると、どうしても確率的な、不確実なことしか言えなくなっちゃうんだよね」
「あんまし科学的じゃないわねー、推測統計学って」
「普通に考えると、そうなるよね。 でもね、限られたデータから普遍的なことを推測する場合には、決定的なことを言う方が、かえって非科学的になることもあるんだよ」
「難しいもんだね、『科学的』ってのは」と、今度は僕。
「そうだね。 ただ、確かに推測統計学じゃあ不確実な結論しか言えないけど、その不確実さの程度とか、どんなふうに不確実かってことが、数学的に厳密に計算できるってとこが、普通の意味の不確実さとは違っているとこなんだよ」
「訳のわからん不確実じゃなくて、訳のわかった不確実ってわけだね」
「なーんか、割り切れない気持ちねェー、統計学って」と、ミミちゃん。
「うん、そうだね。 でも、まあ、これは統計学の宿命みたいなもんで、仕方ないよね。 フィッシャー以後も、ネイマンやピアソンといった人達によってどんどん発展されて、現在に至っているんだけど、その原理はちっとも変わってないんだよ。 まとめてみるとね、こんな具合になるんだよ」

と言って、伴ちゃんはレポート用紙に次のような図を描いた。

記述統計学と推測統計学

「こんなふうに」と言って、伴ちゃんは上の図を指差し、「母集団のデータを直接要約して、その様子を数学的に記述するのが記述統計学、つまり古典統計学で……」次に下の図を指差し、「母集団から標本集団を無作為抽出したり、 標本集団から準母集団を逆規定したりして、 標本集団の要約値から母集団の様子を確率的に推測するのが推測統計学、つまり近代統計学なんだよ」
「なるほどねぇ。 そんでもって、僕等がやる実験ってのは、ほとんど標本集団を相手にしているわけだから、記述統計学じゃなくて、推測統計学を使わにゃならんってわけだね」
「じゃ、もし標本集団に記述統計学使っちゃったら、どーなるの?」と、ミミちゃん。
「別に、使ったってかまわないよ。 ただ、その結果を母集団にまで広げて、普遍的なことを言わなきゃいいんだからね」
「普遍的なことを言えなきゃ、実験やった意味があんまりないもんなぁ」と、今度は僕。
「あら、そんなことないわよー。 だって、あたし結果違ってたけど、実験レポート出したら、ちゃんと単位くれたもん」
「それはねぇ、いつまでもミミちゃんに実験やらせとくと、実験器具をみんな壊されちゃうもんだから、恐れおののいて単位出したんだよ、先生も」
「んまっ、失礼しちゃうわね、友則君ったら! いーわよ、今度、下宿遊びに行ったら、あたしがお茶入れてあげるから」
「ぎょえーっ、そ、それだけはお止め下され、お奉行様ぁ〜!」
「僕の使ってたマグカップ、みんな割っちゃったもんね、ミミちゃん」と、伴ちゃん。
「みんなつっても、たった3つじゃない。 それに、あたしが可愛らしいコーヒーカップ、プレゼントしてあげたから、いーでしょー?」
「でも、あれ、可愛すぎて、なんか女の子みたいで、使うの恥ずかしいんだよね。 だからこの頃、丼でコーヒー飲んでるんだよ、僕」
「あっれー、伴ちゃん、相変わらず鈍いんだなぁ」と、僕。
「え? 何が?」
「あれって、カップル用のお揃いのやつなんだぜー。 あの片割れがミミちゃんの下宿にあったの、気付かなかったのかい?」
「いーのよ、いーのよ、あたしなんか。 いじらしい女心を笑顔で隠して、ただひたすら堪え忍ぶ、薄幸の美少女なんだもん、グスン……」

と、わざとらしく悲劇のヒロインを演じるミミちゃん。

「ほとんに……? そうかぁ、それならそうと、早く言ってくれればよかったのに。 しまったなぁ、失敗しちゃったなぁ……」
「何を?」
「そんなこと知らないからさあ、この間、あのカップを友則に使わせちゃったんだよ。 しまったなぁ、そうと知ってたら、使わせなかったのになぁ……」
「ヘェ、ヘェ、そーですか、そーですか、どーせあたしゃー邪魔者ですよ。 さっ、もー帰るか」
「ちょ、ちょっと待ちなよ、友則。 統計学の話は、これからが本番なんだよ」
「そーよ、そーよ。 それに、あてつける相手がいなきゃ、つまんないじゃない、こっちも」
「……」