玄関小説とエッセイの部屋小説コーナーいつかどこかで

【5.標準誤差とは何ぞや?】

「そー言えば、伴ちゃん、SDと似たやつで、SEだかSFだかってやつなかったっけ?」
「あったよ、SEのことだよね? SEはね、『標準誤差』っていって、『standard error』の略だよ」
「ヒョージュンゴサァ……? それ、一体何者?」

と、ミミちゃんはそんなヤカラは見たことも聞いたこともないってな顔つきだ。

「標準誤差は標本平均の標準偏差のことで、標本平均のバラツキ具合を表す値だよ」
「標本平均の標準偏差ァ? なんかよくわかんないヤツねー、そいつ」
「さっきの体重の例で説明するとね、最初に描いたのはデータの度数分布だったんだけど、今度は標本平均の度数分布図を描いてみるよ……」と言いながら、伴ちゃんはレポート用紙にグラフを描き始め、「さっき、標本平均値は60だったから、まずこれをエックスバー1としてプロットするね」
「フン、フン」と、僕は合いの手を入れた。
「次に、今の100人の標本集団を、一旦、母集団に戻しちゃって、改めて、また100人の標本集団を無作為抽出したとするね」
「それから、それから?」
「それでその標本平均値を計算すると、それは60に近い値だろうけど、ぴったりと同じになることは、まずないよね」
「なるほど、なるほど」
「例えば、その標本平均値が55になったとしたら、その値を、今度はエックスバー2としてプロットするんだよ」
「どーして、どーして」
「こうした操作を、何度も何度も繰り返していくとね……」

と言いながら、伴ちゃんは次のような図を完成させた。

標準誤差

「とうとう最後には、こんな奇麗な標本平均の分布ができあがるんだよ」
「いよいですなー、兄弟!」
「あのねぇ、友則、二人で掛け合い漫才やってるんじゃないんだからね」
「わりー、わりー、掛け声かけないと、ミミちゃんがまた眠っちゃうもんだから……」
「誰が眠るんですって?」と、ミミちゃん。
「ハハハハハ、いやぁ、なかなかですなー、兄弟。 ……それで、標本平均の分布がどうしたんだって、伴ちゃん?」
「でね、この標本平均の分布について、3つのことが成り立つんだよ」
「3つのことって?」
「まず1つは、『標本平均の平均値は母平均と一致する』ということだよ」
「あ、それは何となくわかるなぁ」
「そうだよね。 何度も何度も繰り返し無作為抽出すれば、最終的には、母集団全体をサンプリングしたことになっちゃうんだから、標本平均の平均値が母平均と一致するのは当然だよね」
「じゃ、標本平均を平均すると、秘密の床屋さんになっちゃうのねー」

と、ミミちゃんがまた意味ありげに口を出したので、僕はとりあえず突っ込んでみた。

「また始まったなぁ? ほら、言ってみんしゃい、何が言いたいんじゃ? 聞いてしんぜよーじゃないの」
「まっ、バカにして! いーわよ、いーわよ、友則君なんか、教えてあげないもん!」
「ほらほら、すねない、すねない、可愛い顔がだいなしだよ。 どーゆーわけで床屋なんだい?」
「だって、エックスバーの平均だから、エックスバーバーでしょ? だからよ」
「……何だい、それ?」
「……どーして? 確かに、標本平均の平均を表す時に、Xの上にバーを二本書いて、『エックスバーバー』っていうことがあるけど、それがどーして床屋になっちゃうの?」

と、伴ちゃんも不思議そうに尋ねた。

「これだからヤなのよね、キョーヨーの無い人は」と、ミミちゃんは怪訝そうな僕と伴ちゃんの顔をかわるがわる眺め、「『バーバー』ってのはね、英語で床屋のことなのよ」
「ほんと? へぇー、知らなかったなぁ。 じゃあ、パーマ屋は『ジージー』かい?」
[ババァが床屋だから、ジジィはパーマ屋だって言いたいんでしょ、友則君」
「ばれたか! ばれてしまっては致し方あるまい、わっはっはーっ」
「当ったり前よ! 10年遅いわよ、そんなダジャレ」
「へぇー、そう、『バーバー』って床屋のことなの? なるほどねぇ、それでエックスバーバーが秘密の床屋になっちゃうってわけか。 なるほど、それは面白いねぇ、ははははは……」

と、伴ちゃんは間延びした声で呑気に笑った。

「ちっとも面白かないわよ、ほんとにもォー! キミタチの語学力の無さを計算に入れなかった、あたしがバカだったのよねー」

「それで2つ目は何だい、伴ちゃん?」と、僕。
「2つ目はね、『標本平均の標準偏差は、母集団の標準偏差を標本集団の例数の平方根で割った値になる』ということなんだよ。 つまり、母集団の標準偏差をσ、標本集団の例数をnとするとね……」

と言って、伴ちゃんは次のような式を書いた。

SD x = σ n =SE

「……ってなるんだけど、この標本平均の標準偏差のことを『標準誤差』って呼ぶんだよ」
「でも母集団の標準偏差って、実際にはわからないんだろ?」
「うん、だから普通は、標本集団のデータから求めた、標準偏差の推測値で代用して……」

と、伴ちゃんは続けて式を書いた。

SE=SD x σ n SD n = (x-x ) 2 n(n-1)

「……って計算しているんだよ。 このことからわかるように、標準誤差ってのは標本平均のバラツキ具合を表していて、標本平均で母平均を推測する時の、誤差の大きさの目安になる値なんだよね」
「なるほどねぇ、それで標準誤差って呼ばれてるんだな」
「うん、そのとおりなんだよ。 ただ、正確に言うと、標本平均に限らず、統計量の標準偏差のことを、全部、標準誤差って呼ぶんだけど、普通は標本平均の標準誤差を問題にすることが多いもんで、単に『標準誤差』って言えば、標本平均の標準誤差を指すことになっているんだよね」
「じゃあ、中央値とか最頻値の標準誤差もあるわけ?」

と、今度はミミちゃんが尋ねた。

「もちろん、あるよ。 この式とはちょっと違う式だけどね。 だから、標本平均の標準誤差を厳密に区別して表したい時は、『standard error of mean』の略で、『SEM』って書くんだよ」
「そー言われれば、そんな記号、外国の論文か何かで、チラッと見た覚えがあるなぁ」と、僕。
「だろうね。外国では、SEMの方が一般的らしいもんね」
「『らしい』って、伴ちゃん、外国論文もすらすら読めなきゃ、一流の科学者にゃなれんそーだよ」
「あら、友則君、人のこと言える立場なの?」と、ミミちゃん。
「僕はいいさ、一流の科学者になろーなんて、大それた野望は抱いてないから。 でも、伴ちゃんはそーゆーことじゃあイカンよ」
「大丈夫、大丈夫! 語学の天才、小山内ミミがついてるもん」
「『語学』の天才じゃなくて、『誤学』の天才だろ?」
「そーゆーダジャレは、セリフを読んでる人にはわかっても、話してるあたしたちにはわかんないはずなのよねー、ほんとーは」
「またそんな、登場人物という立場をわきまえないセリフを……」
「作者がいー加減だもん、あたし達登場人物がフォローしてやんなくちゃー。 作者も草葉の陰で感謝してるわよ、きっと」
「それにしても、伴ちゃん、科学に出てくる外国語はやたらとよく知ってるのに、普通の単語となると、どーしてだめなんだろーねぇ?」
「科学に出てくる言葉は、外国語と思ってないもんね。 単なる記号と思ってるから、自然と覚えちゃうんだよ、多分……」

と、伴ちゃんは人事のような口振りだ。

「その調子で普通の単語も覚えてくれたら、あたしも、あんなに苦労して英語教える必要ないのにねェ」

と、ミミちゃんがやれやれといった視線を伴ちゃんに投げたので、伴ちゃんは慌てて僕の方を向き、

「……というわけで、標準誤差は『SEM』とも書くんだよ、友則」
「四条君! 話をそらしちゃ駄目でしょ? ホラッ、先生の目を見て、『僕はやってません』ってはっきり言ってご覧なさい!」
「学園ドラマだね、まるで」と、僕。
「えーとね、それからね、この式から、標準偏差、つまりデータのバラツキ具合が同じなら、例数が多いほど標準誤差が小さくなって、標本平均の信頼性が高くなることがわかるよね?」
「うん、確かに。 つまり、データの数が多いほど、実験結果が信頼できるってことなんだね? 考えてみりゃー当然だな、そいつは」
「うん、そのとおり、そのとおり」
「つまり、『下手な鉄砲も数撃ちゃ当たる』ってわけね? 考えてみれば当然ね、それは」
「うん、そのとおり、そのとおり……かなぁ?」
「ミミちゃんの場合、『ド下手な鉄砲、いくら撃っても当たらない』と言うべきだね」
「んまっ、失礼しちゃうわね! いーのよ、鉄砲なんて。 あんな危ないもんは、当たらないほーが平和でいーのよ、ナイチンゲールもそー言ってるわ」
「そんなこと言ってたっけ、あの人?」
「男は、細かいことをいちいち気にするもんじゃないわ。 この際、細かいことはどーだっていーのよ、大切なのはその心よ、精神よ!」

「それで3つ目は何だい、伴ちゃん?」
「3つ目はね、『この標本平均の分布は、母集団がどんな分布をしていても、必ず正規分布になる』ってことだよ」
「必ず正規分布になる? どないなわけ、それ?」
「例えば、母集団がこんな一様分布だったとするよ」

と言いながら、伴ちゃんは次のような図を描いた。

中心極限定理

「この母集団から標本集団を無作為抽出すれば、たいてい、小さい値から大きい値まで、まんべんなくサンプリングされるはずだよね? 小さい値ばっかりとか、大きい値ばっかりとかがサンプリングされることって、あんまりないよね?」
「ふむ、ふむ、それはそのとおりだろうね」
「だよね? だから、そうしてサンプリングされた標本集団の平均値は、当然、母平均に近い値が多くなって、母平均から離れるほど少なくなるんだよ。 それでその結果、標本平均の分布は正規分布になっちゃうんだよね」
「なるほどねぇ、そー言われれば、そのとおりだって気もしてきたねぇ」
「これは『中心極限定理』って呼ばれる定理で、この定理によって、平均値だけじゃなく、色んな統計量が正規分布するようになるし、そのことが推測統計学の基礎になってるもんだから、ものすごく重要で、有名な定理なんだよ」
「中心極限定理……? そんな定理、有名じゃないわよォ。 だって、あたし知らないもん」

と、ミミちゃんがあっさり言った。

「数学を知っている人の間では有名って意味だよ」
「『知る人ぞ知る』だね」と、僕はもっともらしく言った。
「知らない人が知ってちゃ、おかしーもんね、実際」
「ミミちゃんの場合、単なる無知だって気もするけどねぇ」
「無知とは何よ、失礼な!」と、ミミちゃんは憤慨したように、「これでも、知らないこと以外は、なーんだって知ってんのよー」
「ほー、そりゃスゴイねぇ。 僕なんか、知ってること以外は何にも知らんもんなぁ」
「大丈夫、大丈夫、そんなに悲観することないわ。 文部省のゆーことだけ聞いて、真面目にお勉強すれば、知ってることでも『記憶にございません』って知らんふりして、知らないことでも知ったかぶりする、立派な大人になれるわよ、きっと」
「かもね。 そんでもって、立派な汚職政治家になって、恥ずかし気もなく『道徳教育に力を入れよ』なーんて言ったりしてね」
「そー言えば、伴ちゃん、中間極限定理って知ってる?」
「中間極限定理……? 何、それ?」と、伴ちゃん。
「中間で休憩しないと、頭が極限状態になっちゃって、なーんにも考えられなくなっちゃうってゆー、恐ろしい定理よ」
「……何だい、それ? どういうこと?」

ミミちゃんのかけた謎がわからず、伴ちゃんはしきりと首をひねるばかりなので、仕方なく僕が代わりに答えてやった。

「わかったよ、ミミちゃん。 ここらでちょっと休憩しようって言いたいんだろ?」
「ピンポーン! 友則君、大正解!」
「なんだ、そんな意味なのか。 それじゃあ、ここでちょっと一休みしようか?」
「バンザーイ! じゃ、あたし、お茶でも入れてあげるわね」

と喜び勇んで立ち上がりかけたミミちゃんを、僕と伴ちゃんは慌てて制した。

「ちょ、ちょっと待ちなよ、ミミちゃん、ちょーっと待っちくれーっ!」
「え? 何?」
「まあ、いーから落ち着きなって。 お嬢様は、ゆっくりお座りになっててくださいませよ。 お茶を入れるなんて、そんなシモジモのすることは、私めにお任せあれ」
「友則の言うとおりだよ、ミミちゃん。 僕の湯飲み茶碗も、もう残り少ないことだし……」
「まっ、二人してあたしのことバカにして! いいこと、伴ちゃん、今のうちにあたしにお茶入れる練習させとかないと、将来、きっと後悔することになるわよォ」
「え? ど、どうして?」
「なーるほど、それは言えてるなぁ。 伴ちゃん、これはミミちゃんが正しい!」と、僕は同意した。
「えっ、友則まで……!? だから、どうしてなんだい?」
「あらまあ、いやですわ、伴人さんったら。 そんな恥ずかしいこと、女の口から言わせるおつもりですの?」

わざとらしくそう言いながら、ミミちゃんはしおらしく俯いて、上目遣いに伴ちゃんを見やった。

「き、気持ち悪いなぁ……。 大丈夫、ミミちゃん? 熱でもあるんじゃないの?」

さっぱり訳がわからない様子の伴ちゃん、気味悪そうに、それでいて少し心配そうにミミちゃんを見つめて、ボソッとつぶやいた。

「やっぱり、休憩するのがちょっと遅すぎて、中間極限定理、適用されちゃったのかなぁ……?」