玄関
>
会議室
館内案内図
第1展示室
第2展示室
第3展示室
第4展示室
特別展示室
会議室
管理室
他館への連絡通路
会議室
この会議室はパソコン通信と同様のオンライン掲示板です。 どんな話題でもかまわないので気軽にじゃんじゃん書き込んでください。
閲覧
投稿
過去ログ倉庫
[書き込み削除]
1977 番の書き込みのパスワードを入力してちょ!
1977.
Re[1976]:中心極限定理と正規近似
投稿者:
杉本典夫
[
URL
] 投稿日:2024/08/27 (Tue) 10:08:39
>F.Y.Edgeworthさん
はじめまして、当館の館長を務めている”とものり”こと杉本典夫と申します。m(_ _)m
中心極限定理と正規近似の質問をいただき、ありがとうございます。中心極限定理による正規近似の問題については、純粋数学分野と数理統計学分野と応用統計学分野の間でたまに議論になります。これは統計学をどのような学問として捉えるかで、統計学の解釈が異なるからだと僕は思っています。
僕は研究現場のデータ解析屋ですから、応用統計学分野の解釈に近くて「統計学は応用数学ではなく数学応用学だ」と思っています。
つまり正規分布のような確率分布に厳密に従うデータは厳密には存在しないが、実用的な有効数字範囲内(有効数字にして2〜4桁程度)なら近似的に確率分布に従うとみなすことができるので、現実のデータを確率分布でモデル化し、その確率モデルを用いてデータの標本統計量を数学的に求めて母数を推測し、現実のデータと確率モデルの誤差を考慮して母数を解釈することによって、現実のデータがどのような情報を持っているかを推測する、という統計モデルの考え方を支持しています。
これは端的に言えば「現実のデータを解釈するには、現実のデータの有効数字範囲内で近似した統計モデルでかまわない」という考え方であり、理論物理学が数学を応用して自然現象を解釈する時の考え方と同様です。この考え方に従えば、中心極限定理による正規近似について数学的に厳密な証明は必要ではなく、有効数字にして2〜4桁程度の近似でかまわず、値の範囲は現実のデータの範囲(例えば体重のデータなら、実数全体の集合Rではなく10〜200程度の実数範囲の集合)の近似でかまわない、ということになります。
参考までに、数理統計学分野における中心極限定理の証明を次のページに記載してあるので参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.3 データの要約方法 (注7)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note07
'>
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note07
また中心極限定理をシミュレーションした結果を次のページに記載してあります。数学応用学的な観点からは、このシミュレーションの誤差程度なら、中心極限定理による正規近似を現実のデータに十分応用できると考えています。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→付録2 中心極限定理のシミュレーション−平均値と中央値
http://www.snap-tck.com/room04/c01/stat/stat99/stat9902.html
'>
http://www.snap-tck.com/room04/c01/stat/stat99/stat9902.html
以上、参考になれば幸いです。