玄関会議室の過去ログ

会議室の過去ログ

No.1858 - 1907 / 50 件表示


1907. Re[1906]:[1904]:[1903]:セミパラメトリックモデルとパラメトリックモデルについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/11 (Fri) 08:57:11
>生存時間解析の初心者さん & 北の大学院生さん
>> 比例ハザード性の仮定の利便性から医療系ではCox比例ハザードモデルが頻用されているそうです。
医学分野で生存時間解析が盛んに用いられるようになった30年ほど前は、パラメトリックモデルが主流でした。そのため僕も流行に乗り、自作のデータ解析ソフトでパラメトリックモデルをサポートしました。
でも理論が難しいことと、サポートしている統計ソフトが少ないことから、単純なCoxの比例ハザードモデルが使用されるようになった……というのが実態ですね。(^_^;)

パラメトリックモデルについては、次の本に詳しく解説されていますよ。
・「エモリー大学クラインバウム教授の生存時間解析」David Kleinbaum・Mitchel Klein著、神田英一郎・藤井朋子訳、サイエンティスト社 、2015年
https://www.amazon.co.jp/%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%E3%81%AE%E7%94%9F%E5%AD%98%E6%99%82%E9%96%93%E8%A7%A3%E6%9E%90-David-Kleinbaum/dp/4860790723/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=3VZYQUQOPRCWG&keywords=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88&qid=1668121609&s=books&sprefix=%E3%82%A8%E3%83%A2%E3%83%AA%E3%83%BC%E5%A4%A7%E5%AD%A6%E3%82%AF%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%90%E3%82%A6%E3%83%A0%E6%95%99%E6%8E%88%2Cstripbooks%2C168&sr=1-1

>> つまり医学では、説明変数が与える影響を知るためにCOX比例ハザードモデルが使われているのであって 生存時間の推定を目的とはしていない
>> とういう認識でいいのかな?
そのとおりです。
その証拠に医学論文では、Cox比例ハザードモデルを使っているにもかからわず、生存率のグラフは単変量の累積生存率曲線を描きますよね。Cox比例ハザードモデルを使ったのなら、本来は多変量の累積生存率曲線を描かないと整合性が取れません。
生存時間解析は、元々は生命保険会社が生命表を作成して、保険料を計算するために開発した統計手法です。そのため以前は「生命表解析」と呼んでいました。そして生命表解析は、特定の時期の生存率を予測することが主目的です。そのため主としてパラメトリックモデルを用い、セミパラメトリックモデルはあまり用いません。

ちなみに多変量の累積生存率曲線とは、例えば当館の次のページの「図11.4.1 基準生存関数と理論的生存関数」のようなグラフのことです。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.4 比例ハザードモデル
http://www.snap-tck.com/room04/c01/stat/stat11/stat1104.html

>> 一般的に医療現場で平均生存期間として使われる値は、カプランマイヤー法の生存曲線で生存率がちょうど50%になる時期の累積生存率のことです。これを専門用語では「生存期間中央値」といいます。
細かいツッコミで恐縮ですが、平均生存時間と生存期間中央値つまり50%生存時間(MST:Median Survival Time)は別物です。そしてよく誤解されていますが、Cox-Mantel検定もログランク検定も一般化ウィルコクソンの2標本検定もMSTの検定ではなく、あくまでも生存順位の検定です。
医学界でMSTが多用される理由は、平均生存時間は全例が死亡しなければ求められないのに対して、MSTは半数以上が死亡すれば求められるからですね。実は、生存時間解析は「全例が死亡する」という前提で理論を構築しています。そのため全例が死亡していない時は、解析結果は不正確になります。このことも、医学分野ではあまり知られていないと思います。

>> 検定する意味はあるのか??
>> 厳密にいえば検定するまでもなく すべての説明変数が成り立たないのでは?
そのとおりです。
比例ハザード性の検定は、ある時期の2群の生存率が0.1%異なっていても、例数が多くなれば有意になり、「比例ハザード性が成り立っていない」ということになります。
以前、100万例程度のビッグデータの解析をしたことがあります。その時、体重が0.1kgつまり100g増加しても検定結果が有意になりました。
「2つの平均値の差が有意」ということは、「2つの平均値がぴったり同じ値ではない」ということが95%以上の確率で言えるという意味であり、「2つの平均値が科学的に意味があるほど異なっている」ということが95%以上の確率で言えるという意味ではありません。そのため、はっきり言って検定は無意味です。
そこでネイマンとピアソンは、Fisher流の有意性検定を否定し、科学的な許容範囲つまり科学的に同等と考えられる範囲と、区間推定の結果(信頼区間)を比較することによって、科学的に意味のある結論を導くための統計学を提唱しました。それが、現在、主流になっているネイマン・ピアソン統計学です。
ところがFisher流の有意性検定にどっぷりと染まってしまった研究者達が、「どうしても検定がしたい!」と要望したので、仕方なく科学的な許容範囲と信頼区間を組み合わせて統計的仮説検定を開発しました。しかしネイマンとピアソンの元々の目的は検定を廃止することだったので、彼等自身は統計的仮説検定はほとんど使いませんでした。
僕はネイマン・ピアソン統計学派ではありませんが、検定廃止論者ではあります。σ(^_-)

推定と検定と科学的判断の関係については、次のページを御覧ください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.7 ハンディキャップ方式の検定 (1) 推定と検定の関係
http://www.snap-tck.com/room04/c01/stat/stat01/stat0107.html
※「図1.7.1 検定結果と信頼区間」とその下の表が参考になると思います。

1906. Re[1904]:[1903]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 12:33:09
>北の大学院生
生存期間中央値など 一般的に用いられる数値を調べてみようと思います!


打ち切りデータの多い部品の故障データ に 生存時間解析を当てはめようと考えていまして
参考となる 資料がないため, 現在は
多変量のパラメトリックモデル で モデル構築 
testデータで評価しようかなと考えています。

1905. COX比例ハザードモデルの ハザード性 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 12:24:07
COX比例ハザードモデルは ハザード性が成り立つことを前提とし
比例ハザード性が成り立つかどうか  検定を行っていますが

実際は 成り立たないケースがほとんどだと思います。
その中で 検定を行って  p< 0.05だから ハザード性が成り立たないと
検定する意味はあるのか??
厳密にいえば検定するまでもなく すべての説明変数が成り立たないのでは?

1904. Re[1903]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 12:23:23
>生存時間解析の初心者さん

一般的に医療現場で平均生存期間として使われる値は、カプランマイヤー法の生存曲線で生存率がちょうど50%になる時期の累積生存率のことです。これを専門用語では「生存期間中央値」といいます。

という説明もあるので、生存時間の目安として、“手持ちのデータで生存期間中央値”を出して、ほかの施設や研究と比較して明らかな差異がないか見るとかもいいのではないかと思いました。

差異があればデータ数なのか、施設の基準などの違いによるのか、時代によるものなのかなど様々なことを考えるきっかけとなると思います。

もしも上記の内容が間違っていたら申し訳ございません。

1903. 多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/10 (Thu) 11:53:08
杉本さん、北の大学院生さん、 回答ありがとうございます!!
なんとなくですがバラバラだった知識がつながっていった気がします。

較正能(Calibration)で評価しようかなとも考えていましたが
そもそも、多変量パラメトリックモデルにしないと 生存期間の情報が使えないのですね

つまり医学では、説明変数が与える影響を知るためにCOX比例ハザードモデルが使われているのであって 生存時間の推定を目的とはしていない
とういう認識でいいのかな?


R,EZR 触ってみたいと思います!

1902. Re[1900]:[1899]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 11:04:44
>生存時間解析の初心者さん

私は以前、Rの survivalパッケージをダウンロードしていました!

参考までに金芳堂から2022年06月 刊行された書籍にも生存期間の解析のサンプルデータ付きで実際にRで確認しながら読み進められる書籍もあります。
こちらの書籍で紹介されていたため、ダウンロードしましたが、すっかり忘れていました。

何か参考になれば幸いです。

1901. Re[1898]:[1895]:[1894]:比例ハザードモデル の評価について 投稿者:北の大学院生 投稿日:2022/11/10 (Thu) 09:53:28
>生存時間解析の初心者さんはじめまして、北の大地で研究を始めたばかりの者です。

>> 多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?

についてですが、私はEZRを使用しています。R、EZRは、医療系でもよくつかわれているソフトなので、統計解析→生存期間の解析で
Cox比例ハザード回帰、Fine-Gray比例ハザード回帰、Logrank検定、Logrank trend検定、Gray検定などを選択できます。(Rコマンダーのバージョン 2.7-1)

比例ハザード性の仮定の利便性から医療系ではCox比例ハザードモデルが頻用されているそうです。

私自身も生存期間の解析もできるようになりたいと思っているので、お互いに学習を頑張りましょう!

1900. Re[1899]:多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:杉本典夫 [URL] 投稿日:2022/11/10 (Thu) 08:44:11
>生存時間解析の初心者さん
>> 多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?
RやPythonにはバグがあるので(^^;)、僕はあまり使いません。そのためパラメトリックモデルのパッケージについては、残念ながらわかりかねます。でも以前はパラメトリックモデルが主流だったので、RもPythopnもサポートしているのではないかと思います。

>> 読み進めていると 比例ハザードの仮定の検定を行っており,
>> パラメトリック・ハザード比検定ではないのか???
>> 実はパラメトリックモデルではない??と疑問に感じました
比例ハザード性を検討する手法は色々あります。パラメトリックモデルでは群ごとに色々なモデルを当てはめ、群によって最適なモデルが異なっていれば「比例ハザード性が成り立っていない」と判断するのが普通です。しかしこの方法は検定を使わないので、検定偏重&p値崇拝主義がまかり通っている医学界ではあまり使われません。
医学界では、ノンパラメトリック手法であるCox-Mantel検定の「異質性の検定」等を利用することが多いと思います。この手法をパラメトリックモデルと併用するのは矛盾ですが、検定偏重&p値崇拝主義がまかり通っている医学界は、そのような矛盾をけっこう平気で行いますね。(^^;)
これについては当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.2 生存率の比較方法
http://www.snap-tck.com/room04/c01/stat/stat11/stat1102.html

>> 11.6 パラメトリック生命表解析 を読み進めていくと
>> (4) パラメトリック多変量生命表解析 の部分で
>> "指数分布モデルの結果と比例ハザードモデルの結果はよく似ていることがわかると思います"
>> とありますが 時間を用いないで 順番の用いているだけの比例ハザードモデルと 似た結果が得られるのかがわからないです
この場合は観測時間が等間隔に近く、実際の時間を使った累積生存率曲線と、時間間隔を「1」にした時の累積生存率曲線が似ています。そのためパラメトリックモデルの結果と比例ハザードモデルの結果が似ているのです。観測時間が等間隔ではない時は、両者の結果は異なります。

>> セミパラメトリックモデルの "結果がデータに左右されやすくて普遍性がなく、理論的な取り扱いが困難で、実際のデータよりも先を外挿によって予測することはできません。"
>> という記述は データ量が十分にある場合は セミパラメトリックでも問題ないのでしょうか?
次の点で大いに問題があります。
1.観測時間が等間隔ではない時はパラメトリックモデルの結果とセミパラメトリックモデルの結果は食い違い、当然、パラメトリックモデルの結果の方が正確である。
2.セミパラメトリックモデルは観測時間を順位データにして分析しているので、生存率の外挿ができないだけでなく、観測期間を指定した時の生存率の内挿もできない。生存率を内挿で求められるのは、観測順序を指定した時の生存率だけである。

前の質問の回答とこの質問の回答は、1895番で紹介した「図11.6.1 指数分布モデルによる理論的生存率関数」と「図11.6.2 時間間隔を1にした時の理論的生存率関数」の説明を読めばわかると思います。再度、このあたりの説明をじっくりと読んでみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html

1899. 多変量セミパラメトリックモデルと パラメトリックモデルについて 投稿者:生存時間解析の初心者 投稿日:2022/11/09 (Wed) 15:03:17
先程に続いて質問です.
11.6 パラメトリック生命表解析 を読み進めていくと
(4) パラメトリック多変量生命表解析 の部分で
"指数分布モデルの結果と比例ハザードモデルの結果はよく似ていることがわかると思います"

とありますが 時間を用いないで 順番の用いているだけの比例ハザードモデルと 似た結果が得られるのかがわからないです

同じ結果がでるなら 比例ハザードでも評価しても良いように感じます

セミパラメトリックモデルの "結果がデータに左右されやすくて普遍性がなく、理論的な取り扱いが困難で、実際のデータよりも先を外挿によって予測することはできません。"

という記述は データ量が十分にある場合は セミパラメトリックでも問題ないのでしょうか?

1898. Re[1895]:[1894]:比例ハザードモデル の評価について 投稿者:生存時間解析の初心者 投稿日:2022/11/09 (Wed) 12:54:29
杉本さん 、わかりやすい解説ありがとうございます。
Cox比例ハザードを用いた文献やサイトが多く、生存日数で評価できるものと勘違いしそうになりました...
あくまで差を示すものなのですね

多変量パラメトリックモデルで 生存時間で評価するためのモデルを作成しようと考えていますが, なにか R,Python で行えるパッケージはありますでしょうか?
Cox回帰モデルはすぐに見つかったのですが...

Pythonのlifeline パッケージでワイブル多変量は見つけたのですが

https://lifelines.readthedocs.io/en/latest/fitters/regression/WeibullAFTFitter.html

読み進めていると 比例ハザードの仮定の検定を行っており,
パラメトリック・ハザード比検定ではないのか???
実はパラメトリックモデルではない??と疑問に感じました

何かご存知でしたらご教授いただけると幸いです


1897. Re[1896]:[1893]:ICCの必要例数について 投稿者:北の大学院生 投稿日:2022/11/09 (Wed) 12:23:00
杉本様、いつも大変お世話になっています。
丁寧なご説明ありがとうございます。

1892番で紹介した(注1)は観測回数を求める計算式、必要例数の計算式方法(注2)をサンプルデータなどで計算して十分に理解を深めたいと思います。

日々勉強になります。
今後ともよろしくお願いいたします。

1896. Re[1893]:ICCの必要例数について 投稿者:杉本典夫 [URL] 投稿日:2022/11/09 (Wed) 11:41:00
>北の大学院生さん
>> EZRでICC.Sample.Sizeにて
>> calculateIccPower: Function to calculate post-hoc power for ICC studies
>> calculateIccSampleSize:Function to calculate sample size required for studies where ICC is primary outcome.
>> の2つを計算しようかと考えています。
上の関数はICCの検定に基づいた検出力と必要例数を計算します。それに対して僕のサイトに書いた必要例数は、ICCの信頼区間に基づいた必要例数を計算します。そのため両者の必要例数は一致するとは限らないので注意してください。
実際問題として、ICCは検定を行うよりも、信頼区間を求めてICCの精度を評価する方が多いと思います。そのため僕のサイトでは信頼区間に基づいた必要例数の計算方法を説明しています。

なお1892番で紹介した(注1)は観測回数を求める計算式を紹介したものであり、必要例数の計算式方法(注2)で説明してあります。この計算方法は僕が考案したものなので、Rはまだサポートしていないと思います。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→5.4 級内相関係数と一致係数 (注2)
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note02

1895. Re[1894]:比例ハザードモデル の評価について 投稿者:杉本典夫 [URL] 投稿日:2022/11/09 (Wed) 09:06:18
>生存時間解析の初心者さん
初めまして、当館の館長を務めている”とものり”こと杉本と申します。当館の「統計学入門」を読んでいただき、ありがとうございます。m(_ _)m

>> 11章の4節にて C統計量の説明がありましたが、
>> セミパラメトリックの評価に用いられる C統計量は
>> あくまで 
>> モデルから予測される生存時間と実際の生存時間の順序が一致している程度を表しているのであり、
>> 導き出される生存曲線のグラフの生存日数は何も意味を成さないのでしょうか?
Kaplan-Meier法によって求めた累積生存率曲線は、生存時間を用いて計算したパラメトリックなグラフです。そのため累積生存率曲線の生存日数には意味があります。
しかし2群の生存率を比較する手法であるCox-Mantel検定や一般化ウィルコクソンの2標本検定やログランク検定やC-統計量は、生存日数データを生存順序データにしてから計算します。そのため、それに対応する累積生存率曲線はKaplan-Meier法によって求めた累積生存率曲線ではなく、時間間隔を「1」にした累積生存率曲線です。
このことはあまり知られていないので、医学分野ではKaplan-Meier法によって求めたパラメトリックな累積生存率曲線に、ノンパラメトリック手法であるCox-Mantel検定や一般化ウィルコクソンの2標本検定やログランク検定の結果とC-統計量を付記したりします。これは平均値や中央値のグラフに、順位平均値の検定手法であるノンパラメトリックな順位和検定の結果を付記するのと同様の間違いです。
Kaplan-Meier法によって求めたパラメトリックな累積生存率曲線に付記すべきなのは、本来はパラメトリック生存時間解析の結果です。

>> またできない場合
>> パラメトリックモデルだと 可能になるのでしょうか?
パラメトリックモデルは観測期間をそのまま用いて解析しているので可能です。
そのことを表すグラフを「統計学入門」の次のページで説明しているので参考にしください。(^_-)

○玄関>雑学の部屋>雑学コーナー>統計学入門
→11.6 パラメトリック生命表解析
http://www.snap-tck.com/room04/c01/stat/stat11/stat1106.html
※「図11.6.1 指数分布モデルによる理論的生存率関数」と「図11.6.2 時間間隔を1にした時の理論的生存率関数」が参考になると思います。
図11.6.1のようなグラフを描いたのなら、パラメトリック生存時間解析の結果を付記すべきであり、セミパラメトリック生存時間解析の結果は、本来は図11.6.2のようなグラフに付記すべきです。

1894. 比例ハザードモデル の評価について 投稿者:生存時間解析の初心者 投稿日:2022/11/08 (Tue) 23:54:15
初めまして、最近生存時間解析を学んでいるものです。
統計の基礎を含めて学ばさせていただいています。

質問ですが
11章の4節にて C統計量の説明がありましたが、
セミパラメトリックの評価に用いられる C統計量は
あくまで 
モデルから予測される生存時間と実際の生存時間の順序が一致している程度を表しているのであり、
導き出される生存曲線のグラフの生存日数は何も意味を成さないのでしょうか?

例えば2郡の 生存曲線を描いた際に 2郡で曲線に差があった場合
C統計量を0.9 として
例として 累積生存確率50% で切った際の 生存日数で
AよりもBの方が 何日 生き延びやすい
または
A は 累積生存確率50% で切ると 何日ごろに 亡くなるであろう
といった
生存日数を 用いた評価は不適切でしょうか?


またできない場合
パラメトリックモデルだと 可能になるのでしょうか?

理解が乏しく冗長的な質問になってしまいましたが、

ご教授いただけると幸いです

1893. Re[1892]:[1891]:痛みの新規評価尺度の導入 投稿者:北の大学院生 投稿日:2022/11/08 (Tue) 12:29:00
杉本様、丁寧なご回答を誠にありがとうございます。

級内相関係数に統一します。
EZRでICC.Sample.Sizeにて
calculateIccPower: Function to calculate post-hoc power for ICC studies

calculateIccSampleSize:Function to calculate sample size required for studies where ICC is primary outcome.

の2つを計算しようかと考えています。
References
Zou, G. Y. (2012). Sample size formulas for estimating intraclass correlation coefficients with
precision and assurance. Statistics in medicine, 31(29), 3972-3981.

>※必要例数と観測回数を求める計算式は(注1)に記載してあります。
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note01
じっくりと読んでサンプルデータなどで使用できるように学ばさせていただきます。

このパイロット試験で信頼性とある程度の妥当性を確認出来たら、マクギル疼痛質問票を用いて評価を行いより多くの患者さん(クライアント)に記入していただき、専門家複数人で痛みを測れているか確認をしていただこうと考えています。

NRSで評価をみると評価は様々な痛みの合計点の方と平均点の方がいるため、一概にNRSが高いから痛みの強度が強いまた、NRSが低いから痛みが低いわけではないことが推察されました。

いつもいつも本当にありがとうございます。
今後ともよろしくお願いいたします。

1892. Re[1891]:痛みの新規評価尺度の導入 投稿者:杉本典夫 [URL] 投稿日:2022/11/08 (Tue) 08:39:06
>北の大学院生さん
>> 痛みの研究で新規評価尺度としてマクギル疼痛質問票の導入を検討しています。
>> 内的整合性に関して、クロンバックのα係数
>> 信頼性として、診察はじめと終わりで2回問診表を記入してもらい級内相関係数またはケンドールの一致係数W
>> 妥当性としてNRSとピアソンの相関係数、サプリメントとして仮説を変えた場合のスペアマンの相関係数
>> 上記の3つをパイロット試験として50人程度サンプリングしその中の20人程度を信頼性のサンプリングとしようと思います。
基本的には上記の方針で良いと思います。ただしクロンバックのα係数は級内相関係数ICC(3,1)と同じものです。そのため級内相関係数に統一した方がわかりやすと思います。
それから級内相関係数や相関係数の値の信頼性を確保するための必要例数と、観測回数を求める計算式もあります。パイロット試験なら必要例数と観測回数を厳密に求める必要はないと思いますが、そのような計算式があることは知っておいた方が良いと思います。

詳しいことは、当館の次のページを御覧ください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→5.4 級内相関係数と一致係数
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html

※必要例数と観測回数を求める計算式は(注1)に記載してあります。
http://www.snap-tck.com/room04/c01/stat/stat05/stat0504.html#note01

1891. 痛みの新規評価尺度の導入 投稿者:北の大学院生 投稿日:2022/11/07 (Mon) 11:29:30
杉本様、いつも大変お世話になっています。

痛みの研究で新規評価尺度としてマクギル疼痛質問票の導入を検討しています。

内的整合性に関して、クロンバックのα係数

信頼性として、診察はじめと終わりで2回問診表を記入してもらい級内相関係数またはケンドールの一致係数W

妥当性としてNRSとピアソンの相関係数、サプリメントとして仮説を変えた場合のスペアマンの相関係数

上記の3つをパイロット試験として50人程度サンプリングしその中の20人程度を信頼性のサンプリングとしようと思います。
やる内容としてもし、間違っていたり、より適切な方法がございましたら、ご教授お願いいたします。

下位尺度として、一般的に3つに分類できるのですが、それぞれの相関が強く解析などは適さないと思いできるだけシンプルな考えで解析ができるようにしたいと考えています。
よろしくお願いいたします。

1890. Re[1889]:[1888]:統計学の理解について 投稿者:上条あかね 投稿日:2022/11/07 (Mon) 10:06:13
>近似的な統計学に、純粋数学の理論を無理やり当てはめて
奇しくもこれは私が逆に統計学における数学の用いられ方を見て抱いた印象と同じであり,今回の質問の幾つかは,統計学では(恐らくは定式化できない)諸概念と(定義のある)数学の諸概念とを対応させ利用していることについての識者のご所見を伺う為のものでした.お時間をいただきましたこと,お礼申し上げます.

1889. Re[1888]:統計学の理解について 投稿者:杉本典夫 [URL] 投稿日:2022/11/07 (Mon) 09:03:32
>上条あかね様
統計学は純粋数学ではなく、現実の現象を数学的なモデルで近似的に分析するための実用的な応用数学または「数学応用学」です。色々な疑問点は、そのような近似的な統計学に、純粋数学の理論を無理やり当てはめて理解しようとするところにあると思います。
例えば物理学では、有名な「e=m・c2乗」という式のように、純粋数学の数式を現実的な近似式にして理論を構築することがよくあります。その理論に対して「正確な数式を使わず、近似式にしている理由がわからない!」という疑問を抱くと、物理学を理解することは難しいと思います。
それと同様に、統計学に純粋数学の概念を無理矢理当てはめて理解しようとすると、統計学を理解するのは難しいと思います。統計学の原理をしっかりと理解すれば、色々な疑問は自ずと解消すると思います。そのため、まずは数理統計学の解説書をじっくりと読むことをお勧めします。
もし数理統計学の解説書をじっくりと読んでも疑問が解消しなかったら、残念ながら思考方法が統計学には向いていないと諦めてください。(^^;)

1888. Re[1887]:[1886]:統計学の基礎について 投稿者:上条あかね 投稿日:2022/11/07 (Mon) 07:48:15
お手数をお掛けしております.

>過去の書き込みをもう一度じっくりと読んでください。
>> と表現する.
ことがネイマン・ピアソン統計学と相容れない旨は読み取れているのですが,ご案内いただいたネイマン・ピアソン統計学における諸概念,例えば「無限個存在する集団」「無限回無作為抽出して」などの定義(定式化)が分からず難渋しております.(数学には加算無限個の確率空間の直積はありますが...)

>ネイマン・ピアソン統計学全般の誤解
>例えば「基礎統計学I 統計学入門」
入手までの間,他の点をお尋ねしたく思います.

それは中心極限定理 lim p(n)=∫ による近似,すなわち,p(n) の代わりに ∫ を用いる際の n の範囲です.一般に実数の近似には誤差(絶対誤差)e の指定が必要であり,例えば「|p(n)-∫|≦e となるためには n は~以上」といった主張となるべきところ,よく見かけるのは「偏り(分散)が小さければ n は 30 以上」といった主張であり,誤差の指定がなく,得られた値がどこまで正しいのかが分かりません.これはどういうことなのでしょうか?

※ lim p(n)=∫ の証明が |p(n)-∫|≦C×n^{d}(C は母数と確率変数のみに依存する定数,d は負の定数)といった評価を用いるものであれば論はないのですが,よく見かける積分変換の対応を用いて極限値の相等を得る方法(御サイトでもご紹介の方法)では,誤差の評価が難しいように見えます.

1887. Re[1886]:統計学の基礎について 投稿者:杉本典夫 [URL] 投稿日:2022/11/06 (Sun) 16:32:58
>上条あかね様
>> そして,この ①,② をそれぞれ
>> 「(1) のような標本平均から信頼区間を 1 回作るとき,それが母平均を含むものである確率は p である」,
>> 「(1) のような標本平均から信頼区間を N 回作るとき,そのうち母平均を含むものの個数の期待値は N×p である」
>> と表現する.
>> というのはまずいのでしょうか?
何度も説明しているように、僕はあまりマズイとは思いません。しかしネイマン・ピアソン統計学派の人は「マズイ!」というと思いますよ。(^^;)
その理由はこれまで何度も説明しているので、過去の書き込みをもう一度じっくりと読んでください。

>>大数の法則を用いて「頻度論的な確率」を定義するということでしょうか?
>> 大数の法則(弱,強のどちらにせよ)は幾許かの条件を満たす確率空間,確率変数列についての主張であり,
>> それらの構成には既に確率測度(「確率」を像とする写像)が含まれていますので,
>> その「確率」を用いて「頻度論的な確率」を定義することになりそうですが...
これも何度も説明しているように、このあたりの誤解がネイマン・ピアソン統計学全般の誤解の元になっていると思います。
これについては数理統計学の解説書をじっくりと読まれることをお勧めします。例えば「基礎統計学I 統計学入門」(東京大学教養学部統計学教室編、東京大学出版会、1991年)等をお勧めします。そしてこの本に書かれた内容について疑問点があったら、この本の編者である松原望先生に質問してみてください。(^_-)

1886. Re[1875]:[1874]:統計量と中心極限定理について 投稿者:上条あかね 投稿日:2022/11/05 (Sat) 22:25:55
引き続き有難う御座います.

>1875.
>成り立ちます

であるなら,1874. の (1) の設定の下で

CI(ω):=[X(ω)-c×σ/√{n},X(ω)+c×σ/√{n}] (ω∈Ω) とし,Y:Ω→{0,1} を {ω∈Ω|μ∈CI(ω)} の定義関数とすると,任意の ω∈Ω について,Y(ω)=1 ⇔ μ∈CI(ω) であり,(1) の等式 P({ω∈Ω|μ∈CI(ω)})=p により,Y は B(1,p) に従う.……①

① を (2) に適用すれば,任意の (ω_{1},...,ω_{N})∈Ω^{N} について,S_{N}(ω_{1},...,ω_{N})=#{i∈{1,...,N}|μ∈CI(ω_{i})} であり,(2-1) により,S_{N} の期待値は N×p である.……②

そして,この ①,② をそれぞれ
「(1) のような標本平均から信頼区間を 1 回作るとき,それが母平均を含むものである確率は p である」,
「(1) のような標本平均から信頼区間を N 回作るとき,そのうち母平均を含むものの個数の期待値は N×p である」
と表現する.

というのはまずいのでしょうか?

>1872.
>ネイマン・ピアソン統計学は結果の確率に基づいた統計学です。そして結果の確率は大数の法則に基づいた頻度論的な確率です。つまり試行回数を限りなく増やした時の事象の頻度の極限値を、その事象の確率と定義する考え方です。

大数の法則を用いて「頻度論的な確率」を定義するということでしょうか?大数の法則(弱,強のどちらにせよ)は幾許かの条件を満たす確率空間,確率変数列についての主張であり,それらの構成には既に確率測度(「確率」を像とする写像)が含まれていますので,その「確率」を用いて「頻度論的な確率」を定義することになりそうですが...

1885. Re[1884]:[1883]:解析について 投稿者:北の大学院生 投稿日:2022/11/02 (Wed) 14:53:15
今回も丁寧なご回答を、誠にありがとうございます。

1に関しては、私のフィールドの教科書的にはVASが20mm以上で有意とされることが多く、分類を対称的にした方が良いと思うので、今後より良い評価方法を考えます。

2に関して
ものごとを単純に考えていました。重相関分析を行います。

3に関して
もとの分布はおそらくかなり偏っているので、50例程度集めてから重相関分析を行います。

また、色々なことを相談させていただくことがあると思います。本当にありがとうございます。今後ともよろしくお願いいたします。

1884. Re[1883]:解析について 投稿者:杉本典夫 [URL] 投稿日:2022/11/02 (Wed) 14:04:13
>北の大学院生さん
>> (1)自覚症状のVAS の改善率が100%改善した症例を治癒群, 99〜50%まで改善した症例を改善群,49〜1 %まで改善を軽快群, 変化がない症例を不変群,
>> 悪化例を悪化群と定義するとこの分類はVAS高値にはある程度良いかと思いますが、VAS低値は誤差の範囲内であると思います。
>> この分類は妥当性はありますか?
妥当かどうかは統計学的に判断するのではなく、医学的に判断すべきです。
統計学的に見ると、改善が3段階で悪化が1段階というのは改善と悪化が非対称なのであまり好ましくありません。しかし自覚症状のVASの性質上、これは致し方ないかもしれませんね。

>> (2)マクギル疼痛質問票を用いて、22項目のグループごとに3つの合計点を求めて「下位尺度」として評価項目にしたのですが、
>> これとNRSの相関を調べるときは4つのものとの相関のため偏相関係数が良いでしょうか?
>> 相関係数とスペアマンの相関関係を出して感度分析を行ったほうが良いでしょうか?
本来、下位尺度は因子分析による因子スコアですから、因子軸を斜交回転していなければお互いに無相関になります。そのため偏相関係数も単相関係数も同じ値になります。
しかし実際には因子スコアを用いることは稀なので、お互いに無相関とは限りません。そのため重相関分析を行い、重相関係数と偏相関係数を求める必要があります。
また順位相関係数は順序尺度のデータの相関係数ですから、偏相関係数も重相関係数も存在しません。偏相関係数や重相関係数は複数の計量尺度項目の間の線形な関数関係に基づいた指標です。順序尺度のデータは順序だけは付けられるものの、計量的な四則演算はできないことが特徴です。そのため線形な関数関係に基づいた偏相関係数や重相関係数は存在しないのです。したがって単相関係数と単順位相関係数の感度分析なら可能ですが、偏相関係数や重相関係数の感度分析は不可能です。

>> (3)2に関してですが、各変量1つにつき10例程度(4つの関係なので40例以上程度)で中心極限定理が成り立つと解釈してよいでしょうか?
これは、元のデータが度正規分布にどの程度近似しているかで異なります。僕が行ったシミュレーションの結果では、元のデータが左右対称なら10例程度でも中心極限定理が成り立ちます。しかし対数正規分布のように、元のデータが極端に歪んでいると中心極限定理が成り立つためには50例以上は必要です。

1883. 解析について 投稿者:北の大学院生 投稿日:2022/11/02 (Wed) 08:43:51
杉本様、いつも大変お世話になっています。

昨日1年分のデータ抽出が終わり、例数は314でした。はじめは400例を目指していましたが、おそらく後半年分のデータを見なければいけなく、疲れてしまったので、これで論文にしようと思います。共分散分析などを教えていただき誠にありがとうございました。

決定樹はEZRで簡単にできましたが、普遍性がなく、やはり判別分析のやり方も含めて貴Webページから学ばせていただこうと思います。

さて、アナログスケールなどに関して再び質問があります。

(1)自覚症状のVAS の改善率が100%改善した症例を治癒群, 99〜50%まで改善した症例を改善群,49〜1 %まで改善を軽快群, 変化がない症例を不変群, 悪化例を悪化群と定義するとこの分類はVAS高値にはある程度良いかと思いますが、VAS低値は誤差の範囲内であると思います。
この分類は妥当性はありますか?

(2)マクギル疼痛質問票を用いて、22項目のグループごとに3つの合計点を求めて「下位尺度」として評価項目にしたのですが、これとNRSの相関を調べるときは4つのものとの相関のため偏相関係数が良いでしょうか?
相関係数とスペアマンの相関関係を出して感度分析を行ったほうが良いでしょうか?

(3)2に関してですが、各変量1つにつき10例程度(4つの関係なので40例以上程度)で中心極限定理が成り立つと解釈してよいでしょうか?

ご教授お願いいたします。

1882. Re[1875]:[1874]:統計量と中心極限定理について 投稿者:上条あかね 投稿日:2022/11/01 (Tue) 22:51:01
引き続き有難う御座います.

>現実のデータに理想化した数学モデルを近似的に当てはめ、確率論に従って理論解を求めて、それを現実の現象に逆近似して結果を解釈

私の一連の質問はこのサンドイッチ構造の境界の様子を知るためのものであり,まだまだ項目はあるのですが,続きは次週以降にお願いしようと思います.何卒ご了承ください.

1881. Re[1880]:[1879]:共分散分析の結果について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 15:56:15
杉本様、いつも丁寧なご回答を誠にありがとうございます。

判別分析はEZRで簡単に出来そうもないため、今回(おそらく最後かもしれませんが)は年齢による影響と性別の影響を主軸に論文化しようと思います。

(このデータで実際に年齢のオッズ比は1.03程度しかなく、やはりいろいろな因子が複雑に関与している中で加齢が微妙に影響していることを再確認したという意味でしかないので、)サブ的なものとして、ロジスティック回帰分析で採血データの影響も考慮したオッズ比も出そうと思います。
簡単に改善できるものが大きな影響を与えていれば簡単に改善できますが、現実は少しの影響の足し算が多いように思われます。
コンプリートデータが減ってしまうため、400人程度は集めようと思いカルテを見ています。普遍性はないですが一応の目安として、決定樹も出してみようかと考えています。

私も医学界の検定偏重&p値崇拝主義を何とかして是正したい気持ちもありますが、p値(🍑)好きな先生は多いと思います。
また、p値(🍑)好きな先生はnot significantを何の根拠もなくno significantと結論付けているものも多く、tが頻繁に脱落すると感じています。非有意=同等と考えているとも思われます。

専門家の意見は非常にありがたいです。
今後ともよろしくお願いいたします。

1880. Re[1879]:共分散分析の結果について 投稿者:杉本典夫 [URL] 投稿日:2022/11/01 (Tue) 15:15:29
>北の大学院生さん
>> これで交互作用はなく、性別ではなく年齢がTEST結果に影響すると解釈してよいのでしょうか?
解釈して良いと思います。性別と年齢の間に交互作用はほとんど無いので、年齢で補正した性の影響は小さく、性別で補正した年齢の影響は大きいと考えられます。

>> これを示せればいくつかの論文の報告はおそらくサンプル集団で性別に偏りが生じたことで性差が影響するという結果が導かれたことを示唆できそうです。
共分散分析は意外と知られていないので、この手法を適用すべき場面で層別解析を行っている論文が多いように思います。しかも推定結果ではなく有意確率p値で結果を評価しているので、非科学的な結論を導いてしまっている論文も多いように思います。
僕は検定廃止論者なので、医学界の検定偏重&p値崇拝主義を何とかして是正したいですね。
ちなみにネイマンとピアソンは、Fisherの有意性検定を否定し、区間推定を中心にしてネイマン・ピアソン統計学を構築したのであり、彼等自身は統計的仮説検定はほとんど用いませんでした。そのため彼等の弟子の統計学者達はほとんどが検定廃止論者ですよ。(^_-)

1879. Re[1877]:[1876]:ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 13:41:31
杉本様、いつも大変お世話になっています。

EZRで共分散分析をやってみました。
群別変数と共変数の交互作用のP値は 0.787

Anova Table (Type III tests)

Response: TEST
Sum Sq Df F value Pr(>F)
(Intercept) 0.123 1 0.6344 0.426382
factor(sex) 0.125 1 0.6470 0.421843
age 2.090 1 10.8054 0.001135 **
Residuals 56.682 293

また、年齢×性別のロジスティック回帰分析の係数はほとんど1に等しくなりました。
       オッズ比 95%信頼区間下限 95%信頼区間上限 P値
(Intercept) 0.351 0.263 0.47    1.56e-12
age*sex 1.010 0.996 1.01    2.92e-01

これで交互作用はなく、性別ではなく年齢がTEST結果に影響すると解釈してよいのでしょうか?

これを示せればいくつかの論文の報告はおそらくサンプル集団で性別に偏りが生じたことで性差が影響するという結果が導かれたことを示唆できそうです。

少しずつ勉強させていただきます。
今後ともよろしくお願いいたします。

1878. Re[1877]:[1876]:ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/11/01 (Tue) 10:55:46
今回も丁寧な、ご回答を誠にありがとうございます。

(1)やはり統計学入門者には、まだまだ学習不足の内容が多いため貴Webページでじっくり学ばせていただきます。おそらく、現在の私は初歩の初歩しか解析などできていないと思っています。実際は全くできていない可能性も否定できないですが、……たくさん学ばせていただきます。

(2)(3)の変数の選択ですが本当に医学的にも意味のあるものの選択は難しいと感じます。ダミーのIDを好きに作った場合、たまたま判別能力が高いというシミュレーション結果も自分で確認したことがあるので、特に例数が少ない場合は、より慎重に行いたいと思います。

(4)境界値の設定が恣意的でどうもうまくp値をコントロールしたように感じてしまいます。連続量を2分類データにして情報を落としてしまうのは実にもったいないと思うのは、同意見です。

(5)判別分析かクラスター分析の学習をしてやってみます。
できなかったら、臨床家に好まれやすい決定樹で妥協しようかと思います。

今後も、色々と質問させていただくことが多くあると思いますが、よろしくお願い申し上げます。

1877. Re[1876]:ロジスティック回帰分析について 投稿者:杉本典夫 [URL] 投稿日:2022/11/01 (Tue) 10:25:12
>北の大学院生さん
こんちにわ、御質問にお答えします。
>> (1)説明変数なのですが、採血のコンプリートデータがあまり多くないため解析は性別を層別したもので年齢を説明変数としたモデルで評価して、
>> おそらく性差がない疾患のため、結果は層別でほとんど一致するため、そのあとで性別を合わせて年齢だけの単変量解析を行う予定です。
>> これら3つすべての結果を公表予定です。
>> これは、一般的に行ってもよいことでしょうか?
医学分野ではしばしば行われますが、統計学的にはもっと合理的な方法があります。
多変量解析は連続量による計量的な層別解析に相当します。そのため普通は性別も「0:男 1:女」というダミー変数にして説明変数に入れます。
そして目的変数に関して性と年齢の間に交互作用――目的変数と年齢の関係(回帰係数の値)が男と女で異なる現象――があれば、性と年齢をかけ合わせた項目を交互作用項目として説明変数に入れます。この交互作用項目の偏回帰係数が0に近ければ交互作用はなく、正で絶対値が大きな値なら正の交互作用(男よりも女の方が年齢の影響が強い)があり、負で絶対値が大きな値なら負の交互作用(男よりも女の方が年齢の影響が弱い)があると考えられます。
これをもっと効率的に行う解析手法が共分散分析です。共分散分析については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→第8章 共分散分析
http://www.snap-tck.com/room04/c01/stat/stat08/stat0801.html

>> (2)Hosmer and Lemeshow goodness of fit (GOF) testを行う予定ですが、これはやはり、p値が小さければモデル適合が悪いと解釈して、
>> そのp値自体もばらつきはありますが、例数が同じ場合は、p値の大きさでモデルの適合を判定してよいのでしょうか。
>> または、ネイマン・ピアソン統計学のように、決めた値(5%や20%など)との大小関係だけを見るものなのでしょうか?
モデルの適合度を検討するには、Hosmer-Lemeshow検定よりもデビアンス(deviance)Dを使った方が良いと思います。
またp値は検定統計量が帰無仮説の棄却域に入っているかどうかを判定するための便宜的な値であり、値そのものには具体的なあまり意義はありません。モデルとの適合度を検討するには、検定結果よりも評価指標であるデビアンスDの値そのものを検討した方が合理的ですし、平均値の差の検定などでは平均値の差の値と、その区間推定値(95%信頼区間等)を検討した方が合理的です。
Hosmer-Lemeshow検定とデビアンスについては、次のページを参考にしてください。
→10.3 ロジスティック回帰分析の計算方法 (注2)
http://www.snap-tck.com/room04/c01/stat/stat10/stat1003.html#note02
またp値の意義と検定と推定と科学的解釈については、次のページを参考にしてください。
→1.5 有意性検定の考え方 (6)有意確率の意味
http://www.snap-tck.com/room04/c01/stat/stat01/stat0105.html
→1.7 ハンディキャップ方式の検定 (1)推定と検定の関係
http://www.snap-tck.com/room04/c01/stat/stat01/stat0107.html
※「図1.7.1 検定結果と信頼区間」とその下の表が参考になると思います。

>> (3)採血も含めるとコンプリートデータは7割くらいに減るため、10pのルールなどで理論上7個程度ならば説明変数を投入可能ですが、
>> 単純なモデルのほうが良いため、患者背景で標準化差が大きいものから投入を予定しています。
>> また、既存のリスク因子も選ぶ予定です。
>> 統計学的にはいくつくらいまで入れるとよいでしょうか?
>> 説明変数の選択が非常に難しいです。
統計学的には、多変量解析の結果の信頼性を確保するためには説明変数の数はやはり例数の1/5〜1/10程度です。
そして説明変数の選択は、統計学的な判断よりも医学的な判断に基づく方が妥当です。
参考になるかどうかわかりませんが、変数選択法のシミュレーションをした結果が次のページにありますよ。
→7.3 変数の選択 (注2)
http://www.snap-tck.com/room04/c01/stat/stat07/stat0703.html#note02

>> (4)論文でたまに見かけるのですが、例えば年齢を平均値や中央値を境に高齢と若年で分けて説明変数とすること(2値データへの変換)はp-ハッキングにあたるのでしょうか?
これは医学分野でよく行われることですが、原則としてやってはいけません。p-ハッキングの問題よりも、連続量を2分類データにして情報を落としてしまうのは実にもったいないです。また境界値の設定が恣意的になる上に、データによって変化します。それでは客観的かつ普遍的な結果は得られません。

>> (5)機械学習の決定樹は探索的で一番単純になるものを示そうと思っています。おそらく因子は2個程度になりそうです。
>> これは、探索的な研究のため結果を見て一番単純なもの(解釈しやすいもの)を選んでよいのでしょうか?
>> もちろん別のデータセットなどで検証が必要なことは十分に承知しています。
機械学習は理論的にはノンパラメトリックな多変量解析に相当します。そのため普遍性がないので、僕はおまりお勧めしません。それよりも普遍性があるパラメトリックな多変量解析をお勧めします。機械学習の決定樹よりも判別分析かクラスター分析の方が普遍性があります。
多変量解析の種類と概論については、次のページを参考にしてください。
→6.3 多変量解析の分類
http://www.snap-tck.com/room04/c01/stat/stat06/stat0603.html

以上、参考になれば幸いです。(^_-)

1876. ロジスティック回帰分析について 投稿者:北の大学院生 投稿日:2022/10/31 (Mon) 16:19:12
杉本様、いつも大変お世話になっています。

最近、カルテからデータを抽出して、探索的なロジスティック回帰分析を行おうとしています。最終的には機械学習の決定樹によって分類も行う予定です。
全例数で400程度、大体7.5:2.5くらいに分かれる(300:100)ものに関してです。
そこで、お聞きしたいことがあります。

(1)説明変数なのですが、採血のコンプリートデータがあまり多くないため解析は性別を層別したもので年齢を説明変数としたモデルで評価して、おそらく性差がない疾患のため、結果は層別でほとんど一致するため、そのあとで性別を合わせて年齢だけの単変量解析を行う予定です。これら3つすべての結果を公表予定です。
これは、一般的に行ってもよいことでしょうか?

(2)Hosmer and Lemeshow goodness of fit (GOF) testを行う予定ですが、これはやはり、p値が小さければモデル適合が悪いと解釈して、そのp値自体もばらつきはありますが、例数が同じ場合は、p値の大きさでモデルの適合を判定してよいのでしょうか。または、ネイマン・ピアソン統計学のように、決めた値(5%や20%など)との大小関係だけを見るものなのでしょうか?

(3)採血も含めるとコンプリートデータは7割くらいに減るため、10pのルールなどで理論上7個程度ならば説明変数を投入可能ですが、単純なモデルのほうが良いため、患者背景で標準化差が大きいものから投入を予定しています。また、既存のリスク因子も選ぶ予定です。
統計学的にはいくつくらいまで入れるとよいでしょうか?
説明変数の選択が非常に難しいです。

(4)論文でたまに見かけるのですが、例えば年齢を平均値や中央値を境に高齢と若年で分けて説明変数とすること(2値データへの変換)はp-ハッキングにあたるのでしょうか?

(5)
機械学習の決定樹は探索的で一番単純になるものを示そうと思っています。おそらく因子は2個程度になりそうです。これは、探索的な研究のため結果を見て一番単純なもの(解釈しやすいもの)を選んでよいのでしょうか?
もちろん別のデータセットなどで検証が必要なことは十分に承知しています。

統計量と中心極限定理についてなどの一連の流れを割ってしまい大変申し訳ございませんが、ご教授お願いいたします。

1875. Re[1874]:統計量と中心極限定理について 投稿者:杉本典夫 [URL] 投稿日:2022/10/31 (Mon) 14:27:00
>上条あかね様
>> (1) X が平均 μ,標準偏差 σ の正規母集団から無作為抽出した大きさ n の標本の平均,つまり,確率空間 (Ω,Σ,P) と確率変数 X:Ω→R から誘導される確率測度が N(μ,σ^2/n) のとき,
>> N(0,1) の確率密度関数の [-c,c] 上の積分を p (0<p<1) とすると,P({ω∈Ω||X(ω)-μ|≦c×σ/√{n}})=p が成り立つ.
成り立ちます。そして母集団が正規分布ではなくても、中心極限定理によって2つ目のことが成り立ちます。
中心極限定理については次のページを参考にしてください。
1.3 データの要約方法 (注7)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note07

>> (2) B(1,p) (0<p<1) に従う N 個の独立な確率変数の和を S_{N} とおくと
>> (2-1) S_{N} は B(N,p) に従い,その期待値は N×p となる.
>> (2-2) {S_{N}/N}_{N=1}^{∞} は p に概収束する.
これも二項分布の性質と中心極限定理によって成り立ちます。これについては次のページを参考にしてください。
付録1 各種の確率分布 (5) 二項分布(binominal distribution)
http://www.snap-tck.com/room04/c01/stat/stat99/stat9901.html

>> ※ 私は,ミーゼスの頻度説や経験的確率というワードを学生時代に啓蒙書で目にした程度であり,現代の確率論といえば,測度空間から構成される公理的なもので,
>> 統計には母集団,標本集団という用語はあるものの数学にはそれらの確率分布(確率変数から誘導される確率測度)しかなく,標本も同一分布に従う独立な確率変数の列のこととしか見ていませんでしたので,母集団や無作為抽出を実体のある対象と捉え,大数の法則に根ざす立場は新鮮でした.
ネイマン・ピアソン統計学で用いる頻度論的な結果の確率も、ベイズ統計学で用いる主観的な原因の確率も、どちらもコルモゴロフの確率の公理と矛盾せず、公理的確率の条件を一応は満足しています。
でも統計学は現実のデータに適用できなければ無意味なので、現実のデータに理想化した数学モデルを近似的に当てはめ、確率論に従って理論解を求めて、それを現実の現象に逆近似して結果を解釈します。この理想化した数学モデルと近似・逆近似法の違いによって色々な学派があるのです。
その意味で、統計学者はよく「統計学は応用数学ではなく数学応用学だ!」と言いますよ。(^_-)

1874. Re[1873]:[1871]:信頼区間と二項分布について 投稿者:上条あかね 投稿日:2022/10/31 (Mon) 07:29:16
引き続き有難う御座います.

1872.,1873.を拝読して,基本事項ですが幾つか確認させていただきたく思います.

(1) X が平均 μ,標準偏差 σ の正規母集団から無作為抽出した大きさ n の標本の平均,つまり,確率空間 (Ω,Σ,P) と確率変数 X:Ω→R から誘導される確率測度が N(μ,σ^2/n) のとき,N(0,1) の確率密度関数の [-c,c] 上の積分を p (0<p<1) とすると,P({ω∈Ω||X(ω)-μ|≦c×σ/√{n}})=p が成り立つ.

(2) B(1,p) (0<p<1) に従う N 個の独立な確率変数の和を S_{N} とおくと
(2-1) S_{N} は B(N,p) に従い,その期待値は N×p となる.
(2-2) {S_{N}/N}_{N=1}^{∞} は p に概収束する.

これらは正しいでしょうか?

※ 私は,ミーゼスの頻度説や経験的確率というワードを学生時代に啓蒙書で目にした程度であり,現代の確率論といえば,測度空間から構成される公理的なもので,統計には母集団,標本集団という用語はあるものの数学にはそれらの確率分布(確率変数から誘導される確率測度)しかなく,標本も同一分布に従う独立な確率変数の列のこととしか見ていませんでしたので,母集団や無作為抽出を実体のある対象と捉え,大数の法則に根ざす立場は新鮮でした.

1873. Re[1871]:信頼区間と二項分布について 投稿者:杉本典夫 [URL] 投稿日:2022/10/30 (Sun) 11:30:43
>上条あかね様
1872番の返事を書いてから、思い付いたことがあるので少し追加します。(^_-)
二項分布B(100,0.95)の母集団は、「0:失敗 1:成功」という2種類の分類データが0.05:0.95の割合で無限個存在する集団です。これは信頼区間を求めた時の連続量データの母集団N(μ、σ2乗)とは全く違います。そのためこの母集団から無作為抽出した100個の標本集団から95%信頼区間を求めた時、母平均が入っている信頼区間の個数はB(100,0.95)には従わないのです。
しかしこの母集団から標本集団を無限回無作為抽出して95%信頼区間を求め、その信頼区間に母平均が入っていないものは「0:失敗」とし、母平均が入っているものは「1:成功」として、無限個の信頼区間を2種類に分類します。するとそれは「0:失敗 1:成功」という2種類の分類データが0.05:0.95の割合で無限個存在する集団になります。
この2分類データの集団を母集団として、そこから100個のデータを無作為抽出すると、「0:失敗 1:成功」という2種類のデータはB(100,0.95)に従います。これは信頼区間を無限個求めた後で行う操作ですから、N(μ, σ2乗)から100個の信頼区間を求めた時とは別の事柄です。このことから信頼区間の解釈にB(100,0.95)を持ち出すのは不適切であることがわかると思います。
ネイマン・ピアソン統計学におけるB(100,0.95)の成功確率0.95も、当然、頻度的な確率です。そのためこの確率は最初の連続量の母集団N(μ, σ2乗)には当てはめられず、無限個の信頼区間を成功/失敗で2分類にした分類データの母集団に当てはめることになります。
これがネイマン・ピアソン統計学における、頻度論的な確率に基づいた信頼区間の解釈とB(100,0.95)の違いです。(^_-)

1872. Re[1871]:期待値と確率について 投稿者:杉本典夫 [URL] 投稿日:2022/10/30 (Sun) 10:20:46
>上条あかね様
>> この「100回実施したとき、95回程度」を読む度に「"95回程度"って何?」「何回から何回までが "95回程度" なの?」となる訳です.
>> こうした表現は信頼区間に限らず連続分布の一般向けの説明に用いられているようですが,
>> 少なくとも信頼区間の話をする段階では二項分布の期待値は知っている筈なのに,何故そのように述べないのか?と...
ここが誤解の元なのでしょうね。('')(..)('')(..)
ネイマン・ピアソン統計学は結果の確率に基づいた統計学です。そして結果の確率は大数の法則に基づいた頻度論的な確率です。つまり試行回数を限りなく増やした時の事象の頻度の極限値を、その事象の確率と定義する考え方です。したがって「100回実施した時95回程度」という表現は、あくまでも抽象的な頻度論的確率を具体的にわかりすく説明するための例にすぎません。
ネイマン・ピアソン統計学では、95%信頼区間は「母平均が入っている信頼区間を得る頻度論的確率が95%である」と解釈します。これは標本集団を無作為抽出して信頼区間を求めるという操作を無限回繰り返した時の解釈ですから、100回繰り返した時は「100回中95回程度入っている」と近似的に言うしかないのです。したがって厳密に言うと成功回数はB(100,0.95)には従わず、100→∞にした時のt分布に従い、成功回数はt分布における0.05断点以内の積分値0.95つまり成功確率0.95になります。
そもそも二項分布B(n, 0.5)についてn→∞にした時の連続分布が正規分布ですから、正規分布やt分布を対象にして理論の説明をしている時に、離散分布である二項分布の話題に戻り、頻度論的な確率を期待値にして理論を解釈しようとするのは――説明のための具体的かつ近似的な例え話なら良いと思いますが――あまり適切とは言えないと思いますよ。(^_^;)

ネイマン・ピアソン統計学派がこの解釈にこだわるのは、ベイズ統計学で用いる原因の確率、つまり情報不足に基づいた主観的な確率を統計学から排除することが、ネイマン・ピアソン統計学構築の目的のひとつだったからです。
これは、科学からアリストテレス的な主観を排除し、客観的な観測事実と批判的思考法(クリティカル・シンキング)に基づいて理論を構築することによって科学を構築しようという、統計学創成期の時代の流れに合わせたものです。

ちなみに、頻度論的な統計学については次のページが参考になると思います。(^_-)
https://ja.wikipedia.org/wiki/%E9%A0%BB%E5%BA%A6%E4%B8%BB%E7%BE%A9%E7%B5%B1%E8%A8%88%E5%AD%A6

1871. Re[1870]:[1869]:信頼区間と標準誤差について 投稿者:上条あかね 投稿日:2022/10/29 (Sat) 09:33:32
引き続き有難う御座います.

>自己矛盾
誤解を招く書き込みをお詫びします.1865.の「離散分布まで戻ってしまうと話が広がりすぎる」は「離散分布の知識は用いない」と云う意味ではなく,一連の投稿では「推定や検定の対象とする母集団分布は離散型ではなく連続型とする」と云う意味でした.

>そしてこの文脈での標準誤差の定義は後者ですね。
>「標準誤差は標本集団から見た時の母数推定値の標準偏差推定値」
つまり,(標準誤差)=√((不偏分散)/(サンプルサイズ n)) (これは確率変数)の場合,信頼区間は標本平均と標準誤差に依存するが,自由度 n-1 の t 分布の確率密度関数の区間 [-c', c'] 上の積分が 0.95 となる正数 c' を用いれば,信頼区間が母平均を含むための標本平均と標準誤差についての条件|(標本平均)-(母平均)|≦(定数 c')×(標準誤差)が定める可測集合の確率 0.95 (確率測度は((標本平均)-(母平均))/(標準誤差)と云う確率変数が誘導するもの)により,前記と同じく,100回の "サンプルから信頼区間を作る" と云う試行における "母平均を含む信頼区間が得られる" 回数は B(100,0.95) に従うのではないでしょうか?

上記は,二項分布の期待値という位置付けに拘っている訳ではなく,「母集団から標本をとりだし、その標本から母平均の95%信頼区間を求める」ことを100回実施したとき、95回程度はその区間内に母平均が入る」ことを表します,と云った説明がどのような数学の性質の糖衣表現なのか(或いは対応する数学の性質はないのか)を知りたいのです.

この「100回実施したとき、95回程度」を読む度に「"95回程度"って何?」「何回から何回までが "95回程度" なの?」となる訳です.こうした表現は信頼区間に限らず連続分布の一般向けの説明に用いられているようですが,少なくとも信頼区間の話をする段階では二項分布の期待値は知っている筈なのに,何故そのように述べないのか?と...
(私はこれが期待値と云う説明を見たことがありません)

長くなってすみません.

1870. Re[1869]:信頼区間と標準誤差について 投稿者:杉本典夫 [URL] 投稿日:2022/10/28 (Fri) 10:15:02
>上条あかね様
>> (現実的ではありませんが)母標準偏差が既知であり,それを用いる場合には,母平均を含む信頼区間の個数は,B(100,0.95) に従うということですね.
そのように考えていただいても良いと思います。ただし1865番の書き込みで「離散分布まで戻ってしまうと話が広がりすぎるので,以降は"分散が与えられた正規母集団"についてお尋ねしたく思います.」と書かれているので、この文脈で離散分布であるB(100,0.95)を持ち込むのは自己矛盾になると思いますよ。(^_-)

>> この文脈での「標準誤差」の定義をご案内いただけますか?
標準誤差の定義については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.3 データの要約方法 (3) 標準誤差
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html
※このページの(注2)も参考にしてください。
http://www.snap-tck.com/room04/c01/stat/stat01/stat0103.html#note06
補足ですが、純粋数学分野では「標準誤差は母集団から見た時の統計量の標準偏差」と定義する人が多く、数理統計学分野では「標準誤差は標本集団から見た時の母数推定値の標準偏差推定値」と定義する人が多いようです。この定義には歴史的な経緯が関係していて、詳しく説明すると長くなるので省略しますが、僕は「どっちの定義でもかわまない」派です。σ(^_-)
そしてこの文脈での標準誤差の定義は後者ですね。

>> その理由をご案内いただけますか?
上記のページと次のページを参考にして、自分で導いてみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→付録2 中心極限定理のシミュレーション−平均値と中央値
http://www.snap-tck.com/room04/c01/stat/stat99/stat9902.html

1869. Re[1868]:[1867]:信頼区間と期待値について 投稿者:上条あかね 投稿日:2022/10/27 (Thu) 22:04:07
引き続き有難う御座います.

>標本平均値は正規分布に従う確率変量であり、標準誤差はχ2乗分布に従う確率変数です。そのため母平均を含む信頼区間の個数は、厳密にはB(100,0.95)に従いません
(現実的ではありませんが)母標準偏差が既知であり,それを用いる場合には,母平均を含む信頼区間の個数は,B(100,0.95) に従うということですね.

>標準誤差はχ2乗分布に従う確率変数
この文脈での「標準誤差」の定義をご案内いただけますか?

>(ただし100個の信頼区間が得られた時、そのうち母平均が含まれる信頼区間の期待値は95になります)。
その理由をご案内いただけますか?

1868. Re[1867]:信頼区間と期待値について 投稿者:杉本典夫 [URL] 投稿日:2022/10/27 (Thu) 08:24:33
>上条あかね様

>> 「標本平均値 x(ω) と固定された標準誤差から得られる母平均の 95% 信頼区間に母平均が属するような標本点 ω 全体からなる可測集合 {ω| |(標本平均)(ω)-(母平均)|≦(定数c)×(標準誤差)} の確率は,
>> c の定め方から,0.95 なので,100 個の標本平均値と固定された標準誤差から得られる母平均の 95% 信頼区間のうち母平均が属するものの個数は B(100,0.95) に従う確率変数であり,その期待値は 100×0.95=95 である」
>> という信頼区間の「性質」と言ってしまうのは不味いのでしょうか?
僕はあまりまずくないと思いますが、ネイマン・ピアソン統計学派の人達は「まずい!」と言うと思いますよ。(^_^;)
その理由は、標本平均値と標準誤差は固定された値ではなく、標本平均値は正規分布に従う確率変量であり、標準誤差はχ2乗分布に従う確率変数です。そのため母平均を含む信頼区間の個数は、厳密にはB(100,0.95)に従いません(ただし100個の信頼区間が得られた時、そのうち母平均が含まれる信頼区間の期待値は95になります)。
これは統計学の草創期にゴセット(Student)によって発見されたことであり、標本平均値と標準誤差を組み合わせて検定統計量や信頼限界(信頼区間の下限と上限)を求めると、それは正規分布ではなくt分布に従います。そのため信頼区間の計算にt分布の5%断点の値(定数c)を使うのです。
そして標本平均値と標準誤差が確率変数であることから、信頼区間に母平均が含まれる確率という解釈ではなく、母平均を含む信頼区間を得る確率という解釈になるわけです。
それに対してベイズ統計学派の人達は、結果の確率ではなく原因の確率を使って「信用区間に母平均が含まれる確率は95%である」と解釈します。
僕はベイズ統計学派ではありませんが、信頼区間に関してはベイズ統計学派の人達の解釈の方が実用的だと思ってますよ。(^_-)

1867. Re[1866]:[1865]:信頼区間の解釈について 投稿者:上条あかね 投稿日:2022/10/26 (Wed) 10:14:58
引き続き有難う御座います.

>ただし信頼区間の解釈については、ネイマン・ピアソン統計学では結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するのに対して、ベイズ統計学では原因の確率を使って「信用区間の間に母平均が95%の確率で入っている」と解釈します。

この話題では「解釈(interpretation)」という表現,また,(ネイマン・ピアソン統計学での)95% 信頼区間の「95」の説明として「 95% 信頼区間を 100 回作ると,そのうちおよそ 95 回は母平均が属するものが得られる」という説明をよく見かけます.

これを反復試行における成功回数の期待値を用いて

「標本平均値 x(ω) と固定された標準誤差から得られる母平均の 95% 信頼区間に母平均が属するような標本点 ω 全体からなる可測集合 {ω| |(標本平均)(ω)-(母平均)|≦(定数c)×(標準誤差)} の確率は,c の定め方から,0.95 なので,100 個の標本平均値と固定された標準誤差から得られる母平均の 95% 信頼区間のうち母平均が属するものの個数は B(100,0.95) に従う確率変数であり,その期待値は 100×0.95=95 である」

という信頼区間の「性質」と言ってしまうのは不味いのでしょうか?

1866. Re[1865]:信頼区間の解釈について 投稿者:杉本りお [URL] 投稿日:2022/10/26 (Wed) 08:52:53
>上条あかね様

>> 単純に集合 {μ| |(標本平均値)-μ|≦(定数c)×(標準誤差)} を標本平均値,標準誤差から得られる母平均の 95% 信頼区間と定義するのは不都合なのでしょうか?
別に不都合はないので、現在は上記の区間を母平均の95%信頼区間の定義にしています。
ただし信頼区間の解釈については、ネイマン・ピアソン統計学では結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するのに対して、ベイズ統計学では原因の確率を使って「信用区間の間に母平均が95%の確率で入っている」と解釈します。
これは近代統計学の草創期から両学派の間で論争になっていることでして、その論争の禍根が今でも残っているので、信頼区間の解釈となると両学派とも変に意固地になるのですよ。(^_^;)
そもそもネイマン・ピアソン統計学は、統計学から主観的な「原因の確率」を排除し、客観的かつ頻度的な「結果の確率」を基礎にして統計学を構築することを目的のひとつとして発展しました。そのため信頼区間の解釈についても、結果の確率を使って「母平均が入っている信頼区間を得る確率が95%である」と解釈するわけです。
僕はどちらの学派でもないので、厳密な解釈にはあまりこだわらず、研究者には「母平均が95%の確率で入っている区間」と単純に説明してますよ。(^_-)

ネイマン・ピアソン統計学とベイズ統計学の違いについては、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→付録6 ベイズ統計学
http://www.snap-tck.com/room04/c01/stat/stat99/stat9906.html

1865. Re[1864]:[1863]:推測統計について 投稿者:上条あかね 投稿日:2022/10/26 (Wed) 00:13:44
丁寧なご回答有難う御座います.私はこの方面には全くの素人ですが,推測統計の諸概念の数学としての位置付けに関心を持っております.宜しくご指導お願い致します.

まず,先の投稿での仮説の位置付けは「正規母集団の母平均μの信頼区間 CI を用いれば,仮説 H(μ) に対する棄却・保留・採択の評価は,集合 CI と {μ|H(μ)} との関係から得られるので,検定の作業は不要ではないのか?」という意図のものでした.

>特に検定統計量が離散分布する時は、検定の棄却域と区間推定の信頼区間が食い違うことがあります。
離散分布まで戻ってしまうと話が広がりすぎるので,以降は"分散が与えられた正規母集団"についてお尋ねしたく思います.

>○玄関>雑学の部屋>雑学コーナー>統計学入門
>→1.4 推定 (2) 信頼区間の解釈
ご案内有難う御座います.

>ただし厳密にいうと95%信頼区間の意味するところは次のようなものです。
に続く 2 つの「 」の内部,および,Neyman-Pearson 釣り大会での釣師(fisher!)のお話では,母平均の信頼区間を
>もし母平均(母数)が標本平均値(点推定値)と同じ値だった
場合の標本平均値たちが属する区間と述べておられますが,単純に集合 {μ| |(標本平均値)-μ|≦(定数c)×(標準誤差)} を標本平均値,標準誤差から得られる母平均の 95% 信頼区間と定義するのは不都合なのでしょうか?(ただし,定数 c は標準正規分布の確率密度関数の区間[-c,c]上の積分が 0.95 となる正数)

1864. Re[1863]:推測統計について 投稿者:杉本典夫 [URL] 投稿日:2022/10/25 (Tue) 09:18:04
>上条あかね様
初めまして、当館の館長を務めている”とものり”こと杉本申します。当館の「統計学入門」を読んでいただき、ありがとうございます。m(_ _)m

>> ・仮説検定における仮説(母数についての条件)を次のように位置付けてよいでしょうか?
>> 「仮説検定では,
>> 信頼区間との交わりが空である集合を定める条件を棄却される仮説,
>> 信頼区間との交わりが空でない集合を定める条件を保留される仮説,
>> 信頼区間の拡大集合(信頼区間を部分集合とする集合)を定める条件を採択される仮説とよぶ.」
必ずしも、上記のように位置付けて良いとは限りません。
検定は定性試験に相当し、推定は定量試験に相当します。そのため、例えばpH計の測定結果とリトマス試験紙の測定結果を厳密に対応させることができないのと同様に、検定の仮説と信頼区間を厳密に位置付けることはできませんし、あまり意味のあることではないと思います。
特に検定統計量が離散分布する時は、検定の棄却域と区間推定の信頼区間が食い違うことがあります。
これについては、当館の次のページをじっくりと読んでみてください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→3.2 1標本の計数値 (2) 名義尺度(分類データ) (注2)
http://www.snap-tck.com/room04/c01/stat/stat03/stat0302_2.html#note02
※表3.2.6〜表3.2.9と図3.2.13〜図3.2.18が参考になると思います。

それから僕は検定廃止論者σ(^^;)なので、検定と区間推定の関係をあれこれ考えるよりも、区間推定の意味をより深く検討する方が有意義だと思っています。
区間推定の意味については、当館の次のページを参考にしてください。
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.4 推定 (2) 信頼区間の解釈
http://www.snap-tck.com/room04/c01/stat/stat01/stat0104.html
※図1.4.4が参考になると思います。

1863. 推測統計について 投稿者:上条あかね 投稿日:2022/10/22 (Sat) 07:19:14
初めまして.推測統計の基本事項について質問させて頂きます.

・仮説検定における仮説(母数についての条件)を次のように位置付けてよいでしょうか?

「仮説検定では,
信頼区間との交わりが空である集合を定める条件を棄却される仮説,
信頼区間との交わりが空でない集合を定める条件を保留される仮説,
信頼区間の拡大集合(信頼区間を部分集合とする集合)を定める条件を採択される仮説とよぶ.」

1862. Re[1861]:[1860]:順序尺度の相関関係 投稿者:北の大学院生 投稿日:2022/10/19 (Wed) 14:52:00
今回も丁寧な、ご回答を誠にありがとうございます。

人間が自分の感覚を評価する段階と統計的に望ましいことで乖離が起きていて、現在私もかかわっている痛みの研究は主観評価なので、とても難しいです。

NRSのほかにマクギル疼痛質問票を用いて、4段階評価の質問を22個調べて、それらの合計点を評価項目にしたり、グループごとに合計点を求めて「下位尺度」として評価項目にしたりして、いろいろと妥当性を検討しています。

私の分野では、VAS、NRSが一般的で、まだマクギル疼痛質問票は使われていないため、近年いわれている多次元のものを一次元にしての評価の限界を補おうとしています。

また、色々と質問させていただくことがあると思いますが、今後ともよろしくお願いいたします。

1861. Re[1860]:順序尺度の相関関係 投稿者:杉本典夫 [URL] 投稿日:2022/10/19 (Wed) 14:29:11
>北の大学院生さん

こんにちわ、先日は興味深い論文を紹介していただき、ありがとうございました。
御質問にお答えします。

1.そもそもスケールとして問題があり比較妥当性がありますか?
これは医学分野でよくあるスケールですから、ある程度は比較妥当性があると思います。

2.計量尺度との場合、(ピアソンの)相関係数またはスペアマンの順位相関係数または相関比のいずれが妥当ですか?
相手が計量尺度なら普通の相関係数と順位相関係数の両方を求め、両者を比較しながら妥当性を検討すると良いと思います。
これは感度分析の一種になります。

3.順序尺度の場合、スペアマンの順位相関係数または順位相関比のいずれが妥当ですか?
相手が順序尺度なら順位相関係数ですね。

4.名義尺度の場合、相関比または順位相関比またはクラメールの連関係数のいずれが妥当ですか?
相手が名義尺度なら相関比と順位相関比の両方を求め、両者を比較しながら妥当性を検討すると良いと思います。

昔、リューマチの臨床試験のお手伝いをした時、VASとFPSの妥当性を色々と検討をしたことがありますよ。
その結果では、人間が自分の感覚を評価する時はだいたい3〜5段階で評価することが多く、7段階以上にしたり、アナログスケールにしたりすると、再現性が悪くなる傾向がありました。
それに対して統計学的には、順序尺度を計量尺度扱いするためには7段階以上が望ましいとされています。
そこで色々な心理尺度検査では3〜5段階評価の質問を複数個調べて、それらの合計点を評価項目にしたり、因子分析を用いて関連性の強い質問をグループにし、グループごとに合計点を求めて「下位尺度」として評価項目にしたりしています。
僕の経験では、1つの項目を多段階で評価するよりも、複数の項目を3〜5段階で評価し、それらを合計して評価する方が妥当性が高い印象がありますね。
以上、何かの参考になれば幸いです。(^_-)

1860. 順序尺度の相関関係 投稿者:北の大学院生 投稿日:2022/10/19 (Wed) 13:20:38
いつも大変お世話になっています。先日は丁寧なメールを誠にありがとうございました。

さて、順序尺度との相関関係に関してお尋ねしたいのですが、 NRS(Numerical Rating Scale)に関してです。
これは、ある事柄に関して当てはまり度合いなどで、0~10までの数字で主観的に評価するものです。小数点も含めると11段階以上で評価しています。症例一つ一つ、さらに同じ症例でも毎回、スケールの大きさと間隔がランダムであるものです。

そこで、ほかの評価と相関関係を調べたいのですが、
1.そもそもスケールとして問題があり比較妥当性がありますか?
以下は比較妥当性があるとして関係の相手が

2.計量尺度との場合、(ピアソンの)相関係数またはスペアマンの順位相関係数または相関比のいずれが妥当ですか?

3.順序尺度の場合、スペアマンの順位相関係数または順位相関比のいずれが妥当ですか?

4.名義尺度の場合、相関比または順位相関比またはクラメールの連関係数のいずれが妥当ですか?

ご教授お願いいたします。

1859. Re[1858]:[1857]:不偏分散の区間推定 投稿者:キッシー 投稿日:2022/09/20 (Tue) 16:43:42
いつも丁寧な説明ありがとうございます。
感謝しております
まだまだ勉強不足でした。
今後も宜しくお願いします。

1858. Re[1857]:不偏分散の区間推定 投稿者:杉本典夫 [URL] 投稿日:2022/09/20 (Tue) 09:21:07
>キッシーさん

お久しぶりです!(^o^)/

> α=1にすると
> σL^2=σH^2≈107.88となりますが
> どういう意味になるのでしょうか?
> 点推定V=100と一致すると思っていました
α=1つまり0%信頼区間にすると、分散の区間推定値は不偏分散には一致しません。
その理由は母分散の一致推定量(n→∞の時に母数に一致する推定量)は標本分散(平方和をnで割った値)であり、不偏分散は不偏推定量(期待値が母数に一致する推定量)だからです。そして普通は一致性よりも不偏性と回帰分析における残差分散との整合性を優先して、母分散の推定値として不偏分散を用いているのです。
そしてχ2乗分布は不偏分散に関する分布ですから、χ2乗分布を利用した区間推定値は不偏性はあるものの一致性は少し悪くなります。
さらに不偏分散の平方根は母標準偏差の一致推定量でもなく、不偏推定量でもありません。しかし標準偏差=分散の平方根という関係を優先して、母標準偏差の点推定値として不偏分散の平方根を用いるのが普通です。
これに対して標本平均値は母平均の一致推定量であると同時に不偏推定量でもあるので、0%信頼区間にすると区間推定値が点推定値に一致します。

このあたりのことについては、当館の次のページを参照してください。(^_-)
○玄関>雑学の部屋>雑学コーナー>統計学入門
→1.4 推定 (注4)
http://www.snap-tck.com/room04/c01/stat/stat01/stat0104.html#note04