医療統計に関する大学院講義のメモです。
統計における結果の解釈
A市に住む多量飲酒者に肝硬変に関する注意喚起パンフレットを郵送。
肝硬変発症者は減少するか?
郵送群の肝硬変発症率は22%
非郵送群の肝硬変発症率は28%
であったと仮定する。両者の差は有意といえるか?
→パンフレット郵送と肝硬変の発症率には関係があるか?
関係があることを証明するのは非常に難しい。
→ここで登場するのが帰無仮説
「関係ないことを棄却」→「関係ある」
という風に結論付ける。
上記の例でいうと、パンフレット郵送と肝硬変発症は関係ないと仮定して、これが棄却されれば、両者は関係があると考えられる。
例えば、郵送群と非郵送群の肝硬変発症率が全く同じだと仮定する(=パンフレットの効果はなし)。
このときパンフレット郵送検証を何回も行ったとすると、
ある回では両群の肝硬変発症率は全く同じ(差は0)
ある回では両群の肝硬変発症率は2%
ある回では両群の肝硬変発症率は3%
ある回では両群の肝硬変発症率は6% ……
などとなるはずであるが、例えば両者の差が20%となった場合、「郵送群と非郵送群の肝硬変発症率が全く同じ」はちょっとおかしいのでは?と感覚的に考えられる。
→これを科学的に検証するのが統計学。検定であり、推定。
肝硬変の検証には二項定理と中心極限定理が利用できる。
コイン投げモデルが応用可能。
- コインを投げて表が出る確率を肝硬変になる確率とする。
- ただし表・裏が出る確率は1:1ではない。表が出る確率はP
- N回コインを投げてX回表が出たとするとP=X/Nと推定することができる。
- このコイン投げ実験を何回も行うと表の出る回数X/NのばらつきはPを中心とした正規分布となる。→これが中心極限定理。
以下のサイトも参考に↓
信頼区間の意味とは?
信頼区間を見るときのポイントは2つ。
1.幅がどの程度か? →狭い方がよい。
2.帰無仮説の値(多くの場合0)を含むか?
→0が含まれていないということは…肝硬変の例で言うと、同じ検証を何度も繰り返したとしても両群の肝硬変発症率の差が0となってしまうことはほとんどないだろう。
=両群の差がある可能性が高い
=パンフレット郵送は肝硬変発症を減少させる可能性が高い
※もし0を含んでいたとすると…同じ検証を何度も繰り返したとすると、両群の肝硬変発症率の差が0となってしまう(=肝硬変発症率は同じ、パンフレットの効果なし)ことが出てきてしまう可能性がある、という意味。
p値と信頼区間の違いは?
→情報量に違いがある。
検定(p値): 有意であるかないかしかわからない。0か1か2択の評価のみ。
例えばp=0.0001の治療法はp=0.03の治療法より効果が高いなどといった判断は間違い。
検定においてはp=0.0001もp=0.03も同じ。またp>0.05となってしまったときの解釈は「治療効果がない」ではない「あるかどうかわからない(保留)」である。
推定(信頼区間): 0か1かの2択の評価のみではなく、治療効果の大きさがどの程度かといったことやその効果の大きさの信頼度を示している。有意でなくても臨床的に意味のある効果もある。
95%信頼区間とは?:推定値±1.96×標準誤差
同じ検証を何回も実施し、毎回信頼区間を求めるとしたとき、平均して95%は真の値を含むような区間という意味。
(つまり肝硬変の検証を100回同じ検証を実施したとき(100個の信頼区間がこのとき得られる)、そのうち95回(95個の信頼区間)は真値を含むという意味。)
×95%信頼区間は、その間に真の値を95%の確率で含んでいる