こりんの基礎医学研究日記

都内の医大を2014年に卒業。現在は大学院で基礎研究中。日々の研究の中で疑問に思ったことや勉強したことなどを主に自分のための備忘録として書いていきいます。ときどき臨床の話や趣味の話も。必ずしも学術論文等が元となっていない内容もありますので、情報の二次利用の際はご注意ください。

誤分類バイアス

本日は誤分類バイアスについてです。誤分類バイアスは「differential misclassification=差異的誤分類」と「non-differential misclassification=非差異的誤分類」の2つがある。

 

誤分類=misclassificationが起こるのことを指しているのはどちらも同じ。例えば

疾病を発症しているのに、していないと誤って判断てしまったり、あるいは逆に疾病を発症していないのに誤って発症していると判断してしまったりなどといったこと。

 

differential misclassification=差異的誤分類:誤分類の程度がグループによって異なる。

non-differential misclassification=非差異的誤分類:それぞれのグループで等しく誤分類が起こること。

 

★non-differential misclassification=非差異的誤分類

これは全ての臨床研究で起きうる。

そして、全てのmisclassificationがランダムに起こるのであれば、それは全て差を知事目る方向に働く。例えば、喫煙と肺がんの関連についてcase control studyを考えるとき、非差異的誤分類が完全にランダムに起こる(例えば肺がんを発症しているのにしていないと判断してしまう、喫煙を本来はしていたのに誤ってしていない方に分類してしまうなど)とすれば、喫煙の肺がんへの影響は過小評価されることになる。

 

これは以下のサイトに詳しい解説あり。一部抜粋。

 

statakahiro.com

 

はじめに非差異的誤分類について説明しますが、前述のように、二値的な曝露の誤分類が疾病に関して非差異的であると、効果の推定値は「効果なし」に近づくのですが、具体的にシミュレーションしてみるとよりわかりやすいです.

以下の図では、曝露因子とアウトカムのクロス表を図で示しています.必ずしも□の大きさが人数を表すわけではないので注意してください.

これだけではわかりませんが、具体的な数字をあてはめてみましょう.心筋梗塞に対して高脂肪食の摂取がリスクになるか、という検討を行っているイメージをしてください.真の関係ではオッズ比が5.0ですが、アウトカムが20%ずつなし→ありに、あるいは曝露因子が20%ずつなし→ありに誤分類されたときのオッズ比の変化を示しています.

いずれも真の値よりも小さくなっているのがわかるでしょうか?また、以下のように逆にあり→なしに誤分類される場合にも同様に真の値よりも低下します.

いかがでしょうか。つまり、誤分類が存在する可能性について論じるときに、それがアウトカムとは関係なしにランダムに発生しているだろう、ということができれば、差を縮める方向へのバイアスがかかっている(bias toward the null)ことを主張できます.これはLimitationを書くうえで重要な考え方になると思います.

 ★differential misclassification=差異的誤分類

これは主にcase control studyで問題となる。「思い出しバイアス」と近い。

例えば、前述の喫煙と肺がんの例でいうと、肺がんになっている群の方が、過去の喫煙歴に関して真剣に考えるので、より正確な情報が得られやすいが、肺癌になっていない群は、そこまで真剣には思い出さない(かもしれない)。こうなると、

「実際は喫煙していたのに誤って非喫煙群に分類されてしまった人」が肺がん群より非肺がん群で多くなってしまう可能性がある。これが「差異的」誤分類となる。

 

これも同サイトに詳細な解説あり。

Case-control研究で症例群に対して曝露因子の有無を過去に遡って思い出してもらうとします.このような状況では、現時点でアウトカムを発症している人のほうがより深く思い出したり、あるいはグレーゾーンを「あり」と自己判断したりするなどして誤分類が生じ得ます.

今度はアウトカムが曝露因子ごとに異なる割合で誤分類されてしまう状況です.これは新薬Aの介入研究をやっているときに、新薬Aだとちょっと形が違っていてプラセボと比べていい、などという状況を思い浮かべてみましょう.自覚症状の改善をアウトカムにしているので、新薬飲んでいる人のほうが効果を実感しやすい可能性があり、効果が過大評価されてしまいます.

差異的誤分類では研究デザインの段階でいかに制御できるか、ということが非常に重要な因子になることがわかりますね.