公衆衛生レクチャーで学んだこと⑩～交絡因子の調整について〜

公衆衛生に関するレクチャーを受けました。それで新たに学んだこと、よくわからなくて後で調べたことなどをメモ的に書いていきます。

交絡因子の調整について

交絡因子とは？…本来は関係ないのに結果に影響を与える因子。

よく例に出されるのは、飲酒と喫煙。統計を取ると飲酒量が多い人の方が肺がんいなりやすいと出るが、これは飲酒量が多い人に喫煙者が多いため、このような結果になる。このときの交絡因子は飲酒となる。

これを調整する方法は？

研究デザイン段階での調整
ランダム化、制限、マッチング
統計解析段階での調整
層別化、標準化、回帰

*********************************************

ランダム化
既知の交絡因子も未知の交絡因子もどちらも調整できる一方で、手間・労力・資金がかかり、また介入研究でしかできない。また常に倫理的とは限らない。
制限
交絡因子となりそうな集団を研究に含めないという方法。上記の例で言えば、飲酒者は研究に含めないなど。シンプルで簡単な方法で交絡因子の影響を完全に排除できるが、検出力が減ったり、外的妥当性が減ったりしてしまう。また交絡因子が多いときにはできない。
マッチング
同じ特徴を持つ人同士をペアにして比較する方法。疑似ランダム化などとも言われる。最近流行っている。Puropencity score matchingなど。たくさんの交絡因子を同時に扱える。しかし交絡因子が増えれば増えるほどマッチングも難しくなる。またマッチングの指標となる項目は、病期の危険因子としては考えられなくなる。
層別化
収集したデータをグループごとに分けて解析する方法。サブグループ解析などともいわれる。例えば年齢や性別、喫煙の有無、飲酒の有無などによって患者をグループ分けし、比較する方法。交絡因子がたくさんあるときは使えない。
標準化
例えば「年齢調整死亡率」などのように、1つの基準に合わせて結果を調整すること。例えば都道府県別の死亡率を見ると、高齢者の多い地域では死亡率が高く見えてしまう。これを調整するために、ある地域の死亡率を、年齢構成を基準集団と同じになるようにして求め直すなどの方法。
多変量解析(回帰モデルによる調整)
調べたい要因以外の因子も共変量として統計学的に処理する。いくつもの交絡因子を同時に処理する。