こりんの基礎医学研究日記

都内の医大を2014年に卒業。現在は大学院で基礎研究中。日々の研究の中で疑問に思ったことや勉強したことなどを主に自分のための備忘録として書いていきいます。ときどき臨床の話や趣味の話も。必ずしも学術論文等が元となっていない内容もありますので、情報の二次利用の際はご注意ください。

決定木分析 Decision tree

講義で習ったことのメモ。

 

決定木分析 Decision tree

木の形の図を用いて分類や回帰、意思決定を行う方法。

はじめに1つの文献をご紹介。

 

Best M, Katamba A, Neuhauser D.

Making the right decision: Benjamin Franklin's son dies of smallpox in 1736.

Qual Saf Health Care. 2007;16(6):478-480. doi:10.1136/qshc.2007.023465

 

Benjamin Franklinは自伝の中で以下のように述べている。

「私は1736年に息子の1人を天然痘で4歳で亡くした。私は予防接種を受けさせなかったことを長い間、そして今でも後悔している。(中略)私はより安全な方を選択する必要がある。」

 

ちなみにBenjamin Franklinはアメリカの政治家・科学者で、雷が電気であると発見した人。100ドル紙幣にも印刷されているとのこと。

 

彼の選択をここで決定木を用いて検証してみる。

 

写真やイラストなどを保持する外部ファイル。オブジェクト名はqc23465.f1.jpgです。

 

上記のように予防接種をする(=inoculate)場合としない場合、それぞれの生存率を書き入れる。生存率は当時のボストンの予防接種者・非予防接種者の死亡率をもとに算出し記載。

 

予防接種するという選択をしたときの生存率は0.979

これに対し、予防接種おしないとしたときの生存率は0.854x+(1-x)=1-0.146x

となる。

 

両者が等しくなるのは0.979=1-0.146x →x=0.143835…

つまり、ボストンで生活していて天然痘に感染する確率が

14.4%以上のとき → 予防接種をした方が生存率が高い

14.4%未満のとき → 予防接種をしない方が生存率が高い

というふうに決定木をもとに選択することができる。

 

ここで、例えば、ワクチンを接種せず田舎に逃げるという方法も試しに検証してみることにする。

 

f:id:teicoplanin:20210517143342p:plain

最初に示した例と同じように計算をしていくと、感染率が

14.4%以上のとき → 予防接種をするのが最も生存率が高い

14.4%未満のとき → 田舎へ逃げるのが最も生存率が高い

という結果になる。これが決定木の考え方。