講義で習ったことのメモ。
決定木分析 Decision tree
木の形の図を用いて分類や回帰、意思決定を行う方法。
はじめに1つの文献をご紹介。
Best M, Katamba A, Neuhauser D.
Making the right decision: Benjamin Franklin's son dies of smallpox in 1736.
Qual Saf Health Care. 2007;16(6):478-480. doi:10.1136/qshc.2007.023465
Benjamin Franklinは自伝の中で以下のように述べている。
「私は1736年に息子の1人を天然痘で4歳で亡くした。私は予防接種を受けさせなかったことを長い間、そして今でも後悔している。(中略)私はより安全な方を選択する必要がある。」
ちなみにBenjamin Franklinはアメリカの政治家・科学者で、雷が電気であると発見した人。100ドル紙幣にも印刷されているとのこと。
彼の選択をここで決定木を用いて検証してみる。
上記のように予防接種をする(=inoculate)場合としない場合、それぞれの生存率を書き入れる。生存率は当時のボストンの予防接種者・非予防接種者の死亡率をもとに算出し記載。
予防接種するという選択をしたときの生存率は0.979
これに対し、予防接種おしないとしたときの生存率は0.854x+(1-x)=1-0.146x
となる。
両者が等しくなるのは0.979=1-0.146x →x=0.143835…
つまり、ボストンで生活していて天然痘に感染する確率が
14.4%以上のとき → 予防接種をした方が生存率が高い
14.4%未満のとき → 予防接種をしない方が生存率が高い
というふうに決定木をもとに選択することができる。
ここで、例えば、ワクチンを接種せず田舎に逃げるという方法も試しに検証してみることにする。
最初に示した例と同じように計算をしていくと、感染率が
14.4%以上のとき → 予防接種をするのが最も生存率が高い
14.4%未満のとき → 田舎へ逃げるのが最も生存率が高い
という結果になる。これが決定木の考え方。