分散分析

講義で聞いたことのメモです。若干言葉の羅列だけになってしまっていますが…

分散分析は、層別解析や回帰モデルを目的として、連続量を評価するときに主に用いられる。

まず、基本用語を確認。その後、前半は実験・研究計画全般に関すること。分散分析に関することは後半。

反応：臨床研究で言うエンドポイント、評価項目のこと。

因子：反応の変動に影響しうる因子。回帰分析では説明変数のこと。例としては、温度や薬剤など。

水準：群と同じ。「治療群」「プラセボ群」の群。グループのこと。

制御因子：臨床研究であれば、介入・治療、暴露などのこと。

表示因子：臨床研究の場合、施設間や地域間で結果に差が出ることがある。この施設や地域にあたるのが表示因子。

ブロック因子：補助因子。医学研究では予後因子。または交絡因子。

要因実験

いくつかの因子を検証したいとき、すべての組み合わせで実験を行うこと。

臨床試験において最も有名な要因実験は、Physicians' Health Studyである。

アスピリンとβカロテンすべての組み合わせ(4通り)で検証している。

抗血小板薬低用量aspirinが心血管死を減少させるか，またβ-カロチンが癌の発生を減少させるかを検討。

aspirinは心筋梗塞(MI)のリスクを減らした。脳卒中と全心血管死についての結論は出なかった。（中村・中野・永井）

無作為割付け，プラセボ対照，二重盲検，2×2 factorial。

追跡期間は平均60.2か月（45.8～77.0か月）。

22071例。40～84歳。健常な男性医者。

aspirin群11037例，プラセボ群11034例。aspirin＋β-カロチン，aspirin＋プラセボ，プラセボ＋β-カロチン，プラセボ＋プラセボのいずれか。aspirin 325mg，β-カロチン50mgを隔日投与。

MIリスクはaspirin群で44%低下（プラセボ群の439.7件/10万人･年）に対し254.8件。相対リスク0.56, p＜0.00001）。脳卒中リスクはaspirin群でわずかに上昇（有意差なし。相対リスク2.14, 95%信頼区間0.96－4.77, p＝0.06）。aspirin群の潰瘍の相対リスクは1.22（aspirin群169例，プラセボ群138例，p＝0.08）。

出典：循環器トライアルデータベース

※上記試験は、アスピリンとβカロテンでエンドポイントが異なるという少し特殊な事例。

上記は2x2だが、例えば因子Aにパターン、因子Bに4パターンあったら12通りすべてで実験する必要があるということ。

反復とランダム化、局所管理

実験や検証の際には、同じ条件で何度も検証が行われる必要があり(反復)、因子として取り上げていない要因の影響を受けるのを防ぐためにランダム化が推奨される。また、実験場全体のランダム化や均一化が困難なときは、実験場を小ブロックに区切り局所的に均一性を保つ必要がある。例えば、A施設とB施設で治療Cと治療Dどちらが優れているか検証するとき、A施設では治療C、B施設では治療Dという風には振り分けられない(このようなデザインもあるが)。A施設内でC群とD群にワンダムに分け、B施設内でC群とD群にワンダムに分けて検証する。これが局所管理の例である。

解析の実際(例)

ある動物実験の例

f:id:teicoplanin:20210513140507j:plain

これは2元配置分散分析か？

実際はデータのとり方によって解析法が異なっている。

例えばA,Bともに制御因子(薬剤)であったら？1回目の実験と別日に2回目の実験を新たに行っていたら？(この場合2回目の方が手技に熟達しよいデータが出る場合がある)上記はすべて同じ1匹の実験動物に行われていたら？(この場合クロスオーバー実験となる)…

→すべて解析法が異なる。実験データのとり方によって解析法が異なることに注意。

分散分析

f:id:teicoplanin:20210513142255p:plain

上記のような実験を例に考えてみる。

このとき、ばらつきは群間でほぼ一様(等分散)でデータに外れ値がない場合を前提とする。

水準間で反応に差があるか？　→　つまり1日目から4日目までのHb値の平均に差があるかを検証する。

このようなときF検定が用いられる。F分布には2種類ある。

ここからはデータ分析入門「分散分析の基礎」

https://logics-of-blue.com/anova-foundation/

も参考にしつつ記述。ことわりが特にないときは、引用部分は上記サイトから持ってきたもの。

F検定には2種類あり。

分散分析には大きく分けて一元配置と多元配置（二元配置）といわれる分析方法があります．

一元配置

例えば，3カ国の男性の平均身長の違いは国籍に関係あるのかといった場合，国籍がグループを識別する（唯一の）要素になります．このように，グループを識別する要素が1つのものを一元配置のデータと呼び，これのデータを用いた分散分析を一元配置の分散分析といいます．

アメリカフランス　日　本

　○○cm 　○○cm 　○○cm

二元配置

先のデータに対し，「父親の身長が高いか高くないか」という要素を加えて，各人を２つの要素（国籍と父親の身長）で識別できるようになっているものを二元配置のデータといいます．これを用いた分散分析を二元配置の分散分析といいます．

　アメリカフランス　日　本

父親の身長高い　○○cm 　○○cm 　○○cm

父親の身長低い　○○cm 　○○cm 　○○cm

この分析では例のデータを考えた場合，分析の目的は，

国籍によって平均身長に違いはあるのか

父親の身長の高低によって平均身長に違いはあるのか

２つの要素による相乗効果はあるのか

という３つになります．とくに３つめのような「交互作用」を分析することが二元配置の分散分析の主要な目的になります．

多元配置

より多くのグループ分けの要素からなる分散分析です．詳しくは統計のテキストを見て下さい．

ちなみに2因子のF検定はt検定と全く同じである。

上記ヘモグロビンの例の場合、4群比較を行う。

分散分析の検定統計量はF比と呼ばれる。

今回は「食べ物をA,B,Cに変えた時、家畜の体重の平均値に差があるか」を調べる目的で分散分析を使うことにします。因子は餌の種類であり、水準は餌A、餌B、餌Cの3つです。
なお、ここでの分散分析は一元配置分散分析と呼ばれます。

分散分析の目的は、水準ごとに平均値に差があるかどうかを判断することでした。検定統計量であるF比を計算して、この値が大きいかどうかを判断することで、平均値に差があるかどうかを判断する流れです。

分散分析は、名前の通り分散が大きな役割を果たします。F比は以下のように計算されます。

定義通りですと理解しにくいかもしれません。F比のイメージは以下のようなところになります。

効果というのは、今回の事例では餌の違い（異なる水準の間にある違い）となります。餌が変わることによって体重が大きく変わった（異なる水準の間で体重が大きく変わった）ならば「効果が大きい」と言えます。

上記の式で、「誤差の大きさ」で「効果の大きさ」を割るのは、誤差があることを加味してもなお効果があるとみなせるかを検証している。

ヘモグロビンの例でF値を計算してみると…F値=15.79 p<0.0001

となったとする。

F検定で有意差があるとは？→群のどこかに違いがあるという意味。

2群の場合は明らかだが、3群以上の時はどこに差があるのかわからない。

このようなときには用量反応性の検討が必要。

(動物実験の場合は、使用動物ごとの個体差は表示因子とみなし、分析モデルに加えるとよい。)

	抗血小板薬低用量aspirinが心血管死を減少させるか，またβ-カロチンが癌の発生を減少させるかを検討。

	aspirinは心筋梗塞(MI)のリスクを減らした。脳卒中と全心血管死についての結論は出なかった。（中村・中野・永井）

	無作為割付け，プラセボ対照，二重盲検，2×2 factorial。

	追跡期間は平均60.2か月（45.8～77.0か月）。

	22071例。40～84歳。健常な男性医者。

	aspirin群11037例，プラセボ群11034例。aspirin＋β-カロチン，aspirin＋プラセボ，プラセボ＋β-カロチン，プラセボ＋プラセボのいずれか。aspirin 325mg，β-カロチン50mgを隔日投与。

	MIリスクはaspirin群で44%低下（プラセボ群の439.7件/10万人･年）に対し254.8件。相対リスク0.56, p＜0.00001）。脳卒中リスクはaspirin群でわずかに上昇（有意差なし。相対リスク2.14, 95%信頼区間0.96－4.77, p＝0.06）。aspirin群の潰瘍の相対リスクは1.22（aspirin群169例，プラセボ群138例，p＝0.08）。

アメリカ	フランス	日　本
○○cm	○○cm	○○cm