こりんの基礎医学研究日記

都内の医大を2014年に卒業。現在は大学院で基礎研究中。日々の研究の中で疑問に思ったことや勉強したことなどを主に自分のための備忘録として書いていきいます。ときどき臨床の話や趣味の話も。必ずしも学術論文等が元となっていない内容もありますので、情報の二次利用の際はご注意ください。

公衆衛生レクチャーで学んだこと⑦~優越性試験・同等性試験・非劣性試験〜

公衆衛生に関するレクチャーを受けました。それで新たに学んだこと、よくわからなくて後で調べたことなどをメモ的に書いていきます。

 

優越性試験・同等性試験・非劣性試験

通常のランダム化比較試験=RCTは優越性試験として組まれていることが多い。

例えば、新薬Aと既存薬Bの効果を比較したいとき、「新薬Aは既存薬Bより優れているか?」を調べるためのRCTが組まれることが多い。

このとき帰無仮説「新薬Aと既存薬Bの効果が同等である」となる。

p<0.05 →帰無仮説棄却新薬Aと既存薬Bの効果には差がある→新薬Aの方が有効

p≧0.05 →帰無仮説棄却できず≠採択新薬Aと既存薬Aの効果は差があるとは言えない(差があるかどうか分からない)

後者の場合、あり得る可能性は、新薬Aと既存薬Bの効果に本当に差がない=同等か、あるいはサンプルサイズが小さい、のどちらか。

 

中には上記のように既存治療より効果的でなくてもいい場合もある。

例えば、以下のテーマを考えてみる。

①あるがんに対する2つの治療法、化学療法vs化学・放射線療法、どちらがいいか。

②肺炎球菌ワクチンに対する既存薬より安価な新規抗生剤Aは、既存抗生剤セフトリアキソンと比較して効果はどうか。

 

①に関しては、化学療法だけの方が優れていなくても、化学療法と化学・放射線療法の成績が全く同等だったら、化学療法のみを選択することになると考えられる(放射線療法をやってもやらなくても同じであればやる必要はない)。

 

②に関しては、セフトリアキソンは肺炎球菌に対して非常に効果的であることは既に分かっており、新規抗生剤A肺炎球菌に有効であってもセフトリアキソンとの効果の差はごく小さいものになるだろうと予想できる。小さい差を検出するには多くのサンプル数が必要となるが、これは大変である。セフトリアキソンより新規抗生剤Aが優れていなくとも、効果が同等であれば、安い新規抗生剤Aを使うことになるはずである。

 

→ここから出てきたのがまず同等性試験。上記の通り、同等であることを証明する臨床試験となる。ここではp値は用いず、代わりに信頼区間を用いる。ある範囲の中に治療効果の差が収まっていれば同等とみなすことになる。しかしここでまた問題となるのが「ある範囲の中に収まっていれば」という点であり、狭い範囲に信頼区間を収めようとするとサンプルサイズが必要になってくる。ここで、非劣性試験となれば、信頼区間が狭くて済むため、サンプルサイズが少なくて済む。

 

 

f:id:teicoplanin:20201110172107p:plain

出典:感染症医のための非劣性試験の読み方(第1部)

http://www.theidaten.jp/journal_cont/20140826J-51-1.htm

 

非劣性試験のとき、

帰無仮説「試験的介入は標準介入よりδ以上劣る」

対立仮説「試験的介入は標準的介入よりδ未満劣る」

非劣性マージンδ=ε(S-P)で表される。

ε=主観的に係数を決定 S-P=先行研究からプラセボに対する標準的介入の効果を設定

出典:非劣性試験の入門

https://www.slideshare.net/okumurayasuyuki/ss-76150180

 

その他、以下のサイトに詳しい解説があるので抜粋

  • 解析については、検定よりも情報量の多い信頼区間アプローチが推奨されている。優越性試験ではintention-to-treat(ITT)解析、すなわちランダム割付された治療を完遂できたかどうかにかかわらず、ランダム化されたグループ内で解析することが推奨されている。ITT解析は群間の治療効果の差を薄める方向へ働くため、非劣性試験では第一種の過誤を増大させる危険性がある。このため、非劣性試験では、実際に治療を受けた患者のみについて解析するper-protocol解析も同時に実施することが望ましいとされる。ただし、per-protocol解析では群間のランダム化が担保されないため、ITT解析も同時に行うべきであり、両方の解析で同じ結論が得られれば結論の信頼性が高くなる。両者の結果が乖離した場合の解釈は難しい。
  • 「臨床的に意味のある差」は、医師の考え方や患者の状態・意向によって実際には変わりうる。研究論文で設定された非劣性マージンΔが、誰もがいつでも受け入れられる差とは限らない。
  • 優越性検証のRCTでバイアスを減らすblinding(盲検化)も、非劣性試験ではバイアスの制御を保証しない[7]。仮に、ある評価者が薬の効果と関係なくすべての被験者に同じ評価を行った場合、両群の差はなくなるため、非劣性を証明できてしまう。

出典:感染症医のための非劣性試験の読み方
http://www.theidaten.jp/journal_cont/20140826J-51-2.htm

 

 

非劣性試験の例

Hochberg MC, et al.

Combined chondroitin sulfate and glucosamine for painful knee osteoarthritis: a multicentre, randomised, double-blind, non-inferiority trial versus celecoxib.

Ann Rheum Dis. 2016 Jan;75(1):37-44. 

変形性膝関節症(OA)の痛みがひどい患者へのコンドロイチン硫酸+グルコサミン塩酸塩(CS+GH)vsセレコキシブ

セレコキシブはOA患者にしばしば用いられるが、消化性潰瘍や心血管疾患などの副作用が問題となる。そこでCS+GHで代用できるか検証。

他施設、ランダム化、二重盲検、非劣性試験をデザイン。

  • 40歳以上、アメリカリウマチ学会の基準に従い画像的にOAと診断された患者。
  • 400mgコンドロイチン硫酸+500mgグルコサミン塩酸塩1日3回または200mgセレコックス6か月間で対決。
  • 6か月間でのWOMACペインスケールの減少の程度をモニタリング。
  • 非劣性試験としてサンプルサイズを計算し、各群あたり280人。
  • 臨床的に意味のある差を0、common SDを過去の研究から100段階ペインスケールで26、非劣性マージンδを8とすると検出力は90%。
  • 基本的な解析はper protocolで行い、その後ITTでも追加検証。(上記参照)

この結果、非劣性を確認。-40以上を非劣性マージンとして、PerProtocol解析で-25.07 to 14.93、ITT解析で-21.25 to 18.11。安全性も問題なし。