こりんの基礎医学研究日記

都内の医大を2014年に卒業。現在は大学院で基礎研究中。日々の研究の中で疑問に思ったことや勉強したことなどを主に自分のための備忘録として書いていきいます。ときどき臨床の話や趣味の話も。必ずしも学術論文等が元となっていない内容もありますので、情報の二次利用の際はご注意ください。

続・早産児の適切なSpO2目標は?~臨床試験の倫理的問題~

大学院講義で扱った論文のメモ。

 

以前こちらを投稿しました。

teicoplanin.hatenablog.com

その続きみたいな感じです。関連文献紹介ですね。

 

まず、上記のもともとの文献を軽く振り返ります。

Abstract

 これまでの研究で、未熟児に高濃度酸素投与が行われると未熟児網膜症が起きやすくなるとされてきたが、どの程度の酸素飽和度が最適なのかは十分にわかっていないため、これを調査するため、妊娠24週0日から27週6日の間に生まれた1316人の乳児を対象に2x2のランダム化比較試験を実施。目標SpO2 85〜89% vs 91〜95%のどちらかと、CPAP vs 気管挿管+サーファクタントのどちらか、計4群にランダムに分けられ、網膜症発生率と退院前死亡率をアウトカムとした。

 その結果、重度の網膜症発生率または死亡どちらかが発生する確率は低SpO2群と高SpO2群で有意差は見られなかった。退院前死亡率は低SpO2群で有意に高かった。一方で生存者内での重症網膜症の発症率は低SpO2群で低かった。

 低SpO2の方が確かに網膜症は起きにくいが、死亡と網膜症合わせた複合転機は有意差はなく、低SpO2にすることによる死亡率の増加は重要な懸念事項である。

 

  

関連論文①

BOOST II United Kingdom Collaborative Group; BOOST II Australia Collaborative Group; BOOST II New Zealand Collaborative Group, Stenson BJ, Tet al.

Oxygen saturation and outcomes in preterm infants. N Engl J Med.

2013 May 30;368(22):2094-104.

 

先に紹介した文献は2010年のもので、これは2013年のものです。

 

**************************************

Abstract

3つの国際ランダム化比較試験。妊娠28週より前に生まれた乳児を対象に、目標SpO2: 91〜95% vs 85〜89%で、生後2年までのdisability-free survivalを比較した。中間解析にて低下酸素飽和度群での生後36週死亡率が高いことが分かり、募集は早期に中止となった。低酸素群乳児で、死亡率の有意な上昇網膜症発生率の有意な減少壊死性腸炎発生率の有意な増加がみられた。早産乳児でのSpO2<90%は死亡リスク上昇と関連していた。

**************************************

 

最初に紹介した文献と似た感じの結果というか、より低酸素群の危険性が浮き彫りになっているように思います。途中で試験中止するくらい差が出ているということですし、さらに先に紹介した文献では出てこなかった壊死性腸炎の増加という新たな有害事象も明らかになっています。

 

Discussionセクションにも

Our findings strongly favor the avoidance of targeting an oxygen saturation of less than 90% among such infants, according to readings on current oximeters.

我々の研究は、現在の酸素測定法では、このような乳児(早産児)においてSpO2<90%を目標とするのは避けるべきであると強く推奨する。

 とあり、低酸素目標はよくないと強く言っているようです。最初の文献紹介の際にも、やはり死亡+網膜症発生率の複合アウトカムが低酸素vs高酸素で変わらないのであれば、より死亡が少なくなるように目標SpO2はやはり高めに設定したほうがいいのでは?といった私見を述べましたが、これがより強化されるような内容でした。

 

関連論文②

Askie LM, Darlow BA, Finer N, et al.

Association Between Oxygen Saturation Targeting and Death or Disability in Extremely Preterm Infants in the Neonatal Oxygenation Prospective Meta-analysis Collaboration.

JAMA. 2018;319(21):2190–2201. 

 

これはさらに新しく2018年のものです。

**************************************

Abstract

早産時における適切なSpO2目標を検討するために5つのランダム化試験を対象としてメタアナリシスを実施。低酸素群と高酸素群で、死亡+主要な障害の複合転記に有意差なし。低酸素群では死亡の増加壊死性腸炎の増加に関連していたが、未熟児網膜症の減少と関連していた。意思決定にはSecondary endopointを考慮する必要がある。

**************************************

 

メタアナリシスでも2010年の文献とほぼ同じような結論になりました。これによると低酸素群も、網膜症の発生率とは関連するものの、失明とは関連がないとDiscussionに書かれていました。

 

似たような結論ながら、「決定にはSecondary endopointを考慮する必要がある。」という、関連論文①で紹介した見解とはちょっと温度差のある意見となっています。つまり、複合転帰に有意差がないので、他のことも参考に低酸素が適切か高酸素が適切か判断する必要がある、といったような感じの公平というか中立的な見解です。

この研究の倫理的問題

もともとこの最初の文献は、臨床試験の倫理に関する講義で取り上げられました。赤ちゃんを対象とした前向き試験で失明や死亡などけっこうsevereな有害事象につながりうるようなことをやるのはどうなの?ということです。

 

最初に取り上げたSUPPORT試験に関しては、Hastings Bioethics Forum (The Hastings Center)というところが以下のように報じています。

 

www.thehastingscenter.org

 

“the conduct of this study was in violation of the regulatory requirements for informed consent, stemming from the failure to describe the reasonably foreseeable risks of blindness, neurological damage and death.”

この研究は、失明、神経障害、死亡などの予見可能なリスクを十分に説明しておらず、インフォームドコンセントの気手に違反している。

 

It claimed that the study was “highly unethical” because it “exposed 1,316 extremely premature infants to increased risks of either death or retinal damage.”

(保護団体Public Citizenは)1316人もの早産児を死亡や網膜症発生のリスクにさらし、非常に非倫理的であると批判した。

 

上記に出てくるPublic Citizenというのがどういう団体なのかよく知りませんが、同じ記事内で「研究に参加したすべての赤ちゃんの両親に個別に謝罪すべきである」とまで述べています。

 

しかしこの記事の筆者(John Lantos, MD)はこれは誤解であり、行き過ぎた批判であるとしています。記事筆者によると、これは臨床的に十分に明らかになっていない事象を明らかにするための研究であり(いわゆる臨床的均衡 clinical equipoise)、適切だったとしています。つまり、低酸素と高酸素どちらが適切か十分にわかっていないから試験をしてみたところ、低酸素群の方の死亡率が高いという結果になったが、それはあくまでやってからわかったことであり、悪い結果が出たから試験そのものが間違っていたと遡及的に結論付けるのは間違っている、といった感じの意見です。

 

 

Public Citizenの意見は一般市民目線(団体名の通りですね)、記事筆者John Lantos氏の意見は科学者目線といったところでしょうか。ちなみにこのJohn Lantos氏の記事が出た1か月後くらいにPublic Citizen側の「その試験は我々が思っていたよりさらにひどいものであった」といった意見を紹介する記事が出ています。

 

www.thehastingscenter.org

 

どちらの意見も分かり難しいところです。しかし、そもそもほぼすべての介入試験(前向き試験すべて?)は人体実験なわけですが、この試験(SUPPORT試験)はその中でもちょっと人体実験要素が強くなってしまったように個人的には思います。後ろ向き試験じゃダメだったのか?などと思っていしまいます。propencity score matchingとか…もちろんRCTの正確さには及びませんが、本当は前向き試験やりたいけど倫理的問題で難しい…という事象はたくさんあるわけで、こういう時こそ統計学的手法の発揮しどころではないか…?というのが個人的見解です。