【EZR】逆数重み推定(IPW)でATT(被治療集団における処置効果)の推定手順【図解】

EZR

    この記事で学べること

      • 傾向スコアを用いた逆数重み推定法(IPW)とは?
      • ATT(被治療集団における処置効果)とは?
      • 重みづけをしたあとの背景情報のバランスの確認方法

    この記事のまとめ

      • 傾向スコアを用いた逆数重み法を使えばグループ間の背景が揃う
      • ただしどのような集団に着目した分析結果を得るかは重みの作り方によって異なる
      • EZRを使えば簡単に傾向スコアの計算とATT重みづけ推定ができる

    傾向スコアと逆数重み法とは

    傾向スコアとは

    傾向スコアについては,こちらの記事で解説しています.傾向スコアは平たく言えば「背景情報から予測される処置をうける確率」です.背景情報から計算される数値なので,背景情報をまとめたスコアとして考えることができます. 傾向スコアのように背景情報をまとめたスコアを利用する旨味は,一度に複数の背景の情報を扱うことができる点です.例えば処置をうけたグループ(処置群)と処置を受けなかったグループ(非処置群)がまったく背景の異なる集団だったら,フェアな比較はできません.ここでひとつひとつの背景情報を揃えるように組み合わせを考えると,膨大な作業コストがかかってしまいます.このときに沢山の背景情報をまとめたひとつのスコアを使うことができれば,その労力を払わなくて済むよね,ということです.

    傾向スコアを用いた逆数重み推定法(IPW)とは

    上記で説明した傾向スコアは一般的に,以下の方法で利用されます.

    • 多変量回帰モデルの共変量(説明変数のひとつとして)考慮する(ANCOVA)
    • 傾向スコアが近い処置群-非処置群でマッチングする(マッチング)※
    • 治療確率の逆数を使って水増しした疑似集団を作る(逆数重み法:IPW)

    本記事の話題は,最後の逆数重み法(IPW)についてです.IPWの詳しい説明やEZRを用いた実装方法はこちらの記事で紹介していますので,本記事だけで理解が難しければ,そちらも参考にしてみてください.簡単におさらいするとIPWでは,

    1. 処置群については処置を受ける確率の逆数(1/処置確率)で重みづけ
    2. 非処置群については処置を受けない確率の逆数(1/(1-処置確率))で重みづけ

    することによって,もともとの集団を水増しした仮想的な集団を作り出します(疑似集団とよんだりします).以下図のように,(1)処置群では赤色のひとたち,(2)非処置群では緑色のひとたちの分だけ,重みづけによって集団が水増しされています. 重みづけ前(左)には処置群と非処置群とに存在する対象者の特徴にはずれ(偏り)がありますが,上記で紹介した重みづけを行うことによって,同じような特徴をもった(同じような傾向スコアをもった)対象者が,処置群と非処置群で同程度存在するようになったことが分かります.これによって冒頭のフェアな比較が達成できそうです. ※本記事の本題ではありませんが,傾向スコアのマッチングについてはこちらの記事で解説していますので,興味があれば参考にしてみてください.

    全集団における効果(ATE)と被処置者における効果(ATT)の違い

    さて,ここからが本記事の本題です. 傾向スコアが1/3の女性(左から2列目)の女性は,重みづけ前(左)では両群あわせて3名存在しました.重みづけ後(右)では,処置群に3名,非処置群にも3名存在していて,それらを比べています.これは言い換えると,「傾向スコア1/3をもつ女性全員が処置を受けた場合と受けなかった場合を比較している」と言えます.実際にはそれぞれの対象者は,処置を受けている・受けていないのいずれかで,

    • 処置を受けた女性がもし処置を受けなかったら?
    • 処置を受けなかった女性が処置を受けていたら?

    という「もしも」は現実には観察できません.しかしIPWで疑似的に作り出した集団であれば,3名全員が処置を受けた場合と受けなかった場合を仮想的に作り出すことができているので,そのような「もしも」の効果の評価が理論上可能となります(これを「反実仮想」と呼びます). ここからさらに話を「推定の対象(Estimand)」に伸ばしていきます.上記の傾向スコア1/3をもつ女性3名については,内1人が実際に処置を受けており,内2人が処置を受けていません.例えばあなたが医師だとして,自分が処方したお薬の効果をみたいとします.このときに「お薬の効果が知りたい」といっても色々なパターンがあり得ると思います.

    1. お薬を処方するかどうか悩みうる全ての患者さんにおける効果を知りたい(ATE)
    2. お薬を処方した患者さんにおける効果を知りたい(ATT)
    3. お薬を処方していない患者さんにおける効果を知りたい(ATU)

    1は上記の例で触れたように,3名の女性全員が処置をうける・うけない状況を仮想して比較するという状況です.最も一般的に行われるのはこちらの分析かもしれません.このような「集団全員における平均的な処置効果」をAverage Treatment Effect (ATE)と呼びます.以前に書いたこちらの記事で紹介しているIPWを用いた分析では,このATEを推定しています. 2については,お薬の処方を実際に受ける患者さんは他の患者さんとはやはり異なる特徴をもつひとたちで,相応の理由があったから治療を受けている可能性があります.この場合は治療を受けなかったような状態の患者さんたちの効果は関心の外であり,知りたいのは「実際に治療を受けた患者さんたちの効果」であると考えられます.つまり治療を受けた患者さんたちがもし治療を受けていなかったら?という場合と比較した効果を評価する必要があります.このような「処置を実際に受けた集団における平均的な処置効果」をAverage Treatment Effect on the Treated (ATT)と呼びます.臨床研究では本来重要なEstimandなのですが,日本の臨床研究の現場ではそもそもEstimandの考え方自体きちんと浸透していないので,分析においてATEと区別して利用されていないこともしばしばありそうです. ※PMDAとかはちゃんと区別するように喚起してますが現場教育の限界だと思います. 3については2の反対で,お薬の処方を受けなかった患者さんたちにもし処方していたら?を評価することになります.このような「処置を実際に受けなかった集団における平均的な処置効果」はAverage Treatment Effect on the Untreated (ATU) と呼ばれます. 今回の主題は「ATEではなくATTを推定する方法」なので,次節からは実際の手続きについて紹介します.

    被処置者における効果(ATT)推定のための重みづけ

    ATTを推定するときの目標は「処置を受けた集団がもし処置を受けていなかったら?」という仮想の集団を作り出すことです.当然,すでに処置を受けたひとたちからはそのような集団は作れません.従って処置を受けていない集団の分布を重みづけによって変化させることで,そのような仮想集団を作り出すことを目的とします. 以下の図は,重みづけを行う前のオリジナルな集団です.処置群と非処置群に属する人の特徴(=傾向スコア)がずれていることが分かります.この特徴のずれがあると,群間でのフェアな比較が出来なくなって(バイアスが生じて)しまいます. ここでIPWを利用して,この背景のずれを小さくすることが今回の目的です.特に今回はATTを推定するため,処置群と同じような背景情報をもつ非処置群を作り出します.そのため基準となる処置群については,重みはつけません(つまり重みは1).従って処置群の特性の分布は変わりません 続いて非処置群の特性の分布を,処置群に類似した形になるように,以下の重みをつけます. 重み = 傾向スコア/(1-傾向スコア) 実はこの重みは,

    1. ATEと同様に 1/(1-傾向スコア) = 処置を受けない確率の逆数 で重みづけした後に,
    2. 傾向スコア=処置を受ける確率 を掛けている

    と同様の手続きを踏んでいることになります.つまり一度(1)疑似的な全集団(ATEで考えた集団)を作り出してから(2)処置確率(集団内で処置を受けている)を掛けることで治療群と同じ分布に近づけるという手続きをふんでいます. ※実は処置群についても,ATEと同様に1/傾向スコアの重みづけをした後に傾向スコアを掛ければ,結果的に重みは1になるので,同じ手続きをふんでいると考えることが出来ますね. 具体的には以下のような計算を経ることで,薄い白色の方々が減り,緑の方が水増しされています. このような重みづけによって得られた特性の分布について,処置群間で並べてみます.以下の通り,極端な特性を持つ方以外は,非処置群の分布が処置群に近づいたことが分かります.これで重みづけ前よりも,フェアな比較が実現できそうです.