チェックメイト（アラサー編）: 10月 2014

※内容に責任は持ちませんので、ご了承ください。この投稿を根拠に何かを始めるより、近くの統計家に相談することをお勧めいたします。

本日
朝　
研究のデータ再解析依頼。どう考えても最大値がおかしな値になっていると。当時のスクリプトを読み直すと確かに一文字違っていた。指摘いただいて本当によかった。一人でやっているので、何度も何度も確認はするのだが、たまにこういうミスをする。にんげんだもの。で終わればいいけど、そうも行かない。チェックリストや検索機能をもっと使って、出来るだけミス０に。いや、目標だから０にしますって言ってしまえばいいのかな。

あと１１月末にやる統計とは関係ない発表の資料集め。
厚労省の通知とかその辺を読み直す。
商業誌とかその辺での最近の動向とか、学会、研究会での議論の内容をまとめた。
いや、まとまってないか。集めたところまで。

昼
某診療科のジャーナルクラブで「データのバラつき」について話す。
多分もう何度も話しているけど、とういうことは自分もそれが重要だと思っているのだろう。
このレクチャー、毎回１５分でワントピックレクチャーということで、すでに４０回以上話している。
つまり、９０分講義１５回分はあるはずだ。
指標の話から、検定の話、論文の読み方、症例数設計の概念、あらかたの内容はしゃべっている気がする。
上手くまとめたいが今は少し時間がない。でも時間がないことを言い訳にしてもなぁ・・・。

本編ではNEJMの論文。
大変綺麗なデザインで、ポジティブでなくてもきちっと論文になっている。
ただ臨床仮説に関してはいろいろとディスカッションがあるようだった。
デザイン自体は手本に出来るでレベルなので覚えておこう。

昼からはさらに解析を一つ。まとめ方が難しいのだが、少し考える。

夕方以降
他施設ビデオカンファで勉強。
途中で相談が入ったので中抜け。
前から関わってきた研究の査読の返答に関してのこと。
なぜプロペンシティスコアを使わないのか。という質問にどう答えるか。
うーん。

Q）propensity scoreはどういう時に使うのですか？
A)一見背景が揃わないであろう群間の比較したい時です。

解説）
まずpropensity scoreが何を意味するのかを的確に捉えることが重要です。
マッチングさせるのは何なのか？

例えば、手術をするのか、ケモ（化学療法）をするのか。
治療方針が程度決まっている場合には、二群を背景に大きな偏りが生じる事があります。
例えば手術群には手術ができる元気な患者さんが多いかもしれません。
でも、手術できても患者希望でケモをやっている可能性もあります。
ケモ対象の人でも然りです。
臨床医はいろいろな情報を総合的に判断して、方針を決めます。

１）ある患者さんが来ていろいろな情報を聞き、このような患者さんであれば、ケモになるのが80%だな。実際にケモ群になった。

２）ある患者さんが来ていろいろな情報を聞き、このような患者さんであれば、ケモになるのが80%だな。あ、実際には手術群になった。

１）２）に関してはそれぞれ介入前は同じような確率でケモ群に割り当てられようとしていたわけですので、介入前の予後は同じはずです。または有害事象の発生割合は一緒のはずです。しかし、なぜか１）の人のほうが３ヶ月長く生きることになりました。または有害事象が片方では起こり、もう片方では起こりませんでした。するとどうでしょう？介入が何か影響を与えたのではないかということになりますよね。（細かいことを言えば手術群では術後合併症という有害事象が多く、ケモ群では薬剤性の有害事象が多くなるはずです）ただ、もちろん２人の比較で物事は判定できません。そのためこのような事を沢山の人数で行うのです。つまりマッチングに使用しているのが、確率なんですね。どちらの介入に割り当てられるかの確率。

どちらの介入に割り当てられるかの割合が同じになった。
つまりこれってランダム化の時も出てくる言葉です。
患者が試験の適格除外基準をクリアしそうだ。
登録後１：１に手術群、ケモ群に割り当てます。
ってのと同じ事の逆なんですね。

だからさもランダム化したかのような集団を得ることが出来るわけです。
たしかにランダム化したかのような集団ですが、ランダム化では未知の変数もランダム化出来るという点で越えられない壁が存在しています。これはまた別の話。

とういうことでpropensity scoreとはそれぞれの治療に割り当てられる確率のことであり、それを用いてマッチングを行うのが、propensity score matching。もちろんマッチングなので、ケースに対して、１：１または１：nで集めて、それぞれの治療成績などを見るという研究です。

つまり答えとしては、一見背景が揃わないであろう群間の比較に用いるというのが自分の基準です。

勿論前向きで使うと宣言しておくのが一番だと思います。

後ろ向きの場合は、まず群間の背景因子の確認を行います。
そこで有意水準「以上」のp値しか出ていなければ偏りなしと判断し、いわゆるマッチング等は使わずに単純に全例で解析を行うようにします。症例が多いほうがいいですし。
偏りが一部分にだけ出てくる場合は単純マッチングを薦めます。一部分の大きさは単純マッチング出来るかどうかです。
どうにも出来ない場合はプロペンシティスコアでマッチングします。ただしこの場合は相当症例数が削られてしまうことがありますので、注意です。

勿論こんな方法だと、色々解析やって結果が出た時点で報告してるだけじゃないかと言われる可能性があります。それは幾ら統計家にコンサルとしても拭い去ることの出来無いバイアスです。

そのため後ろ向き研究の場合も計画ありきで行うことをおすすめします。どう考えても背景がバラつきそうな場合ははじめからpropensity scoreでマッチングすると宣言しておけばそのバイアスはいくらか軽減されます。

以上、統計的に言えば、ケースコントロール研究において、スコアでマッチングを行う。スコアは介入方法を従属変数とするロジスティック回帰式を用いて作成する。キャリパーは標準偏差の10%とし、１：4でコントロールから選択する。コントロールからは、ケースに対する候補の中からランダムに抽出する。

という感じでしょうか。はい。

いやー読み返してもよくわからない。冗長。もう少し精進が必要です。
一発で頭にすーっと入ってくる文章をかけるようになりたい。

明文化できていないということは理解できていないということ。

はい。

取得できていないデータの解析は出来ない

無いデータは解析できない。解析したいこと、解析したい事に関連していることは少し多目に集めておくべし。１項目足りなくてももう一回全員のカルテをめくらなくてはならない。

欠損なのか、そもそもデータがないのか、未検査だったのか

あるはずのデータがないのか、男性に生理だったか聞いているのか、どう考えても元気だから検査をやらなかったのか。全く意味合いが違えば、解釈も変わってくる。

変数の名前は打ち込むときに迷わない名前に

性別を０と１でかきこんでいたとき、どちらが男性か明確に分かる人はいるだろうか（一部の男女特有の疾患は別として）

カテゴリカル・データは二値に出来ないかを検討しておくこと

現場では目の前の患者さんに対して、何かをやるかやらないかの二択にいつも迫られている。そんな中、検査値を見て陽性尤度がなんたらかんたらと言っている人がいるだろうか。

一つのセルに２つ以上の情報をいれない

われわれは違う情報とわかるのだが、カンピューターにはわからないのである。融通きかないのである。

数字はアラビア数字を使うこと

ローマ数字を数字としてカンピュータは扱ってくれるだろうか。文字として読み取っていれば、順序の情報は消え去ってしまう。

疲れた時に打ち込むと沢山ミスをする

今日も、これからビールを飲むか、データを打ち込むかの二択を沢山の臨床家が迫られている。

子供が病気の時は打ち込んでは行けない。

家庭を崩壊してまでやる意味はあるのか。子供がそんな親を見てやりたいと思うか。

間違えないという気持ちを持つことが間違っている

完璧など存在しない。

１から９を何度か読んで、下っ端にこれみよがしに伝えて欲しい。

偉そうにしゃべるためには少なくとも自分で理解していないとダメ

まあ9.10は別としてまあまあ重要なことと思っています。

この2年半で感じていること。

FileMakerを使うことより、Accessを使うことよりずっと大事。

チェックメイト（アラサー編）

2014年10月23日木曜日

propensity scoreはどういう時に使うのですか？

2014年10月22日水曜日

データベースを作る前に読んで欲しいたった１０の文章