2014年5月20日火曜日

多変量解析の結果の符号に納得がいかないとき

多変量解析の結果はセットで考えるべきです。

特に説明変数に相関がありそうなときは必ずです。

例えば人の命の長さとその他の臨床検査値やある地点での患者さんの状況で説明でき出来ないかと考えます。


例えば腫瘍の再発したかしていないかと腫瘍があれば異常値を表す検査があったとしてその2つで説明しようとします。


結果としてのほうではなぜかハザードが再発していたほうが-25%、検査値異常の方ではなぜか50%のハザード増加だったとしましょう。

この時疑うべきはまず変数の0と1が考えているものと逆になっていないかということ

変数のラベルが自分が思っていたのと逆になっていないかということ。

この2つを疑っても問題なしであれば、結果を信じるしかありません。

ただ、別におかしなことではないのです、

多くの場合再発していないと検査値異常は出ません。

つまり再発and異常の組み合わせや再発なしand正常にかたよることは予想できるでしょう。(検査の感度特異度にもよりますが)

このような時例えば再発すると-25%異常だと+50%なので、人の命に対するハザードは実は全体としては+25%となります。

つまり変数間の相関や関連があればあるファクターが他方のファクターを調整するような形で存在している可能性もあるかもしれないということです。

多変量解析の結果は独立して選ばれるとかそういう言葉がよく使われていますが、一般の独立という意味と少し印象が違うというか、そもそも数学的な独立、つまり基底となりうるとか線形従属とかそういう話からの独立ですので、少し難しいですよね。。。

できるだけそういうこともあるということをわかりやすく書いたつもりですが、これでもよくわからない方はお近くの統計が得意な方にヘルプを求めた方が良いと思います。

修士の時の研究でいろいろ先生に教えてもらったのを思い出しながら・・・。