2012年12月21日金曜日
困ってしまうのはお姉さんだけではないというお話。
生存を説明してくれるかもしれない要因が30個。
これが生存時間にどのくらい関連しているかを確認するために多変量解析をしようとする。
サンプルは500人分くらいあって、全部イベントが起きている。
この時、34個全てを入れるモデル。
生存を説明してくれるかもしれない要因が30個。
これが生存時間にどのくらい関連しているかを確認するために多変量解析をしようとする。
サンプルは500人分くらいあって、全部イベントが起きている。
この時、34個全てを入れるモデル。
1つ外すモデル。
2つ外すモデル。
ひとつひとつを入れるか入れないかで2^34-1通り出来る。
そして、Rを開き、
library(survival)
をうつ。
summary(coxph(Surv(time,event)~treatment,data=data))だったよね。
そして、解析を始めようとするが、ちょっと待った。
2^30-1とはいかほどの数字なのか。
おもむろにgoogleを開き、上の数値を打ち込む。
すると、
2^30-1=1 073 741 823
実感が全くわかないので1時間(3600秒で割ってみる。)
(2^30-1)/3600= 298 261.617
結構な時間がかかるらしい。
何日なのか。
(2^30-1)/3600/24=12 427.5674
何十年のレベルらしい・・・。
(2^30-1)/3600/24/365.25=34.0248252
お父さん。僕、お父さんになれるよ?
ひとつの解析が1秒とすれば34年かかるらしい。
その間にもっと良いパソコン出るよ!
こんな時、変数選択という概念を利用すると便利です。
すべての組み合わせを試して見るわけでは無いですが、それに近い答えが出てきます。
困ってしまうのはお姉さんだけではないというお話。
こちら
登録:
コメントの投稿 (Atom)
0 件のコメント:
コメントを投稿