2012年12月21日金曜日

困ってしまうのはお姉さんだけではないというお話。



生存を説明してくれるかもしれない要因が30個。
これが生存時間にどのくらい関連しているかを確認するために多変量解析をしようとする。
サンプルは500人分くらいあって、全部イベントが起きている。
この時、34個全てを入れるモデル。
生存を説明してくれるかもしれない要因が30個。
これが生存時間にどのくらい関連しているかを確認するために多変量解析をしようとする。
サンプルは500人分くらいあって、全部イベントが起きている。
この時、34個全てを入れるモデル。
1つ外すモデル。
2つ外すモデル。
ひとつひとつを入れるか入れないかで2^34-1通り出来る。

そして、Rを開き、
library(survival)
をうつ。
summary(coxph(Surv(time,event)~treatment,data=data))だったよね。

そして、解析を始めようとするが、ちょっと待った。

2^30-1とはいかほどの数字なのか。

おもむろにgoogleを開き、上の数値を打ち込む。
すると、

2^30-1=1 073 741 823
実感が全くわかないので1時間(3600秒で割ってみる。)
(2^30-1)/3600= 298 261.617
結構な時間がかかるらしい。
何日なのか。
(2^30-1)/3600/24=12 427.5674
何十年のレベルらしい・・・。
(2^30-1)/3600/24/365.25=34.0248252

お父さん。僕、お父さんになれるよ?
ひとつの解析が1秒とすれば34年かかるらしい。
その間にもっと良いパソコン出るよ!

こんな時、変数選択という概念を利用すると便利です。
すべての組み合わせを試して見るわけでは無いですが、それに近い答えが出てきます。
困ってしまうのはお姉さんだけではないというお話。

こちら


2012年12月3日月曜日

モノグラム


正直全く知らなかったが、ノモグラムというものがあるらしい。

すでに調べておられる方がおられたので

http://d.hatena.ne.jp/isseing333/20110308/1299562794

とかwikiなら

http://goo.gl/ZoHUz
とか
http://en.wikipedia.org/wiki/Nomogram
とか。(したが英語)


今は計算機が発達しているので、これに頼る必要はないと感じるし、電卓でさえ今は105円で手に入るからなあ。。。

対数尺?(見たことがない)などと同じように時代と共に廃れていく方法なのかもしれないですね・・・。