例えば3年無再発を見たいがフォローしている期間がそれにみたっていないとき。
または、3年フォローできているものもあるが、できていないものもあるとき。
その場合はカプランマイヤーと一緒にだし、ひげがどのあたりに立つかを確認できる形で示すほうが良い。
あとで追記します。
2012年10月31日水曜日
2012年10月29日月曜日
相関係数は比べてもいいのか。
相関係数の比較の話。
相関係数について、今まで、比べてはならないものだと思い込んでいた。
たぶん学部の時にそう習ったのか、テスト前にネットサーフィンしているのか忘れたけど。
たしか、文系科目として英語と国語、理系科目として物理と化学。その2つの相関係数を比べても意味ない。的な話で妙に納得していたのを覚えている。
ただ、今回医師の先生から質問されて、相関係数は比べてはならない。って即答してしまったけど、なぜか違和感があった。
そこでいろいろ調べてみた。
結論から書くと、比べてもいい時もある。
例えば同じような指標を作ろうとしている時。
上の例で言うと英語と国語を比べている時と英語と古典を比べている時、文系科目としての相関が高いのはどっちかってのは比べる意味がある。
医学でいうと、OSとその他のサロゲートとの比較は意味があると思う。
ただ、相関係数にも弱点があって、それぞれの変数が正規分布してないと、例えば二峰性であったりすると、おかしな結果を出してしまうということ。
つまり、個人的には相関係数を比較するときはそれぞれの変数のヒストグラム、代表値を確認して正規分布だとわかってから使うべき。との解釈。
つまり予備検定としてはKruskalWallisして確認した後、相関の差の検定をするべきか。
医学の分野だと正の値しか取らないから基本歪んでるよね。
つまり、統計を正しく使える環境にない人はあまり相関係数の差に対しての言及はやめたほうがいいってことになるかな。
難しいところだけども。
追記
実際の検定はこちらから。毎度のことA先生のページ。
http://aoki2.si.gunma-u.ac.jp/R/diff_r.html
相関係数について、今まで、比べてはならないものだと思い込んでいた。
たぶん学部の時にそう習ったのか、テスト前にネットサーフィンしているのか忘れたけど。
たしか、文系科目として英語と国語、理系科目として物理と化学。その2つの相関係数を比べても意味ない。的な話で妙に納得していたのを覚えている。
ただ、今回医師の先生から質問されて、相関係数は比べてはならない。って即答してしまったけど、なぜか違和感があった。
そこでいろいろ調べてみた。
結論から書くと、比べてもいい時もある。
例えば同じような指標を作ろうとしている時。
上の例で言うと英語と国語を比べている時と英語と古典を比べている時、文系科目としての相関が高いのはどっちかってのは比べる意味がある。
医学でいうと、OSとその他のサロゲートとの比較は意味があると思う。
ただ、相関係数にも弱点があって、それぞれの変数が正規分布してないと、例えば二峰性であったりすると、おかしな結果を出してしまうということ。
つまり、個人的には相関係数を比較するときはそれぞれの変数のヒストグラム、代表値を確認して正規分布だとわかってから使うべき。との解釈。
つまり予備検定としてはKruskalWallisして確認した後、相関の差の検定をするべきか。
医学の分野だと正の値しか取らないから基本歪んでるよね。
つまり、統計を正しく使える環境にない人はあまり相関係数の差に対しての言及はやめたほうがいいってことになるかな。
難しいところだけども。
追記
実際の検定はこちらから。毎度のことA先生のページ。
http://aoki2.si.gunma-u.ac.jp/R/diff_r.html
2012年10月18日木曜日
2012年10月17日水曜日
青木先生の関数fisher exact testを使う時の注意点
http://aoki2.si.gunma-u.ac.jp/R/fisher.html
このページから。
このページから。
source("http://aoki2.si.gunma-u.ac.jp/R/src/fisher.R", encoding="euc-jp")
をコピペしたらfisher exact testが出来る。
xに適当なデータを入れてやってみると
> fisher(x)
以下にエラー asymptotic() : 関数 "printf" を見つけることができませんでした
と出てくる事がある。
この場合はこのページ
の真ん中あたりで回答があり、
printf <- function(fmt, ...)
{
cat(sprintf(fmt, ...))
}
{
cat(sprintf(fmt, ...))
}
と打ち込めば使えるようになります。
何度か間違ってしまったのでまとめ。
all.R入れろって話ですかね。うーん。
あと、レトロな解析な場合は基本t検定とカイ自乗検定は使わずにマンホイットニー(ウィルコクソン)とフィッシャーでいったほうがいいと思います。
2012年10月14日日曜日
英語
英語に対しての能力が伸び悩んでいる。
多分言葉にすると「スライドを使いながら話しているプレゼンテーションならいけるけど、ただ話しているだけの授業は内容を理解できない」レベル。
サブスクリプトを見たら内容は大体わかるけど、スクリプトなしでは聞き取れないレベルって感じか。
どうしたらええんやろなー。
もう一回基礎に戻って単語とかやり直すか・・・?
いい案ある人は教えていただければ幸いです。
多分言葉にすると「スライドを使いながら話しているプレゼンテーションならいけるけど、ただ話しているだけの授業は内容を理解できない」レベル。
サブスクリプトを見たら内容は大体わかるけど、スクリプトなしでは聞き取れないレベルって感じか。
どうしたらええんやろなー。
もう一回基礎に戻って単語とかやり直すか・・・?
いい案ある人は教えていただければ幸いです。
2012年10月5日金曜日
エクセルでシートの変更他ショートカット
エクセルのショートカットで今日覚えた
ctrl+PageUp(Down)でシートの変更
F12で名前をつけて保存
エクセルファイルでアンケートをまとめてもらって、一つ一つをCSVファイルにするときにすべてキーボードで出来るようになると意外に楽だった。
30シートほどしかなかったので、マクロ組んでVBAいじる程でもなかった。
ctrl+PageUp(Down)でシートの変更
F12で名前をつけて保存
エクセルファイルでアンケートをまとめてもらって、一つ一つをCSVファイルにするときにすべてキーボードで出来るようになると意外に楽だった。
30シートほどしかなかったので、マクロ組んでVBAいじる程でもなかった。
強制投入法以外で変数候補を探索する。Rで。
まずRの画面で
library(MASS)
と入力し実行。(ダウンロードは必要ないと思います。)
この宣言でステップワイズ法が使えるようになります。
デフォルトでstepという関数があるけど個人的にちょっと結果がみにくいと思っている。
計算自体は
stepAIC(coxph(Surv(time, outcome)~factor1+factor2+..., data=解析したいデータセットの名前),direction=" backward")
で行えます。(環境によっては改行が入るかもしれませんが1行です)
coxph() の部分は考えるモデルで強制投入の時に作ったものと同じ。もちろんコックスハザード以外も使えますが、医学論文のための手法としてはこれかロジスティックでしょう。
あと
cox.analysis<-coxph(Surv(time, outcome)~factor1+factor2+..., data=data)
などとしていただいて、
stepAIC(cox.analysis, direction="backward")
としていただいても構いません。
後ろのdirectionの部分はbackward, forward,bothの3種類を指定できます。
減らしていく方法、増やしていく方法、どちらもやっていく方法です。
医学論文では基本的にいわゆるp値でしかみないけど、AICって指標を用いることでどの要因が効いているのかを評価できる方法もあります。
AICってのは日本人の赤池先生が作って世界中で使われている指標です。
登録:
コメント (Atom)