2012年11月28日水曜日

近況

二週間くらい書いていなかったことになるか。反省。

この2週間は同僚の先生方の学会前ということもあり、かなり、頼まれごとが多く、12月に検討会をする臨床試験のサンプルサイズをいろいろな場合で計算してシミュレーションしてみたりとこの6か月で一番忙しかったです。次から次にデータに出会えるので楽しいのですが、そろそろ質問によっては同じような質問も多くなってきて、それらを少しずつでいいからまとめていくようなこともしないとなとおもっているところであります。

研究の方は論文化を先生にしりをたたかれながらやっています。
12月中旬に今期の報告も作らないとダメだし、2月にその発表会もあるし、なかなか忙しいな・・・。

まあ追われているのは別に嫌いではないんだけど、ちょっと時間が不足気味。

最近誰に会っても太った?って聞かれるし、どうにかしたいなー。

というか肥満も早死のリスクなんだから研究する前に何とかしろよ。って話だよね。

多分肥満遺伝子ってのがあって、僕にはどうしようもないんだ!←

とりあえずそんなこんなで明日は発表です。

あまり統計は関係ないのですが、今所属しているところの関係で発表の機会をいただきました。

1月にも同じ内容でワークショップで発表できるみたいだし、少しこっちのこともやっていかないとな・・・(奇跡的にも日本語の発表なので九死に一生を得ている)

とりあえずいっぱいいっぱいになるまで走り続けましょう。

いろんな人に迷惑を掛けながら、自分のバランスとれる仕事量とかを探させてもらいます。

今のうちに無理をして。

死にかけて。

2012年11月13日火曜日

ブートストラップとかとか。

比較的小サンプルでのcox回帰などを用いた検討では実データでのHRなどに加えてブートストラップなどを使ってconcordance indexなどを検討する事もおおい。

このブートストラップ、まだ医師の先生方には全くといっていいほど浸透していない知識なので、説明がすごく難しい。

フェイズ1で増量デザインがベイズ流ロジスティックを使いますと言われて先生方がああ、そうですか。といってしまうのと一緒である。

このあたりをうまく数式を使わずに説明する方法を考えなくてはならないなーとおもっている。

そんな疑問もありつつ、あまりそれには取り掛かれなかった今日。

少しずつ仕事が増えてきている。

研究も少しずつ進めよう。

止まらないように、少しでも前進。

期日は近い。

2012年11月12日月曜日

日報

大きな仕事が入ってきた。ちょっとデータ的にも1000以上あるので計画を立ててから解析しよう。
研究も少しだけ進めた。毎日少しずつでも勧める。足踏みでもいいから。
疫学について勉強する必要がありそうだ。
入る前とは少し違うイメージ。ただそれも求められるならやりましょう。

以上。

並べ替える時はsortをいきなり使わないように。

データをソートするときは、sortを用いるのではなく、一度orderで順位を確認したあと、それを用いてソートする癖をつけよう。

そうでないと、2変量以上の時データがぐちゃぐちゃになってよくわからなくなる。

分割表で0のセルがあるとRcmdrでは解析できない。

Rコマンダでは背景因子の分析をするときに2*2で0のセルが一つ以上あれば解析できない。

多分内部ではchisq.testを使っているからだと思うが、医学のデータではかなり少数の検討をしなければならないこともあり、0のセルがあってもやるしかないこともある。

その時はコマンドfisherを使ってやるべきなのだが、僕がいつも使っているfisherというものは群馬大学の青木先生という方が作って公開しているもので、このページにかいている。
http://aoki2.si.gunma-u.ac.jp/R/fisher.html

ここの


source("http://aoki2.si.gunma-u.ac.jp/R/src/fisher.R", encoding="euc-jp")

という1分をRの画面に貼り付ければ出来る。(RコマンダではなくRコマンダではなく本体)

そして

x <- matrix(c(50,30,20,40), byrow=TRUE, ncol=2)
fisher(x)

とすれば計算してくれる。

xは行列、ここでは2*2の分割表を指定する。

byrowってのは行を優先してください。

ncol=2というのは列は2までにしてください。ってこと。


数字をc()で囲んでいるのはおまじないとして覚えてください。

あと、もしかするとfisher(x)とするとエラーが出てしまう可能性があります。

大概の場合そのエラーの文章をコピーしてgoogle先生に見てもらうと同じエラーを起こしている人がかならずいます。

確認してみてください。

2012年11月7日水曜日

file.choose()

file.choose()
と打てば、Office系の開くと同じように対話的にファイルを選ぶことが出来るようになる。
ただ、このコマンドのみでファイルを選んでもそのファイルの絶対パスを読みこんでくれるだけなので、本来は、

read.table(file.choose(),header=T)

などとして使うことが多い。もちろんread.csvでも可能。

dat1<-read.table(file.choose(),header=T)

などとして

head(dat1)
summary(dat1)

などを確認していくのがよい。

2012年11月6日火曜日

ちゃんとかこう。

昨日書いてる記事でもなにかいてるかわけわかんないところがあるので、人に読んでもらうことを意識することにする。

自分だけわかればいいならオフラインの日記でもいいはず。

2012年11月5日月曜日

カプランマイヤー

データは何が起こるかわからないので、エクセルで作った場合でも最終的に値で貼り付け。

そして、日本語は取り除く方がよい。

変数に名前をつける癖は作ってるほうが良い。

膨大であればあるほど。

また出来ればいつも同じディレクトリでやるようにした方がいいが、それを意識するのが煩わしいと感じる人もいる。(そもそも自分がどこのディレクトリで作業するかはwindowsでは気にしないことが多い)

そのため、クリップボードからコピーするとき以外は、

read.csv(file.choose(),header=T)

を使うべきである。

そのままカプランマイヤーを書く場合は

library(survival)

で関数を呼び出し、(ないと言われればネットにつなげた状態でinstall.packages(survival)をやる。)

plot(survfit(Surv(time,event)~group,data=data),main=c(""),xlab=...)

という感じで。(Survの引数この順番だったかな・・・)

カプランマイヤーの拡張はまた質問された時にでもまとめます。

Bayesian continuous reassessment method (CRM) designs for Phase I dose escalation trials.

Rに既に実装済み。

bcrmという関数なので。
教科書通り、ネットにつながっている状態で

install.packages("bcrm")
library(bcrm)

で完了。
色々オプションがあるが、わからない人は使わないほうがいいので、これ以上はまとめない。

どうしても使いたければ統計家に。

ポストゲノム

ポストゲノム時代の遺伝統計学を購入していただいた。
読んだ方がいて、おすすめのようだ。
とりあえず統計の部分をさらさらと見てみたが、ソフトがしらないもの過ぎて対応できない・・・。
とりあえず少しずつ読み進めていく。

今週後半から出張もあり、いろいろ目白押しである。

2012年11月1日木曜日

Rコマンダーについて 追記有り さらに追記あり

職場でRコマンダーでの解析の講座のサポートをした。

そこで出てきたよくわからないエラー。昨日1日調べたが、原因不明だった。

・エクセルがそもそも読み込めない。
→エクセルを読みに行くためのパッケージがない?そのパッケージ名がわからず。

・エクセルでカテゴリカル・データを読み込んだが、層別因子として認識されない。
→エクセルの情報をクリップボードに貼り付けてやれば可能であった。そのため、エクセルの読み込み方の問題?
・rJavaというパッケージが入っていない。
→インストールで解決

・Macの場合Rcmdrがインストール出来無い?
→Macもってないのでわかんない。使いふるしでいいから余ってないかな。ただ、できてた人もいた模様。


また実習があるようなので、それまでに解決したい。やっぱ英語で使うべきか-?


追記12・11・01
X11をダウンロードして
ttp://cran.r-project.org/bin/macosx/tools/
から
ttp://cran.r-project.org/bin/macosx/tools/tcltk-8.5.5-x11.dmg
をダウンロード→
Rを起動→上のイラストからX11を起動→
library(Rcmdr)
で行けるみたい。


X11とか学部の時の授業で出てきたなーと思ったくらいだった気がする。

とりあえずこれで一件落着かな?


追記12/11/02
Mountain Lionだとうまくいかないとの報告有り。
MacOSが近くにないので、確認できないが・・・。

かうか?そこまでする必要はないと思うけど、Mac使いの先生多いんですよね・・・。