2011年8月16日火曜日

ブートストラップ

あるところからデータをとってきて50個くらいのデータ列をつくる。

その50個から当確率で50個重複を許して選んできて平均をとる。

それを1000回行ってその1000個の平均をとる。

もとの分布はきにしなくていい。



わからないこと

初めにとってくるデータの数どのくらい以上?

何回くらい繰り返せばいいの?



これがブートストラップ。

知っている範囲で。

すごく簡単に説明してるけどあってるかな?



記述統計と推測統計の違い

記述統計とは取ってきたデータのみが語るという立場。

標本平均をとってきたり、相関係数を計算したりというのはこちらの枠組み







推測統計はデータは誤差をもっていて、その構造にたいしてモデルを入れて考える。

確率論のツールを使うので、少し難解になりがちであるが、必要なものである。

検定とか推定というのはこちらの枠組み。



簡単だがまとめ。