カップルが一緒にお風呂に入る割合をベイズ推定してみた

Data & Analytics

hoxom
of 39
Description
Text
  • カップルが一緒にお風呂に入る 割合をベイズ推定してみた @hoxo_m 2015/03/03
  • 自己紹介 • hoxo_m • 某 EC サイトでデータ分析をやっています • シリアルパッケージクリエイター – pforeach (R の並列処理を超簡単に書く) – easyRFM (RFM 分析を簡単に実行する) – lambdaR (R にラムダ式を導入する)
  • • Q&A サイト
  • http://q.hatena.ne.jp/1343266362
  • 本日のお題 「一体世の中の何割くらいのカップルが 一緒にお風呂に入っているのだろう?」 ⇒ ベイズで解決!
  • ベイズ推定 • 得られた回答から 「一緒にお風呂に入るカップルの割合」 を推定する
  • 回答 • 一つの回答を独立なベルヌーイ試行とみなす • 入る=1、入らない=0
  • ベルヌーイ試行 • 「A か B のどちらかしか起こらない」 • 「yes か no のどちらかしかない」 • 「表と裏のどちらかしか起こらない」 といった事象のことを小難しく言っただけ 怖がらなくていいよ!
  • ベルヌーイ分布 • ベルヌーイ試行が従う確率分布 • x=1(一緒にお風呂に入る) • x=0(一緒に入らない) • よく見ると… x=1 ⇒ f(x) = p x=0 ⇒ f(x) = 1-p xx ppxf  1)1()( こわくない!
  • ベイズの定理 • 事後分布は尤度と事前分布をかけたもの に比例する )()|()|(  PXPXP  事後分布 尤度 事前分布
  • 尤度関数 • 確率関数を「パラメータを変数」として 見たもの • 確率関数(p は定数) • 尤度関数(x は定数) xx ppxf  1)1()( xx pppL  1)1()( 同じ!
  • 事前分布 一緒にお風呂に入るカップルの割合は半々と仮定 ベータ分布 Be(2,2) を事前分布として設定
  • ベータ分布 • なぜ事前分布をベータ分布とするのか? ⇒ ベルヌーイ分布の尤度関数とかけると、 再びベータ分布になるという良い性質 ※自然な共役分布という 11 )1(),(    ppKBe 111 )1('),()(    xx ppKBepL
  • ベイズ更新 • 新しい回答が得られたら、現在の事後分布 を事前分布として、確率分布を更新する
  • では、いってみましょう!
  • 回答1 • 「入らない」に一票
  • 「入らない」に一票 事前分布 事後分布
  • 回答2 • 「入る」に一票
  • 「入る」に一票
  • 回答3 • 「入る」に一票
  • 「入る」に一票
  • 回答4 • 「入る」に一票
  • 「入る」に一票
  • 回答5 • 「入る」に一票
  • 「入る」に一票
  • 回答6 • 「入る」に一票
  • 「入る」に一票
  • 回答7 • 「入らない」に一票
  • 「入らない」に一票
  • 回答8 • 「入る」に一票
  • 「入る」に一票
  • 回答9 • 「入る」に一票
  • 「入る」に一票
  • 回答10 • 「入らない」に一票
  • 「入らない」に一票
  • 結果 事前分布 事後分布
  • 結果 推定値 推定範囲
  • 結果 • 推定値: 66.7 % • 推定範囲(90%信用区間) : 42.7% ~ 83.4 % • カップルの 4割~8割 が一緒にお風呂に 入っている
  • Enjoy! http://ja.wikipedia.org/wiki/入浴
Comments
Top