RigelのR言語メモであーる(R言語だけとは言っていない)

RigelのR言語メモであーる(R言語だけとは言っていない)

興味あることや趣味、やったことについて書くよ

ブックメーカーのオッズに関する考察

修論無事終えて最近ブックメーカーにはまってます。
知らない方はググってください。
ブックメーカーのオッズに関して考えてみたことのメモです。

続きを読む

Bradley-Terryモデルとその応用まとめ

スポーツの勝敗データを想定する。いろんなチーム(あるいは個人)のうち2チームが戦って勝敗を記録したデータ。
このデータから各チームの潜在的な「強さ」を推定してどのくらいの確率でどっちが勝つのかを推定するというお話。

続きを読む

Rで簡単な変化点検知(changepointパッケージ)

最近kaggleをやりはじめました。
その時に、簡単な変化点検知が必要となった。
changepointパッケージを使った簡単な変化点検知のメモ。

続きを読む

Shinyによる授業アンケートを解析するための可視化アプリ・改

以前、Shinyによる授業アンケートを解析するための可視化アプリという記事を書きました。
実際に使って頂いた結果、機能やUIで様々な改良点を挙げて頂きました。
今回はそれらを改良したアプリの報告です。

続きを読む

{競艇解析} 階層ベイズモデルによる着順予測(2)

階層ベイズモデルによる着順予測(1)で階層ベイズモデルをたてました。
今回はそのモデルを実際に動かしてサンプリングされたパラメータをチェックしていきます。

続きを読む

{競艇解析} 階層ベイズモデルによる着順予測(1)

競艇の着順を予測するにはどうすればいいだろう。
三連単の120クラス分類として機械学習(SVMやDL)がぱっと思い浮かびます。
ですが、クラス数が多い上にサンプル数もひどくばらばらで、4着以下のデータは全く無視となるので微妙です。
そこで、今回は階層ベイズモデルを使って予測までやってみようと思います。

続きを読む

{競艇解析} 選手の性別による回収率の差

これから、趣味でやっている競艇の解析結果をちょくちょく書きます。
競艇で重視したいのはやっぱり回収率。
どんなパターンで回収率に差がでるのか、いろいろ仮説が立てることができる。
今回は、選手の性別によって回収率に差が出るのか検証する。

続きを読む

最大エントロピー法によるガンマ分布の導出

前回、最大エントロピー法により正規分布を導出しました。
その際の制約条件を少し変えることで、以下のガンマ分布が出てくるそうです。
{ \displaystyle f(x)=\frac{x^{k-1}e^{-x/\theta}}{\Gamma(k)\theta^k} \ \ {\rm for}\ x>0}
今回は、このガンマ分布の導出に挑戦します。

続きを読む

最大エントロピー法による正規分布の導出

正規分布。一番使われる確率分布ですね。
様々な統計手法や機械学習で、前提としてデータに正規分布を仮定している場合が多いです。
みなさん知っての通り正規分布確率密度関数
{ \displaystyle f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) }
ですね。本などでいきなりでてきますが、この関数がどこからきたのか疑問に思う人は少なくないと思います。
その導出方法はいくつかありますが、今回は最大エントロピー法により正規分布を導出します。

続きを読む

隠れマルコフモデル(HMM)とBaum-WelchアルゴリズムとViterbiアルゴリズムのよく分からない解説

今回は隠れマルコフモデル(HMM)についてです。
隠れマルコフモデルはRやPythonで実装するのは簡単ですが、理解するのは少々根気が必要です(私は必要でした)。
隠れマルコフモデル自体はシンプルなモデルなので動きは簡単ですが、隠れマルコフモデルで用いられるBaum-WelchアルゴリズムとViterbiアルゴリズムが難しい。
私は説明や解説が下手で、分からないと思いますが簡単に解説します。
そして、個人的メモですがせっかくまとめたのでスライドを共有します。

続きを読む