2017-01-01から1年間の記事一覧
最近kaggleをやりはじめました。 その時に、簡単な変化点検知が必要となった。 changepointパッケージを使った簡単な変化点検知のメモ。
以前、Shinyによる授業アンケートを解析するための可視化アプリという記事を書きました。 実際に使って頂いた結果、機能やUIで様々な改良点を挙げて頂きました。 今回はそれらを改良したアプリの報告です。
階層ベイズモデルによる着順予測(1)で階層ベイズモデルをたてました。 今回はそのモデルを実際に動かしてサンプリングされたパラメータをチェックしていきます。
競艇の着順を予測するにはどうすればいいだろう。 三連単の120クラス分類として機械学習(SVMやDL)がぱっと思い浮かびます。 ですが、クラス数が多い上にサンプル数もひどくばらばらで、4着以下のデータは全く無視となるので微妙です。 そこで、今回は階層ベ…
これから、趣味でやっている競艇の解析結果をちょくちょく書きます。 競艇で重視したいのはやっぱり回収率。 どんなパターンで回収率に差がでるのか、いろいろ仮説が立てることができる。 今回は、選手の性別によって回収率に差が出るのか検証する。
前回、最大エントロピー法により正規分布を導出しました。 その際の制約条件を少し変えることで、以下のガンマ分布が出てくるそうです。 今回は、このガンマ分布の導出に挑戦します。
正規分布。一番使われる確率分布ですね。 様々な統計手法や機械学習で、前提としてデータに正規分布を仮定している場合が多いです。 みなさん知っての通り正規分布の確率密度関数は ですね。本などでいきなりでてきますが、この関数がどこからきたのか疑問に…
今回は隠れマルコフモデル(HMM)についてです。 隠れマルコフモデルはRやPythonで実装するのは簡単ですが、理解するのは少々根気が必要です(私は必要でした)。 隠れマルコフモデル自体はシンプルなモデルなので動きは簡単ですが、隠れマルコフモデルで用いら…
授業アンケート、誰もが一度はやったことがあると思います。 ですが、実際の教育現場ではアンケート結果の有効な解析ができていない様です。 今回は、依頼されて制作した授業アンケートの可視化アプリについてです。 アンケート結果は数字でみるだけではあま…
分散には、不偏分散と標本分散がありますよね。 標準偏差には、不偏標準偏差と標本標準偏差がありますよね。 しかし、Rのbaseには不偏分散と不偏標準偏差を求める関数しかないです。 私は標本分散、標本標準偏差の方が知りたいことが多いです。 毎回ぐぐって…
Rのグラフの注釈に、数式表現を入れたいと思ったことはありませんか? 例えば、なんらかの密度関数をプロットして、数式を書きたいときとか。 もちろんそんなことは後からRの外で書けばいいんですが、 やっぱりRの中だけで完結したい!! そんなときに役立つ…
私はRをメインで使い、サブでPythonを使います。 そんな私は、「基本はRで処理して、この処理だけPythonでやりたい!」と思うときがたまにあります。 そういったとき、RからPythonスクリプトを実行すれば解決します。 だけど、コマンドライン引数や返り値の…
Rでcsvファイルの高速な書き込みと読み込みの方法。 よく使われているcsvの書き込みと読み込みの関数にwrite.csvとread.csvがある。 しかし、どちらの関数も実行時間が遅い。 私が良く使っている関数は、data.tableパッケージのfwriteとfreadです。 こっちの…