RigelのR言語メモであーる(R言語だけとは言っていない)

RigelのR言語メモであーる(主にpython)

興味あることや趣味、やったことについて書くよ

最大エントロピー法による正規分布の導出

正規分布。一番使われる確率分布ですね。
様々な統計手法や機械学習で、前提としてデータに正規分布を仮定している場合が多いです。
みなさん知っての通り正規分布確率密度関数
{ \displaystyle f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) }
ですね。本などでいきなりでてきますが、この関数がどこからきたのか疑問に思う人は少なくないと思います。
その導出方法はいくつかありますが、今回は最大エントロピー法により正規分布を導出します。

続きを読む

隠れマルコフモデル(HMM)とBaum-WelchアルゴリズムとViterbiアルゴリズムのよく分からない解説

今回は隠れマルコフモデル(HMM)についてです。
隠れマルコフモデルはRやPythonで実装するのは簡単ですが、理解するのは少々根気が必要です(私は必要でした)。
隠れマルコフモデル自体はシンプルなモデルなので動きは簡単ですが、隠れマルコフモデルで用いられるBaum-WelchアルゴリズムとViterbiアルゴリズムが難しい。
私は説明や解説が下手で、分からないと思いますが簡単に解説します。
そして、個人的メモですがせっかくまとめたのでスライドを共有します。

続きを読む

Shinyによる授業アンケートを解析するための可視化アプリ

授業アンケート、誰もが一度はやったことがあると思います。
ですが、実際の教育現場ではアンケート結果の有効な解析ができていない様です。
今回は、依頼されて制作した授業アンケートの可視化アプリについてです。
アンケート結果は数字でみるだけではあまり良くわかりませんが、可視化することでいろいろな考察ができるようになり、解析へとつながります。

続きを読む

Rで標本分散と標本標準偏差を求める関数

分散には、不偏分散と標本分散がありますよね。
標準偏差には、不偏標準偏差と標本標準偏差がありますよね。
しかし、Rのbaseには不偏分散と不偏標準偏差を求める関数しかないです。
私は標本分散、標本標準偏差の方が知りたいことが多いです。
毎回ぐぐってコードコピペが面倒なので自分のブログにメモしておきます。

続きを読む

Rのグラフの注釈で、TEXのような数式表現を使う

Rのグラフの注釈に、数式表現を入れたいと思ったことはありませんか?
例えば、なんらかの密度関数をプロットして、数式を書きたいときとか。
もちろんそんなことは後からRの外で書けばいいんですが、
やっぱりRの中だけで完結したい!!
そんなときに役立つメモ。

続きを読む

RからPythonスクリプトを実行する

私はRをメインで使い、サブでPythonを使います。
そんな私は、「基本はRで処理して、この処理だけPythonでやりたい!」と思うときがたまにあります。
そういったとき、RからPythonスクリプトを実行すれば解決します。
だけど、コマンドライン引数や返り値の書き方が覚えられない。
毎回調べるのも面倒なので本記事にメモしておきます。

続きを読む

Rでcsvの書き込みと読み込みの高速化

Rでcsvファイルの高速な書き込みと読み込みの方法。
よく使われているcsvの書き込みと読み込みの関数にwrite.csvとread.csvがある。
しかし、どちらの関数も実行時間が遅い。
私が良く使っている関数は、data.tableパッケージのfwriteとfreadです。
こっちの方が非常に高速。
では実際、実行時間にどれだけ差があるのだろう。
本記事では、それぞれの実行時間を比較する。  

続きを読む