Rで標本分散と標本標準偏差を求める関数
分散には、不偏分散と標本分散がありますよね。
標準偏差には、不偏標準偏差と標本標準偏差がありますよね。
しかし、Rのbaseには不偏分散と不偏標準偏差を求める関数しかないです。
私は標本分散、標本標準偏差の方が知りたいことが多いです。
毎回ぐぐってコードコピペが面倒なので自分のブログにメモしておきます。
不偏分散と標本分散、不偏標準偏差と標本標準偏差の違い
:標本、:標本サイズ、:標本平均とします。
このとき、不偏分散と標本分散の定義は、
不偏分散 :
標本分散 :
となります。
式的な違いは、で割るか、で割るかだけです。
この違いの意味などは他のブログや本を参考にしてください。
そして、不偏分散と標本分散の関係は、
となります。
また、不偏標準偏差と標本標準偏差の定義は、
不偏標準偏差 :
標本標準偏差 :
となります。
それぞれの分散の平方根をとるだけです。
標本分散と標本標準偏差を求める関数のRコード
標本分散と標本標準偏差を求める関数を作成します。
以下Rコード。
s2 <- function(x){ var(x)*(length(x)-1)/length(x) } s1 <- function(x){ sqrt(s2(x)) }
以上です。
s2が標本分散を求める関数、s1が標本標準偏差を求める関数です。
var(x)はbaseパッケージの不偏分散を求める関数となっています。