区間推定 - 母相関係数・母集団比率
前回の続き。
母相関係数の区間推定
標本から求めた相関係数から母相関係数を推定する。
双曲線関数
を 双曲線関数と呼ぶ。
になっていることがわかる。
逆双曲線関数
の逆関数は
となる。ここでは のみ。
フィッシャーのZ変換 (Fisher's z transformation)
標本から求めた相関係数を とすると
として、母相関係数
とすると、nが大きいときに、zは近似的に に従う。
標準化して
信頼区間は、
変換を戻すには を用いる。
母集団比率の推定
母集団の中に該当する比率 であるを推定する。このとき全体をnとしたときの該当数
は二項分布に従う。
二項分布の期待値と分散は、
となる。 の推定値として、標本平均の
を用いると
となる。nが大きいときは、中心極限定理によって近似的に
標準正規分布に従う。
nが大きいときは、 が
に一致するから、信頼区間は近似的に、
区間推定の例
Rでの例を見てみる。適当なデータなので表示のイメージだけ。
まずは母相関係数の区間から。
> cor.test(x,y) Pearson's product-moment correlation data: x and y t = 1.0874, df = 48, p-value = 0.2823 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.1288514 0.4154734 sample estimates: cor 0.1550575
信頼区間の中に0が含まれるので相関無い可能性がある(実際無い)。
続いて比率の信頼区間
> prop.test(x,n) 1-sample proportions test with continuity correction data: x out of n, null probability 0.5 X-squared = 9.025, df = 1, p-value = 0.002663 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.1324509 0.4152042 sample estimates: p 0.25
同様に95%の信頼区間がわかる。