広告
広告

ドロップ率の検定

カテゴリ:その他

大標本(np > 5)の場合

ドロップ率5%の場所で,200 回戦闘して宝箱が 19 個ドロップした(標準偏差 0.021). このとき宝箱のドロップ率は5%より多いと言えるか<有意水準1%>.

検定統計量 T は以下のようになる.

z test
大標本の z 検定
x :B の標本比率(この場合は 0.095 = 19/200)
μ :A の標本比率(この場合は 0.05)
σ1:B の標準偏差(この場合は 0.021)

大標本(np > 5)なので二項分布を正規分布で近似できる. この時の標準偏差は以下のようになる.

二項分布を正規分布で近似したときの標準偏差の計算式
p:ドロップ率(この場合は 0.095)
n:試行回数(この場合は 200)

大きいことを検定したいので右片側検定を行う. 有意水準1%なので検定統計量 T が 2.33 より大きい時,差があるといえる.

この例では検定統計量 T = 2.17.T < 2.33 なので差があるとはいえない.

有意水準5%で検定する場合は 1.65 と比較する. その場合はこの例では差があることになる. そのほかの有意水準の場合は 正規分布表(パーセント点) を参照.

p 値

検定統計量 T がわかれば下のリンク先の表から p 値を計算できる. T = 2.17 に対応する p 値は 0.015 だ.

標準正規分布表――国立研究開発法人産業技術総合研究所

95%信頼区間

正規分布で近似した二項分布の 95%信頼区間は以下の式で計算できる.

95%信頼区間
95%信頼区間の計算式

B のケースの 95%信頼区間は 0.0544~0.1356. つまり B のケースでは 95%の確率でドロップ率は 5.44%~13.56%になる.

99%信頼区間を計算するときは 1.96 の代わりに 2.58 を使う.

小標本の場合

ドロップ率5%の場所で,31 回戦闘して宝箱が7個ドロップした(標準偏差 0.075). このとき宝箱のドロップ率は5%より多いと言えるか<有意水準1%>.

検定統計量 T は大標本の時と同じ. ただし参照する値はt分布表になる. 自由度 degrees of freedom はサンプル数-1であることに注意.

大きいことを検定したいので右片側検定を行う. 自由度 30(31-1)・片側有意水準1%なので検定統計量 T が 2.46 より大きい時,差があるといえる.

この例では検定統計量 T = 2.34.T < 2.46 なので差があるとはいえない.

サンプルサイズの計算

欲しい信頼区間を決めれば必要なサンプルサイズを計算できる. 例えば95%信頼区間で欲しい区間を1%(つまり ±0.5%)に設定するならば以下の式を解けばいい.

interval

サンプルを集める前に p が不明の場合はここで p = 0.5 を使う.なぜならその値で p(1-p) が最大値になるからだ. 前もっておおまかに p がわかっているなら,0.5 でなくその値を 0.5 に近づくように切り上げ/切り下げた値を使う. p = 0.5 を使った場合,上記の式は以下の式になる.

interval2

これを n について解くと以下の式になる.

last

この場合 n は 38416 になる.

以下のようにして書くと計算しやすい.99%信頼区間を計算するときは 1.96 の代わりに 2.58 を使う.

general

関連記事

ガチャの確率計算

第21回 確率はホントに収束するのか(補足)

G*Power 3.1.9.2 を使ってサンプルサイズを計算する(t 検定・対応のないデータ)


広告
広告