広告
広告

ドロップ率の検定

カテゴリ:確率統計

大標本(np > 5)の場合

ドロップ率5%の場所で、200 回戦闘して宝箱が 19 個ドロップした(標準偏差 0.021)。 このとき宝箱のドロップ率は5%より多いと言えるか<有意水準1%>。

検定統計量 T は以下のようになる。

z test
大標本の z 検定
x :B の標本比率(この場合は 0.095 = 19/200)
μ :A の標本比率(この場合は 0.05)
σ1:B の標準偏差(この場合は 0.021)

大標本(np > 5)なので二項分布を正規分布で近似できる。 この時の標準偏差は以下のようになる。

二項分布を正規分布で近似したときの標準偏差の計算式
p:ドロップ率(この場合は 0.095)
n:試行回数(この場合は 200)

大きいことを検定したいので右片側検定を行う。 有意水準1%なので検定統計量 T が 2.33 より大きい時、差があるといえる。

この例では検定統計量 T = 2.17。T < 2.33 なので差があるとはいえない。

有意水準5%で検定する場合は 1.65 と比較する。その場合はこの例では差があることになる。そのほかの有意水準の場合は正規分布表(パーセント点)を参照。

p 値

検定統計量 T がわかれば下のリンク先の表から p 値を計算できる。T = 2.17 に対応する p 値は 0.015 だ。『ドロップ率が5%と仮定した場合、200 回中 19 個ドロップする確率は 1.5 %』が、この例の p 値の解釈になる。

標準正規分布表――国立研究開発法人産業技術総合研究所

95%信頼区間

正規分布で近似した二項分布の 95%信頼区間は以下の式で計算できる。

95%信頼区間
95%信頼区間の計算式

この例の 95%信頼区間は 0.0544~0.1356。

99%信頼区間を計算するときは 1.96 の代わりに 2.58 を使う。

信頼区間の解釈についての注意

信頼区間は真のドロップ率を与えるものではない。さらに 95 %信頼区間は 95 %の確率で真の値がその区間にあるわけではない。95 %信頼区間は「同じ実験を繰り返し実行し複数個の信頼区間を得たとき、95 %の確率でそれらの信頼区間の中に真の値が含まれる」という意味だ。詳細は「信頼区間」が意味するものを参照。

『この試験を 100 回繰り返したとき、そのうちの 95 個のドロップ率は 5.44 %~ 13.56%の間におさまる』が、この例の 95 %信頼区間の解釈になる。

真のドロップ率を検証する方法はない。

小標本の場合

ドロップ率5%の場所で、31 回戦闘して宝箱が7個ドロップした(標準偏差 0.075)。 このとき宝箱のドロップ率は5%より多いと言えるか<有意水準1%>。

検定統計量 T は大標本の時と同じ。 ただし参照する値はt分布表になる。 自由度 degrees of freedom はサンプル数-1であることに注意。

大きいことを検定したいので右片側検定を行う。 自由度 30(31-1)・片側有意水準1%なので検定統計量 T が 2.46 より大きい時、差があるといえる。

この例では検定統計量 T = 2.34。T < 2.46 なので差があるとはいえない。

サンプルサイズの計算

欲しい信頼区間を決めれば必要なサンプルサイズを計算できる。 例えば95%信頼区間で欲しい区間を1%(つまり ±0.5%)に設定するならば以下の式を解けばいい。

interval

p が不明の場合はここで p = 0.5 を使う。なぜならその値で p(1-p) が最大値になるからだ。前もっておおまかに p がわかっているなら、0.5 でなくその値を 0.5 に近づくように切り上げ/切り下げた値を使う。p = 0.5 を使った場合、上記の式は以下の式になる。

interval2

これを n について解くと以下の式になる。

last

この場合 n は 38,416 になる。

以下のようにして書くと計算しやすい。99%信頼区間を計算するときは 1.96 の代わりに 2.58 を使う。

general

関連記事

ガチャの確率計算

ドロップの偏りの検定

第21回 確率はホントに収束するのか(補足)

G*Power 3.1.9.2 を使ってサンプルサイズを計算する(t 検定・対応のないデータ)


広告