広告
広告

ドロップ率の検定

カテゴリ:その他

サンプル数が 100 以上の場合は大標本なので z 検定を使って検定を行う. それ未満の場合は t 検定を使う(この記事では解説しない).

対応の有無について

対応がないデータとは2つの異なる標本(サンプルグループ)から取得したデータのことだ. 例えば狩場 A と狩場 B とから集めたデータや, バフの有無でドロップ率を比較したりしたデータは対応がない.

対応があるデータとは同一標本から導かれた2つの対応しているデータのことだ. 例えばアップデートの前後で狩場 A のドロップ率を比較するために集めたデータは対応がある.

対応のないデータかつ大標本(n >= 100)の場合

A のケースでは 200 回戦闘して宝箱が 10 個ドロップした(標本標準偏差 0.22). B のケースでは 400 回戦闘して宝箱が 42 個ドロップした(標本標準偏差 0.31). このとき A より B の方が宝箱のドロップ率が多いと言えるか<有意水準1%>.

検定統計量 T は以下のようになる.なお大標本なので標準偏差の代わりに標本標準偏差が使える.

対応のない検定統計量の計算式
対応のない大標本の z 検定
x1 :B の標本平均(この場合は 0.105 = 42/400)
x2 :A の標本平均(この場合は 0.05 = 10/200)
σ1:B の標準偏差(この場合は 0.31)
σ2:A の標準偏差(この場合は 0.22)
n1:B の試行回数(この場合は 400)
n2:A の試行回数(この場合は 200)

標本標準偏差の計算式は以下のようになる.

標本標準偏差
標本標準偏差の計算式
x :標本平均
xi:個々のサンプル
n:試行回数

大きいことを検定したいので右片側検定を行う. 有意水準1%なので検定統計量 T が 2.33 より大きい時,差があるといえる.

この例では検定統計量 T = 2.50.T > 2.33 なので差があるといえる.

p 値

検定統計量 T がわかれば下のリンク先の表から p 値を計算できる. T = 2.50 に対応する p 値は 0.0062 だ.

標準正規分布表――国立研究開発法人産業技術総合研究所

95%信頼区間

95%信頼区間は以下の式で計算できる.

95%信頼区間
95%信頼区間の計算式

B のケースの 95%信頼区間は 0.075~0.135. つまり B のケースで同じような実験をした場合,95%の確率でドロップ率は 7.5%~13.5%になる.

99%信頼区間を計算するときは 1.96 の代わりに 2.57 を使う.

標本標準偏差の計算

標本標準偏差の計算にはスプレッドシートアプリ(Excel, Libreoffice calc, Google スプレッドシートなど)を使うのが便利だ. 例に挙げたアプリはすべて STDEV 関数が用意されており,これで標本標準偏差を計算できる.

例えば以下のデータで標本標準偏差の計算するには,C2(データでない場所ならどこでもいい)に =STDEV(B2:B35) と入力する.

stdev
スプレッドシートで標本標準偏差を計算する

対応のあるデータかつ大標本(n >= 100)の場合

200 回戦闘して,A のケースでは宝箱が 10 個ドロップし,B のケースでは宝箱が 15 個ドロップした(標本標準偏差 0.26). このとき A より B の方が宝箱のドロップ率が多いと言えるか<有意水準5%>.

検定統計量 T は以下のようになる.

Z 検定
対応のある大標本の z 検定
x :標本平均(この場合は 0.075 = 15/200)
μ0:母平均(この場合は 0.05 = 10/200)
σ:標準偏差(大標本なので標本標準偏差が使える)
n:試行回数(この場合は 200)

大きいことを検定したいので右片側検定を行う. 有意水準5%なので検定統計量 T が 1.64 より大きい時,差があるといえる.

この例では検定統計量 T = 1.34.T < 1.64 なので差があるとはいえない.

正規分布表(逆分布関数)

有意水準を変更したときの z 値は以下の表から取得する. たとえば有意水準を甘く取り 10% にするときは, α = 0.90 の場所の .000 つまり 1.282 を使う.

正規分布表

新訂 確率統計,高遠節夫・斎藤斉ほか4名著,大日本図書,p.161 の第4表より転載

関連記事

ガチャの確率計算

第21回 確率はホントに収束するのか(補足)


広告
広告