[ポケポケ]俺のカスミは裏しか出ない!を統計学的に示してみた

2024-12-19

はじめに

初めまして、めろです。皆さんポケポケやっていますか?

つい2日前に新パックも登場して今1番熱いゲームと言っても過言ではないはずです。

僕も楽しく遊ばせていただいているのですが、1つだけ気にいらないことがあります。

それは「自分が使うカスミが裏ばかり出すこと」です。

という訳で、この記事ではいかに自分のカスミが弱いかを統計学的に示したいと思います。

背景と目的

僕はよくカスミを使うのですが、裏、裏、裏!裏ばかり出るんです。

体感80%くらい裏が出るのですが

「俺のカスミは裏しか出ない!きっと運営に確率操作されているんだ!」

と X(旧Twitter)でポストしても信じてもらえないはずです。

という訳でこの記事では統計学的に示す方法を学び、以下のようにポストできるようになりましょう。

そしたらきっと誰もが認めてくれるはずです。

「俺のカスミは裏しか出ない!統計学的に有意だったから間違いない!」

カスミについて

ここでポケポケをやっていない人のためにカスミについて説明したいと思います。

カスミの効果

自分の水ポケモンを1匹選ぶ。ウラが出るまでコインを投げ、オモテの数ぶんの水エネルギーを自分のエネルギーゾーンから出し、そのポケモンにつける。

今回の記事では、裏が出るまでコインを投げ続けるということだけ覚えてもらえれば大丈夫です。

どうやって示すか

統計学に自信がないのでどうやって示せばいいかChatGPTに聞いてみました。

すると以下の回答が返ってきました。

これでこの記事がもし間違っていたときの罪のなすりつけ先が決まりました。

1. 仮説の設定

  • 帰無仮説 (H₀): 検証対象となる仮説(例:データに差がない、効果がない)。
  • 対立仮説 (H₁): 帰無仮説に対立する仮説(例:データに差がある、効果がある)。

2. 検定方法の選択

データの性質や仮説に応じて適切な検定方法を選びます。

例: t検定、カイ二乗検定、ANOVA、z検定など。


3. 検定統計量を計算

データから統計量(例: 平均、分散)を計算し、理論分布と比較します。


4. p値の算出

  • p値: 仮説が正しいと仮定した場合に、観測されたデータが得られる確率。
  • p値が有意水準(例: 0.05)より小さい場合、帰無仮説を棄却します。

5. 結論を出す

  • 帰無仮説を棄却 → 対立仮説を支持(データに有意差がある)。
  • 帰無仮説を棄却しない → データに有意差はない

果たして自分が使うカスミは弱いのか?

それではChatGPTが説明してくれた通りに考えていきましょう

1. 仮説の設定

今回示したいことは「カスミのコインで裏が出る確率が高いこと」です。

なので、対立仮説は「コインの裏が出る確率が高い」

帰無仮説は「コインの表裏がでる確率に偏りがない」となります。

という訳で今からは、表裏が出る確率に偏りのないコインだと仮定して考えていきます。


2. 検定方法の選択

コイントスで表が出る数というのは二項分布に従います。

この二項分布は正規分布に近似できることから

正規分布を用いる検定方法であるz検定を使います。


3. 検定統計量を計算

検定統計量を計算するためにはデータが必要です。

という訳でポケポケでカスミを使って大量にコインを投げましょう。

結果は以下の通りになりました。

(大変だったので途中から頭の中でカスミを使ってデータを増やしました)

カスミで表が出た数01234
起きた回数198211

ここでコインを投げた数と表が出た数を数えてみましょう。

例えば2回表が出たということは2回連続で表が出て、3回目で裏が出たということなので、

3回投げて2回表が出たということです。

このようにして、コインを投げた数と表が出た数を数えると

コインを投げた数が50回、表が出た数が19回となります。

コインをn回投げたときの表が出る数というのは二項分布Bin(n, 1 / 2)に従うことが知られています。

また、実はBin(n, p)の二項分布はnが大きいときN(np, np(1-p))に近似することができます。

という訳でコインを50回投げたときの表の数は二項分布 Bin(50, 1/2)に従い、これは N(25, 12.5)の正規分布として近似できるみたいです。

気づいたら正規分布になっていたので、z検定に必要なz値を求めることができますね。

z=Xnpnp(1p)=192512.5=1.697...z = \frac{X - np}{\sqrt{np(1-p)}} = \frac{19 - 25}{\sqrt{12.5}}=-1.697...

4. p値の算出

p値のpとはprobability(確率)の頭文字です。

つまり起こる確率はこれくらいですよというのがp値という訳です。

今回はコインの裏が出る確率が高いことを示したいので、

コインを50回投げたときに19回以下しか表が出ない確率を求めましょう。

P (X ≤ 19) = P(Z ≤ -1.697) = 0.0448より確率は0.0448と求まりました。

P(Z ≤ -1.697)は下のサイトで1.697と入力したときの下側累積確率です。

https://keisan.casio.jp/exec/system/1174204351


5. 結論を出す

今回の目標は、裏が出る確率が大きいことを示すこと。なので片側検定をします。

そのため、先ほど求めた0.0448が有意水準0.05より小さいかを判断すればよく

0.0448は0.05より小さいため有意差があると示すことができます。

よって「コインの表裏がでる確率に偏りがない」という帰無仮説は棄却され、

「自分が使うカスミのコインで裏が出る確率が高いこと」を統計的に示すことができました。

まとめ

という訳で僕のカスミは裏が出やすいように確率操作されていることが分かったところで、この記事を終わりにしたいと思います。

皆さんもカスミが裏しか出さないと感じた場合にはぜひ統計的に有意差があるかを検証してみてください。

ここまで読んでくださり、本当にありがとうございました。

最後に統計的な有意差が出た原因について気になる読者のために補足です。

今回統計的に有意差が出た原因は、48回自分の頭の中でコイントスをしたことです。

50回中48回も自分の頭の中でコイントスをすれば当然のように結果もねじ曲がります。

おすすめ記事

jackFes2023
2023-12-24

jackFes2023

    アドベントカレンダー2023