募集した実績調査の結果報告です。8/19-8/29の期間で募集した範囲では、Berehynia/Xiniについては残念ながらサンプル数不足により統計検定を行えず、結論はありません。一方、Hieraconについては複数の方々の協力により296回分のデータが集まりましたので、このデータ(実際の出具合)と開示されている公式情報を比較することができました。結論から言うと、B・Cローテ両方においてデータと公式情報は特定の品目の出率について一致していないことがわかりました。詳細は以下の折りたたみに。分析に用いたデータ・表などはリンク先にも記します(閲覧のみ可に変更済)。
検定方法・判断基準:
基本的にカイ二乗検定と残差分析を利用します(各検定の詳細は各々調べてください)。今回の調査ではどのローテ・各品目についてもサンプル数(n)x期待確率(p)>10を満たせているため、カイ二乗検定の使用条件・精度は問題ありません。帰無仮説を「データと公式情報は一致する」、対立仮説は「一致しない」に設定し、有意水準5%の片側検定を行います。
残差分析では、統計量として標準化残差を使い、この数値が1.96よりも大きい、もしくは-1.96よりも小さい品目があるか探します。ある品目の統計量が1.96よりも大きければ、その品目は「おかしいくらい出過ぎる」と判断し、逆に統計量が-1.96よりも下であった場合、その品目は逆に「おかしいくらい出なさ過ぎる、レア枠」と判断します。
各品目の期待確率は8/22に更新された公式情報の内容に基づきます(リンク)。
Bローテの分析(表):
まずレリック全体での平均出率から見てみましょう。有効サンプル数282(総試行回数296-欠損14)に基づいて調べると、平均出率は50.71%(=143/282)となりました。これに対して、公式情報ではBローテの出率平均は46.69%(6.67%x7種類)ですので、レリック全体の平均出率の面から見ると両者とも概ね一致していると言えます。
ところがカイ二乗検定にかけると、その内訳には大きな偏りがあることが伺えます。まず表1の様にBローテでのカイ二乗統計量は27.667となります。これに対して、自由度14(全品目数-1)かつ有意水準5%の時、カイ二乗分布の値は23.684に留まります。明らかに統計量の方が分布値よりも大きいため、今回得られた統計量は偶然得られたとは考えにくいほど大きな値であるという結論になり、有意水準5%で帰無仮説を棄却します。事実、エクセルを使うとこのような統計量の値が出る確率は約1.57%だとわかります。このことから、統計学的に偶然このようなデータを得たというよりも、そもそも公式情報の内容に誤りがあると考えられます。
残差分析で調べることで、具体的にどの品目の出率が公式情報と異なっているのかがわかります。例えば、Split Chamberの残差統計量は2.119ですから、公式情報からは考えられないほど出やすいと言えるでしょう。このことから、このModの実際に設定された入手確率は公式情報よりももっと高いと予想されます。他方、StretchとFlowの統計量はそれぞれ-2.031と-2.492となっており、公式情報と比べて非常に入手しづらいことがわかります。統計的に見ても、まずこの二つの出率はもっと低く設定されていると思われます。
Cローテの分析(表):
有効サンプル数293(296-欠損3)に基づく限り、レリック全体の出率は79.52%(=233/293)になります。公式情報曰く、Cローテでのレリック全体の出率は77.44%(=9.68%x8種類)ですから、数値的にも一致していると言ってよいでしょう。
しかし、Bローテ同様、カイ二乗検定にかけることでこちらでも内訳の偏りが見えてきます。表2の様にCローテのカイ二乗統計量は26.097となります。これに対して、自由度13かつ有意水準5%の時のカイ二乗分布値は22.362ですから、明らかに統計量の方が大きいことがわかります。このような統計量の値が出る確率は約1.65%ですので、偶然このような結果になったとは言い難く、有意水準5%で帰無仮説を棄却することになります。こうした統計的な根拠から、Cローテの方でも公式情報の内容に誤りあると言えるでしょう。
残差分析では、Axi H2の残差統計量が3.124となっていますから、公式情報からはあり得ないくらい出やすいことが伺えます。このことから、Axi H2の出率は公式情報よりも高く設定されていたと思われます。同時に、この品目一つの高い出率設定を補うために、他の品目の出率のいくつかが犠牲になっていたと予想されます。事実、統計的に有意ではないものの、Axi G1やO1、Rifle Ammo Mutationの出具合は非常に悪く、-1.96のボーダーラインに近い統計量の値を取っています。
結論:
上記より、今回の調査結果からHieraconのB・Cローテの実際の出具合は公式情報とは完全には一致していないことがわかりました。このことから、公式情報が全面的に正しいとは言い難いのではないでしょうか。
問題点:
当然ですが、今回の分析にもいくつか問題点はあります。例えば、検定の使い方や結果の解釈の仕方に誤りがある可能性は否定できません。
また特定の品目における出率の偏りが事実だとしても、一体何を基準にそのような偏りが作られているのか、その理由は不明です。
加えて、今回の調査結果はあくまで8/19-8/29の10日間の傾向であり、先のVault開門キャンペーン終了後の8月上旬からずっとこの状態だったかも不明です。もしかしたら、8/1-8/18の間は全く別の偏り具合になっていて、8月を通して平均すると公式情報通りになる、みたいな状態だったのかもしれません。
データ自体は上のリンク先に残しておくつもりなので、「自分ならもっとうまく分析できる!」という自信をお持ちの方は使ってみてください。
余談(超重要):
余談にはなりますが、情報提供してくださった参加者の方々に心から感謝を。今回のHieraconの296回分ものデータは自分一人ではどうやっても届かなかったでしょう。皆さんの協力があったからこそ、今回のような精度の高い分析ができました。このウィキコミュニティに参加していて本当に良かったと思いました。ありがとうございました。
Berehynia/Xiniの情報提供をしてくれた方も、結果は残念でしたが、機会があれば今後も参加してくださると大変うれしいです。Berehynia/XiniはHieraconと比較して、どのような偏りの有無・違いを見せてくれるのかを調べるために調査対象に加えた重要なものなので、次回あたりはこちらも調べたいところですね。
毎度長文の板汚しで失礼しました。
検証お疲れ様です。結局この検証結果をどう活かすのでしょうか?DEに差異を指摘するのか、それともデータとしてこのwiki内の情報に留めておくのか。Hieraconが稼ぎ場として変わることは無いと思うし、公式情報への不信感だけ抱かせて終わり、というのは勿体無いと思います。
個人的には皆さんの意見にお任せ!というスタンスなのですが(笑)、少なくとも今DEに差異を指摘しても実りは少ないだろうと思います。Vault行きになったレリックについて補償を求めたとしても、向こうも今更対応するのは難しいでしょうし、「現在の仕様は違う。古い情報について言われても」の一言でバッサリかと。
それよりも今回の検証結果を念頭に置きつつ、今でも似たような現象が確認できるか調べた上で指摘する方が、DE側を動かすにはより効果的でしょう。そういう意味でも「もう一度調べましょう」というのが自分の意見です。検証内容をwiki内に記事として残しておくかは、それこそ皆さんの意見にお任せします。
すごいなぁ、開始~今の報告まで本当にお疲れ様です。「特定の品目における出率の偏り」だけど、参加者が同じ分隊にいた場合が考えられそうだ。次やるとしたら参加者単位じゃなくて分隊単位で管理した方がいいかもねえ(潜入でソロ限とか・・・?)
4人で同じ分隊にいた場合最大で報告されるドロップが4倍になりますからねぇ…野良であっても熱心に調査に協力してらっしゃる方程、他の熱心な方と一緒になってしまうことも多くなりそうですし…難しそうですね
可能性はありますね。一応野良でやってもらうのなら「ワイン好き?」→「Tennoなら大吟醸」→答えた側がその分隊での結果を記録するといった合言葉・ルールでも作ろうか検討したのですが、参加者への負担が大きいのと参加者の数自体も少ないと予想してたので、メリットよりもデメリットの方が大きいと判断してました。分隊単位での管理は難しそうですが、今後参加者が増えていくようなら何か手を考えておくべきですね。