Splatoon3 - スプラトゥーン3 攻略&検証 Wiki

Xマッチ / 1327

1409 コメント
views
1327
名無しのイカ 2025/08/20 (水) 09:20:02 9225e@83dd7 >> 1326

ブキチャレパワーが統計的に異常な増減をするとは

通報 ...
  • 1328
    名無しのイカ 2025/08/20 (水) 10:11:13 f5761@b9b3e >> 1327

    たとえば、ブキパワーが2600とか2700程度あると勝ってレートが+0.5、負けたらレートが-80みたいなことが普通に起きるんだよね
    勝ち+0.5/負け-80の組合せを仮定すると期待増減ゼロに必要な勝率は99.4% はっきり言って正気の沙汰ではない
    故に上位プレイヤーがそれなりの格下と当たるのはその時点で罰ゲームみたいなもんになってる

    さらに、このような非対称はElo系の標準仮定では約900pt差でのみ整合するが、
    ブキパワーは最上位が2700-2800程度で上位のインフレも小さいため、そのようなマッチングは現実的ではない
    ゆえに上位層ではK値の動的縮小や勝利側キャップ等により、レートが伸びにくくなるよう調整されていると推定される

    これらの点を鑑みるとブキチャレはインフレ抑制や上限制御など運用上の都合が統計的妥当性に優先しており、
    評価指標として破綻していると考えられる

  • 1330
    名無しのイカ 2025/08/20 (水) 11:40:16 修正 a2486@2c470 >> 1327

    武器チャレパワー27なんてその武器の全1レベルだろうし格下と当たって負けたらそれくらい引かれるのは全然正常だと思うよ
    フェスパワーと違って武器ごとにパワーが分かれてることで高いパワーで遊んでるプレイヤーがそもそも少ないはずだから同格同士のマッチングは組めないし27からレートを伸ばせないことは何も異常ではない
    あと統計の話を何もしてないのに統計的という言葉を軽々しく使うのはよくない

  • 1332
    名無しのイカ 2025/08/20 (水) 12:11:31 f5761@b9b3e >> 1327

    第2段落は非常に簡略化されているとはいえ、普通に統計の話(Elo型の確率モデルを前提にした統計的推論)をしているのですが…

    また、ブキパワーがたとえ全1クラスでも数学的に勝ち+0.5/負け-80のような増減が発生するのは不健全である、という点も指摘しているのですが、
    それを"格下と当たって負けたらそれくらい引かれるのは全然正常だと思う"の一言で済ますのは論理的とは言えません。そう思うなら数値的な妥当性を示してください。

    また、"統計の話を何もしてないのに統計的という言葉を軽々しく使うのはよくない"とのことなので、もう少し統計的な話を踏み込んで行います。

  • 1333
    名無しのイカ 2025/08/20 (水) 12:18:15 9225e@83dd7 >> 1327

    Eloは異なる能力のプレイヤー同士の勝敗の評価法なんだからぶつけること自体に問題はないのでは
    あとEloで動いてるだろうってのが-80–-70しかなくないか。なんか仮定を置いてそこから衝撃の事実を導くのあんまり上手い考えじゃない気がする

  • 1334
    名無しのイカ 2025/08/20 (水) 12:25:34 b5183@cdb91 >> 1327

    話を半分も理解できていないのですが、仮に自分のわパワーが27で、他の7人のパワーが17、全体の平均も17としたら、Elo型の確率モデルだといくつくらい変動するのが理想なのですか?
    あと今作のXマッチ以外の非固定レートは前作のXpと同じ仕組みだと思うのですが、前作のXpの時点で異常だったということですか?

  • 1335
    名無しのイカ 2025/08/20 (水) 12:42:38 f5761@b9b3e >> 1327

    >> 1333

    "Eloをぶつける"の意味するところがよくわからず申し訳ないのですが、
    Eloやその系統のモデルを採用することの妥当性についての話だとすると、そこには何も問題は無いと思います。

    また、"Eloと仮定して結論を出すのは弱い"というのはもっともな懸念です。
    ですが、観測されたレート変動(+0.5/-80)から想定される損益分岐勝率が99.4%であるのはレーティングシステムに依らず真である事象です。
    ゆえに、本質の欠陥(非対称更新により p*が非現実的に高く、期待値が負になる)はElo非依存で成立するものであり、実際に使われているシステムがEloであるか否かはあまり問題ではありません。
    もっとも、多くの対人ゲームなどで使われるレート計算はEloやその派生形によるものであるため、本作がそれから大きく異なるものを使用する可能性は低いと思われます。

    >> 1334
    Elo型の変動値に関しては
    その前提だとチームパワーの差が250なので、
    これをElo的に勝率に換算するとE = 1 / (1 + 10^(−diff/400)) * 100 ≈ 80.83%
    これを基に算出すると、一般的に使われるK=32だと 勝ち +6.13、負け −25.87 というレート変動になります。
    スプラ2のXパワーがこんな変動だった気がしますね。
    ちなみに過去の統計からブキチャレはK=80ぐらいと予測すると、勝ち +15 負け-65 辺りになります

    また、"今作のXマッチ以外の非固定レートは前作のXpと同じ仕組みだと思うのですが、前作のXpの時点で異常だったということですか?"
    という点についてですが、結論から申し上げますとブキチャレに関しては少し事情が異なるのではないかと考えています。

    ブキチャレはベスト9という要素に関わる点からブキ9種の計測を行う前提であること、多くのブキを扱うことから各ブキで行う試合数が少ない前提でパワーが算出されていると思われます。
    ゆえに、運営は収束を速めるべく大きめの学習率(実効K)を用い、同時に上位帯の数値インフレを抑えるため(Xパワーインフレの反省から?)に上位パワーのインフレ防止措置を実装しているというのが実情だと思われます。

  • 1344
    名無しのイカ 2025/08/20 (水) 15:30:57 修正 a2486@11d98 >> 1327

    要約すると大きい学習率(推測)とインフレ抑制のためのキャップを入れてる(推測)せいで上位勢の強さの識別をする能力が低いモデルになってるから評価指標として破綻しているという主張だと思うんだけど、それを「統計的に異常」とは言わないでしょ

    そもそも(推測)が間違ってて計算式はフェスと同じだと思うけどな。

  • 1352
    名無しのイカ 2025/08/20 (水) 17:00:03 f5761@b9b3e >> 1327

    >> 1344あなたの批判はとても筋が通っていると思います。
    ただ、期待勝率がモデルの数式的に正しくとも実情とは合致していないことが結局不条理であると言う主張、
    "統計的に異常"と私が表現した部分について解釈の違いがあること、
    計算式がフェス等とは異なっていると考えられる点については補足させていただきます。