なるほど、1枚だけというか1枚ずつ使うってことですね
ただ私の定式化でそのやり方だと期待値そこまで下がらないんですよね、、
元々やり方を書いてくれた方はどういう定式化をしたのでしょう?
ちなみに私は
K:初期石盤所有数
r:残り強化回数=成功確率
k:ある時点の石盤所有数(k<=K)
として状態(r,k)の期待値に関する漸化式を作ってDP(動的計画法)で解いてます。またそれとは別にシミュレーションも作って1万回実行とかもやってるんですが上記方法(石板60枚持った状態で1枚ずつ)だと期待値が350くらいにしかならないです、、
というかそもそも初期状態で石盤何枚持ってるかで戦略(最適化手順)が変わってきますよね? →その結果期待値も変わってくる
通報 ...