マイロ将棋(33)同一展開の回避(ダーツ法)

同一展開の回避方法がよくないのではないかと思い始めています。これまで取っていた方法は自称73法というものです。候補手の中で最も予測勝率が高い手を7割の確率で選択し、残りの3割を勝率が二番目に高い手とするという方法です。

この方法だと、一局面で取りうる手が2つに絞られてしまいます。このことで戦局に偏りが生じてしまって正しく勝率を算出できないことを疑っています。

 

そこで考えた新しい選択方法が自称ダーツ法です。この方法では全ての候補手を対象にして、予測勝率が高いものほど高い割合で選択します。単純に予測勝率の割合で選択すると、負けに直結するような、ひどい悪手もそれなりの確率で選択されてしまいます。ひどい悪手を極力選択しないようにするため、予測勝率を4乗した値を用いて選択しています。本当は一定以下の予測勝率の手を除外するということもしたいのですが、処理時間がさらに伸びてしまいそうで、今は入れていません。