マイロ将棋(13)CNN(持ち駒分離) 対 マイロ将棋1.0

全結合とCNN(持ち駒分離)モデルとマイロ将棋1.0を対局させ、強さを比較しました。全結合よりは少し上回っていますが、マイロ将棋1.0に対してはまだまだです。

 

CNN(持ち駒分離) 対 マイロ将棋1.0

 

対局の様子を眺めていると、持ち駒分離モデルが無駄に王手を繰り返し、持ち駒を減らしている場面をよく見ます。こうなってしまうのは教師データの質が悪いためではないかと考えています。この教師データはマイロ将棋0.1同士で対局した結果です。マイロ将棋0.1はほぼでたらめに指すので、相手から王手をされても対処しません。その結果、王手をするとそれなりの確率で勝ってしまいます。この結果から、王手をすれば勝ちやすいということを学んでしまっている気がします。教師データを改善して、そうではないことを学習させたいです。それができればマイロ将棋1.0に対しての勝率ももっと上がるかもしれません。