マイロ将棋(40)教師データ 王手局面のみ更新 200万局面分

王手局面のみ更新したデータを200万局面分作成し、勝率を確認しました。前回50万局面分確認した結果を載せていたのですが、マイロ将棋1.0との対局条件が他と異なっていたので、今回新たに確認し直しています。結果は以下のようになりました。学習経過のほぼ全てで改善前の教師データを上回る結果になっています。王手局面を除外した教師データ(オレンジ)と王手局面のみ更新した教師データ(青)は似た勝率になりました。30万局面から150局面に掛けては、王手局面のみ更新した教師データの方が高い勝率になっています。これまで改善後の教師データでよい結果になったことがあまりなかったので嬉しい結果です。マイロ将棋1.0に勝ち越す結果が出たのも多分今回が初めてです。

 

 

マイロ将棋0.2との対局結果も確認しました。こちらは改善前データの勝率が一番高いです。対局相手によっても勝率の傾向は変わるようです。マイロ将棋0.2は改善前データを1500万局面分学習したものなので、改善前データでの勝率は1500万局面まで学習を続けていくと勝率5割に収束していくのかなと思います。もしデータの改善がうまくいっているのならば、王手局面のみ更新のデータで学習を続ければ、どこかで勝率5割を超えるのかなとも思います。引き続き教師データの更新を続け、300万局面まで進めるとどうなるかを見てみようと思います。