マイロ将棋(28)教師データの改善結果を確認中

改善後の教師データを作り続け、ようやく100万局面分の教師データができました。前回50万局面分のデータで確認したときは、若干ですが改善前よりも勝率が悪いという理解しがたい結果でした。もっと教師データを作れば、勝率が上がるかもしれないという期待もあったのですが、100万局面分の教師データで確認した結果でも、あまり変わっていません。強いて言えば、80万以降の学習結果では改善後の勝率が改善前を上回っていますが、単なる誤差のような気もします。参考値として以前作成した、王手局面を除外した教師データでも勝率を確認しました。以下グラフのオレンジ色の点線ですが、こちらは60万教師データ以降、改善前データ、改善後データと比べて大きく勝率を上げています。このことから、王手局面での勝率データは50万局面以降の学習で大きな意味を持つように思います。

 

対マイロ将棋1.0勝率

ここから先どう進めるかが難しくなってきました。以下のような選択肢があるかなあと思っています。

  • 100万局面以降の改善後教師データを作り続ける
  • 改善後の割合をさらに増やした教師データを作成する
  • 王手局面のみ改善後のデータとして差し替えた教師データを作成する。
  • 現在の改善後データの内容、学習結果に問題がないか確認する。

もう少し考えてこの内のどれかをやろうと思います。