マイロ将棋(29)教師データ作成に用いたモデルとの対局結果

改善後の教師データの効果が中々見えず、何とかして確認できないものかと考えていたところ、よさそうな案を思いつきました。これまで効果を確認するのにマイロ将棋1.0というマイロ将棋界では強めの相手と対局させていたのですが、教師データ作成に用いたモデルと対局させればよいかな、と。改善後の教師データ作成に用いたモデルは、確か改善前の教師データを1500万局面分くらい学習させたものです。このモデルを使って勝率を学習したのだから、その学習結果はこのモデルに対して強みを発揮できるはずです。

その結果が以下のようになりました。

教師データ作成に用いたモデルに対する勝率

学習経過の全てで、改善前の勝率を上回ったわけではないですが、概ね改善後の結果の方がよい勝率になっています。上のグラフだと横軸が2の20万局面分学習した結果が改善前より悪くなっていますが、他は同じくらいか少しよい結果です。