前回、最善手のみ指す方法で、マイロ将棋1.0に対して平均勝率5割に迫る結果があったことから、この調子で教師データを更新していけばどんどん強くなっていくはずという思いが湧いてきていました。ですが、期待は裏切られました。
勝率データの内訳を以下とする改善後(60)というデータを作成して、学習した後、マイロ将棋1.0と対局するということをやっています。
改善後(60)のマイロ将棋1.0との対局結果は以下です。途中までしかデータができていませんが、改善後(50)よりも悪いだけでなく、改善前(40)よりも悪くなってしまっています。
教師データの改善結果そのものにも疑問が出てくるような結果になってしまいました。もう少し教師データ作成は続けようと思いますが、もっと基本に立ち返った方が良い気がします。なぜ勝率データの学習をするとマイロ将棋1.0にわずかながらも勝てるようになるのか、ということを確認したいです。