マイロ将棋(39)教師データ 王手局面のみ更新

教師データを更新してもなかなか勝率が上がらず、更新の効果を実感できない状態が続いています。もっと多くのデータを更新することで改善の効果が確認できるのかもしれないですが、データの更新には非常に時間が掛かり、確認できたとしても数か月とか数年先になりそうです。もっとよい方法はないかと考え、思いついたのが王手局面のみ更新です。

 

過去に自分が王手している局面のみ教師データから除外することで結果が改善されることを確認していました。初期の教師データはマイロ将棋0.1同士で対局したもので、王手をすればほぼ勝てるので、自分が王手をしている局面の勝率が高くなりがちです。その教師データを元に学習をするとかなりの割合で王手をするようになります。その結果、無駄な王手を繰り返し、自分の駒を減らして自滅してしまうのです。これを改善するために自分が王手している局面のみ教師データから除外するということをしていました。ですが問題点として自分が王手をしなくなってしまう傾向があり、従来のモデルを大幅に上回るものを作るのは難しそうでした。

 

現在はマイロ将棋0.2同士の対局もできるようになったので、王手局面を教師データから除外するのではなく、王手局面のみマイロ将棋0.2同士の対局結果で更新すれば、除外した時よりも良い結果が得られそうです。教師データの中で自分が王手をしている局面は、感覚的にですが5%以下くらいです。全データを更新するよりも早く更新データを作成できるのも良いところです。このやり方で従来のモデルを大幅に上回ることができれば、そのモデルでさらに教師データを更新し、より強いモデルに早く到達することもできそうです。

 

早速、王手局面のみ更新したデータを作成しているのですが、またもや期待は裏切られています。なぜか勝率が大幅に下がってしまいました。もう少しこのデータの更新を続けてみます。