マイロ将棋(8)全結合 対 マイロ将棋0.1

学習回数1000回に達した時点のモデルを用いてマイロ将棋0.1と対局し、強さを比較しました。300手指した時点で決着が着かない場合は再戦するという方法で計測しているので引き分けはカウントしません。結果は、1000局対局してマイロ将棋0.1が108勝、全結合の学習回数1000回が892勝で、全結合のモデルが勝ち越しました。学習によって、より勝ちやすい局面を選択できるようになった結果、マイロ将棋0.1に勝ち越せたのだと考えています。

 

さらに学習を進めたモデルでの対局結果も順次更新しますが、学習を進める程、勝率が高まる傾向にあります。

 

全結合の対マイロ将棋0.1勝率

 

この勝ち越したモデルを用いて教師データを作り直して、その教師データを使って学習すればさらに強いモデルができると思っています。実際にそうなることを確認してみたいのですが、今のところ躊躇しています。教師データを作るのに時間が掛かりすぎるからです。マイロ将棋0.1での教師データは1日で10万局面分くらいは作れるのですが、全結合等のディープラーニングのモデルを使って対局すると1局終えるのに数秒から数十秒程度掛かってしまいます。このペースだと1日でせいぜい数千局面分くらいしかデータを作れません。今の学習のやり方だと教師データが百万局面単位で必要ですが、それだけのデータを作成するには数百日とか掛かってしまいそうです。もっとかもしれません。そう考えると中々強いモデルで教師データを作成することに踏み出せないのです。本当にそれでより強いモデルが作れることを確認はしたいのですが。

 

別のアプローチの仕方も考えています。このモデルでもマイロ将棋0.1に勝ち越せてはいるのですが、全勝ではありません。どうすれば全勝に近づけるのかを追求するのもよいかなと思っています。似た方法として、現在の教師データでどのくらい強いモデルを作れるかを追求するというのもあります。