マイロ将棋(11)CNN(持ち駒分離)の学習結果

CNN(持ち駒分離)の学習結果として、誤差がどのくらい縮まるのかを見ます。100万局面単位で処理すると時間が掛かりすぎるので、ここからしばらくは10万局面単位で100万局面(学習回数1000回)程度までの結果を確認します。全結合のモデルでは1000回学習した時点で、誤差15を大きく上回っていますが、持ち駒分離のモデルでは300回程度学習した時点で、既に誤差15を下回る誤差になっています。パラメータの数にも左右されるかとは思いますが、CNNの方が全結合よりも早く誤差が縮まる傾向がありました。

 

全結合とCNN(持ち駒分離)の誤差

 

CNNで学習すると、その結果は盤上で近くにある駒との関係に影響を大きく受けます。将棋の有利不利は、近くにある駒との相互作用に大きく影響されるため、全結合よりも勝率をより正確に予測できるとも言えそうです。