マイロ将棋(34)73法とダーツ法の比較

73法で作成した教師データとダーツ法で作成した教師データとで学習結果に差が生じるのかを確認しています。改善後(60)がこれまでの73法で作成したデータ、改善後(d60)は改善後(60)の内の10局分をダーツ法での結果に置き換えたデータです。

 

 

現在改善後(d60)の教師データが80万局面分できたのでそこまでの結果ですが、対マイロ将棋1.0の勝率は以下のようになっています。50万局面までの学習結果では改善後(60)と改善後(d60)とでほとんど違いがみられなかったのですが、60万局面以降の学習結果では、若干ですが改善後(d60)の方がよくなっています。特に60万局面と80万局面の結果では改善後(50)を上回っています。この傾向が続いてくれれば、これまでで最も良い結果、改善後(50)の50万局面の勝率を超えられそうです。