マイロ将棋(7)全結合の学習結果

全結合のモデルでも駒の種類毎に入力情報が分かれるので、自分の駒が多ければ有利、相手の駒が多ければ不利ということは学習できるはずです。以下グラフは教師データを使って、全結合のモデルで学習を行った結果です。少しずつですが、学習回数が増える毎に誤差が少なくなっています。ここでの学習回数は実際の学習回数を示すものではなく、どのくらい学習したかの目安の数値と捉えてください。紛らわしくてすみません。学習回数1000回で100万局面分の教師データを使います。過学習を避けるため、次の1000回分ではまた別の100万局面分のデータを使うこととし、既に使用した教師データは以降の学習では使用しないようにしています。

 

全結合の学習結果

 

このモデルは単純ではありますが、入力データの数が2296個もあるため、パラメータがかなり多いです。ざっと計算して2296×2296(重み)+2296(閾値)で、おそらく527万個くらいのパラメータがあります。パラメータが多いので中々学習は進みません。上のグラフも、ここまで到達するのに1週間くらい掛かっています。

 

マイロのPCは古いPCであまりスペックはよくありません。辛うじてGPUNVidia GeForce GTX960)は積んでいて、CPUで計算するよりは全然速いのですが、もう少しよいGPUが使いたいです。