2023-01-01から1年間の記事一覧

マイロ将棋(37)教師データ 改善後(80)

改善後(80)のデータを100万局面分作成し終えました。以下グラフのオレンジ色の棒が改善後(80)のデータで学習した結果とマイロ将棋1.0を対局させた結果の平均勝率です。 学習量が100万局面に近づくにつれて若干勝率が上向いていますが、勝率は改善後(70)より…

マイロ将棋(36)教師データ 改善後(70)

最近、マイロ将棋への取り組みが教師データ作成のみになりつつあります。毎日24時間ひたすら教師データを更新し、ある程度データが溜まったところで、勝率の確認をしています。改善後(70)のデータは100万局面分作成し終えました。 前回は40万局面分までの教…

マイロ将棋(35)教師データ 改善後(70)

教師データ、改善後(70)の作成を進めています。データの内訳は以下図の通りで、改善後(60)にダーツ法での10局分の対局結果を追加したものです。 現在40万局分まで作成を終えたところで、この教師データを用いて学習した結果は以下グラフのようになっています…

マイロ将棋(34)73法とダーツ法の比較

73法で作成した教師データとダーツ法で作成した教師データとで学習結果に差が生じるのかを確認しています。改善後(60)がこれまでの73法で作成したデータ、改善後(d60)は改善後(60)の内の10局分をダーツ法での結果に置き換えたデータです。 現在改善後(d6…

マイロ将棋(33)同一展開の回避(ダーツ法)

同一展開の回避方法がよくないのではないかと思い始めています。これまで取っていた方法は自称73法というものです。候補手の中で最も予測勝率が高い手を7割の確率で選択し、残りの3割を勝率が二番目に高い手とするという方法です。 この方法だと、一局面…

マイロ将棋(32)戦局の確認

教師データを改善しているはずなのに、対マイロ将棋1.0の勝率が上がらない原因、50万局面より多くの学習データを学習させると勝率が下がってしまう原因を考えています。戦いの様子を確認すると、マイロ将棋1.0に対して無謀な王手を繰り返して駒を取られ、自…

マイロ将棋(31)教師データ改善結果の確認

前回、最善手のみ指す方法で、マイロ将棋1.0に対して平均勝率5割に迫る結果があったことから、この調子で教師データを更新していけばどんどん強くなっていくはずという思いが湧いてきていました。ですが、期待は裏切られました。 勝率データの内訳を以下とす…

マイロ将棋(30)同一展開の回避

将棋プログラムでほぼ避けて通れないのが、同一展開の回避方法検討です。プログラムで将棋を指す場合、乱数要素を入れない限り同じ局面では必ず同じ手を指すようになります。どんなに強い将棋プログラムでも毎回同じ手を指すようでは、必勝法を編み出されて…

マイロ将棋(29)教師データ作成に用いたモデルとの対局結果

改善後の教師データの効果が中々見えず、何とかして確認できないものかと考えていたところ、よさそうな案を思いつきました。これまで効果を確認するのにマイロ将棋1.0というマイロ将棋界では強めの相手と対局させていたのですが、教師データ作成に用いたモデ…

マイロ将棋(28)教師データの改善結果を確認中

改善後の教師データを作り続け、ようやく100万局面分の教師データができました。前回50万局面分のデータで確認したときは、若干ですが改善前よりも勝率が悪いという理解しがたい結果でした。もっと教師データを作れば、勝率が上がるかもしれないという期待も…