ひよこカルロ将棋v.0.03でUCB1実装しました。

v.0.02がやはり序盤がおかしすぎるので、UCB1を実装して、ひよこカルロv.0.03としてfloodgateに投入しておきました。強くなっているといいのですが。

見た感じ、まだ98香とか指してきます。po(playout)が少なすぎるんでしょうね。1スレッドでやっているので1500po/sぐらいしか出てませんし。各ノードでSEE調べるの結構重いです。しかしここ端折るとpoの精度さがって、ひどいことになるようです。あとSEEだと駒をタダ取られする手を見過ごしているのでもう少しきちんと処理する必要があるように思います。

それから、UCB1-tunedとかもあとでやってみます。(まだよくわかっていません。)

しかし、100poやっても静止探索ぐらいの評価精度しかないので、結局、100po×200手 = 2万回の指し手生成をやって1回の静止探索ぐらいの効果しかないんですよね。これだと全然割りに合いませんね。

それがmcts(モンテカルロ木探索)型の将棋プログラムなんでしょうかね。いやはや…。