ひよこカルロ将棋はあとどれだけ強くなるのか

どうも思考時間の使い方が下手です。毎回決められた時間だけ割り振っていますが、2番目の指し手との差が大きいときは早めに切り上げるだとか、不安定なノードでは長い時間を割り当てるだとか、何かやりようはあると思います。

終盤のためにたくさん時間を残したいところではあるのですが、序盤で定跡を持っておらず、序盤の時間をあまり減らすとすぐに勝負形にすらさせてもらえずに終わってしまいます。駒得だけの評価関数ですと序盤を乗り切るのは読みの深さがなくては辛いのです。

かと言って序盤に多く割り当てても形勢互角以上になることはまずありえず(囲いすらまともに出来ないので)、ゆえに終盤で相手より持ち時間が少ないと逆転の目すらなくなってしまいます。

ゆえに序盤は少し不利ぐらいで乗り切り、終盤の腕力で逆転するのが一番理想的なのですが、そういう風に調整するのもなんだかなぁということであまり調整しておりません。

まあ、不安定なノードではもう少し時間は使ったほうがいいとは思います。うまくすることでR10か20ぐらい変わるのかも知れません。

その他、探索のほうは、私の力ではこれ以上はあまり改良のしようが難しく、BonanzaとかStockfishとかFruitのソースを読みながら使えそうな技法を試してはやめ、試してはやめとそんな感じです。

駒得の評価関数用にもうちょっとreductionの量などを調整することは可能ですが、そこを調整してもそんなに強さは変わらないでしょうし、今回はやりません。

高速化は探索部分をもう少し頑張って書きなおすと10%ぐらい速くなることはわかっているのですが、10%速くなったところでR10変わるか変わらないかでしょうから、これも今回はやりません。

ゆえに、あと残るは並列化だけです。並列化はBonanza方式で残り深さ3以上あって、生成されている指し手が4以上あればsplitという簡単実装で行こうと思っています。たぶん4コアでもそんなに強くならなくて、100ぐらい上がってくれればいいのですが。いや、序盤がひどいので、それすら上がらないのかも知れません。なんにせよ、結果が楽しみです。

いまのひよこカルロ将棋はfloodgateでおそらくR1800相当だと思うので、結局のところ今回のチャレンジではfloodgateの二週間レーティングでR1900行けば上出来かなというところです。

つまり、さらに改良すれば、駒得だけでもR2000は行く見込みがあります。それから、序盤はmctsでせめて互角か少し不利ぐらいの将棋が指せればR2100ぐらいが見えてくるのではないかと思うのですが、今回は時間の関係で私はそこまで出来ません。