ひよこカルロ将棋に伸びしろはまだある?

ひよこカルロ将棋がどこまで強くなるのか、他のコンピューター開発者の方からいろいろ問い合わせをいただくのですが、ひよこカルロ将棋の開発は今月末までと決めていますので今月末でひよこカルロ将棋の開発は終わりです。

そのあとのことは…いまはまだお話できません。10月末になってからのお楽しみということで。

今月末までは残り2日ありませんが、並列化も含めればあと200はRを上げられると私は信じています。

駒得+モンテカルロでfloodgateの二週間レーティングでR2000を達成できれば自分で言うのもナンですが、素晴らしい快挙だと思います。

駒得だけの評価関数だと弱いというのは私は迷信だと思っています。探索速度さえあれば強いはずです。その探索速度がいまのCPUのアーキテクチャではなかなか上げにくいので評価関数で足りない分を補っているだけです。

Bonanza相当の探索手法でシングルスレッドで5Mnpsぐらい出ていれば駒得だけの評価関数でもR2000ぐらいになるはずです。(ひよこカルロ将棋はいまは2Mnps程度です) 倍になるごとにR100ずつぐらい上がるでしょうから、その1000倍である5Gnps出ればR3000クラスになり、トップレベルのソフトとも渡り合えるはずです。いや、将棋専用CPUでもあるまいし、そんなに出ませんけどね。


将棋の強い人には「評価関数が駒得だけで序盤が出鱈目だと序盤で押されて挽回できないよ」と言われそうですが、それが正しいのかどうか私はよくわかりません。探索深さがどれくらい深くなれば駒得だけの評価関数でも序盤を形勢互角か少し不利ぐらいで乗りきれるのか、そのへんが私にはよくわからないのです。いや、私を含めて誰にもわからないのが現状かも知れません。


1手1秒のBonanzaと1手1000秒の駒得だけのBonanzaなら後者が本当に勝ち越すのかと言われるとちょっと自信がないのですが、しかし、少なくともfloodgateで駒得のみの評価関数でR2000が達成できたなら、「将棋ってそういう(序盤逃げ切り型の)ゲームではないんじゃないの?」という一つのテーゼにはなると思います。

これはコンピューター将棋界にとって大きな波紋を投げかけることになるのではないでしょうか。


「ひよこカルロ将棋の評価関数をBonanzaのfv.binに差し替えれば本家Bonanzaより強くなるのでは?」などと一部で囁かれておりますが、そんなことはしないし、したくもないというのが私の美学でして、独創的で、従来にないような将棋ソフトを作ろうと考えております。


それでは皆さん、最後まで応援のほどよろしくお願いします。