GPS将棋はなぜ強くならないか

ひよこカルロ将棋neoに詰み探索を入れると自己対戦では圧倒的に勝ち越します。序盤の弱いソフトほどこの傾向は顕著です。

ここでは何故そうなるのか順を追ってご説明します。

序盤の弱いソフトは、通常探索の量を減らしても序盤の棋力はあまり変わりません。弱いものは弱いのです。iteration回数とはあまり関係ないのです。そもそも駒得のみの評価関数ですとiteration回数が数回増えたぐらいでは玉を囲えるようにはなりません。(玉を囲うのは終盤にしか生きないので駒得のみの評価関数ですとそこまで読めないと囲う手は指さないでしょう…)

ゆえに、序盤は通常探索の量が減っていても同じぐらいの序盤の棋力を持つ相手には互角のまま終盤に突入可能性が極めて高いのです。

そのときに詰み探索があるのと無いのとでは全然話が違ってきますので、結局のところひよこカルロ将棋neoに限って言えば、詰み探索を増やせば増やすほど自己対戦の勝率は上がります。増やすと言っても限度はありますが、通常探索の半分ぐらいの時間を費やしてもいいぐらいです。

こうやっていくと、詰み探索を増やしていくと前のバージョンに6割勝ち越すようになり、その6割勝ち越すものにさらに6割勝ち越すものが出来、そのバージョンにさらに…と、どんどん自己対戦の勝率の高いものが出来上がります。

しかしながら、それは序盤が互いに弱く、互角で終盤に突入するという前提があっての話なので、他ソフト対決では(特に強いソフト相手には)全く効果を発揮しません。通常探索の量を減らしているので序中盤で取り返しのつかない形勢にさせやすく、ワンサイドゲームになりやすくなり、強いソフト相手の勝率はむしろ下がります。

つまり、自己対戦では圧倒的に強いのに、他者対戦では圧倒的に弱く、Rはむしろ下がるという現象が起きます。

私の勝手な想像ですがGPS将棋も同じ問題にハマっているのではないかと思います。

GPS将棋にここ2年ぐらいの間に追加されている特徴因子は終盤向けの特徴因子ではないかと思います。こういうのを追加すればするほど自己対戦では大きく勝ち越します。それは序盤が互角ぐらいで進行するという前提があるからです。

ところが対Bonanza戦なんかですと、序盤で大きく差をつけられるようになり、むしろ勝率は悪くなります。ここ2年ぐらいでGPS将棋がBonanzaに大きく引き離されているように見えるのはこのへんに原因があるのではないかと私は思います。

つまり何が言いたいかと言うと、終盤の特徴因子を追加したときには自己対戦の勝率を見るのはかなり危険な行為だと言うことです。

終盤向けの特徴因子は麻薬にも似ています。それは何も強くなっていないのに自己対戦では圧倒的に勝ち越すからです。終盤向けの特徴因子を増やすことに決して夢中になってはいけません。改善すべき点はそこではないのです。自戒をこめて。