ひよこカルロ将棋neo v1.01m1がgps_lに勝ったようです

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/11/09/wdoor+floodgate-900-0+hiyoko_carlo_neo_v1.01m1_1c+gps_l+20111109060001.csa

gps_l(現時点でR2533)の穴熊からの猛攻がやや無理攻めなのでしょうか…。私の棋力ではよくわかりませんが、ひよカルが丁寧に応接してgps_lの攻めを切らしてしまったように思います。

まさかgps_lに駒得だけの評価関数で勝てる日が来るとは..。(何十局に一局ぐらいの偶然なのでしょうけども)


ところで、gps系に勝つ将棋はいつも決まっていて、上の棋譜のようにgps側が序盤で圧倒的に有利になって大駒を叩ききって攻めてくるのですが、それをひよカルがギリギリのところで受けきって勝ち、みたいなパターンです。

もちろん、ほとんどの対局はギリギリのところで攻め潰されてしまうのですが、gps_normalには何局かに一回これで勝てるときがあります。ですので、gpsはもう少し安全運転が出来るようになるといいのになぁと思います。

安全運転が出来ないのはコンピューター将棋ソフト共通の大きな悩みだと思うのですが、「安全運転のできるコンピューター将棋の探索手法」をどなたか研究して発表していただけませんか…。

安全運転のできる探索手法

いまのトップ付近に位置するコンピューター将棋ソフトは、探索速度を犠牲にしてでも評価関数の精度の良さで補おうという方向で進化が進んでいますが、これが案外危険なのではないかと私は思うのです。

いまの全幅の探索手法は、固定深さの探索とあまり変わりません。この固定深さのなかで一番評価値が大きくなるところを選んでしまいがちで、どうしても激しく斬り合いに来ますが(駒をたくさん交換して手持ちにしたほうが評価値が高くなるため)、読みが足りていないのでその踏み込みの判断が正しくないことがあるのだと思うのです。

1) 局面が安定していて評価値がそこそこ良い
2) 局面が不安定で評価値がすごくいい

1)と2)なら1)を選ぶべきなのに、2)を選んでしまうところに問題があるわけです。

「局面が安定かどうか」というと、「玉形が安定しているか」もそうなのですが、「下手したら攻めが切れちゃう」とか「相手にも手駒渡しすぎてる」もそうです。つまり、大駒を切ったわりに手駒が足りていないような局面も不安定な局面であり、このような局面に自分の手番で遭遇するなら、それを回避したほうが得だと思うのです。

つまり、探索中に遭遇した自分手番(探索開始局面と同じ手番)の「下手したら攻めが切れちゃう」「相手にも手駒渡しすぎてる」な局面に対しては評価値を減点したほうがいいのではないかと思うのです。

これについてはいずれ実験してみたいと思っています。

ひよこカルロ将棋neoの並列化対応について

ひよこカルロ将棋neoのマルチコア対応はほぼ出来ました。一晩デバッグのために走らせてみて、問題がないようでしたらfloodgateに投入したいと思います。

あと、クラスター化対応のほうは、後回しにします。

これはもっと学術的に真面目に研究すべき課題で、いい加減な実装だとわずかにすらソフトの棋力は上がらないと私が判断したためです。

棋力が上がらない理由は通信のlatencyが大きすぎて、短い持ち時間ですと、読み筋を交換するだけで終わってしまうというのが問題点でして、逆に言えば少ないPC(4台ぐらい)で少ない持ち時間(15分切れ負け)ならば、読み筋をそんなにこまめに交換しないほうが得策です。

「じゃあ合議か?」と言われると「それは違う!」と私は思っており、合議にするぐらいならば、それぞれのPCがそれぞれ違う部分を探索して、最後に意味のあったノードの情報だけまとめてメインPCに送り、メインPCがもう一度最後のiteration深さと同じ深さでiterationを回して情報を統合、みたいなモデルのほうがまだマシではないかと思うのです。

では「それぞれのPCがそれぞれ違う部分を探索」っていうのは具体的にどうするのかという話なのですが、読み筋を交換せずに全く違う部分を探索することは不可能ですが、主に探索する部分を変えてやることは出来ます。

(中略)

それで、そのための準備とかがいろいろ大変でして、これを真面目にやっていたら私は2,3ヶ月ぐらい何も出来そうにありません。これに関して成果が出れば論文かGPW等で発表したいとは思っていますが、いまやるべきことではないので後回しにして、まずはひよこカルロ将棋neoをgps_lと互角ぐらいまでのところに持っていくほうが先決です。

トップ付近のソフトがR50でも伸ばすインパクトは計り知れませんが(たとえばBonanzaに対して勝率6割とか言うと凄そうに聞こえます)、R2000にも満たないソフトがR50伸びたところで「それって誤差じゃないのか」とか言われかねません。

ともかく、ひよこカルロ将棋neoは明日か明後日で早くも最終版となります。
ひよこカルロ将棋が鶏カルロ将棋になる日が来るのでしょうか。乞うご期待!!