ひよこカルロ将棋neo v1.01m1のレーティング

ひよこカルロ将棋neo v1.01m1の二週間レーティングはR1961でした。

100戦には少し満たないですが、次の実験に使いたいので少し早めに切り上げました。

序盤の相性が悪く、いままでほとんど勝てなかったchie_v0.8には勝ち越し、全く勝てなかったgps_l、Sunfish、bingo将棋に1勝ずつするなど、「へー、勝てるんだ?」というのが正直な感想です。

「駒得だけの評価関数だとnpsが上がってもたいしたことないっしょ」というのは、通説でありまして、コンピューター将棋開発者にしてもそう考えている人が大半のはずで、私もそう考えていたのですが、そろそろ考えを改めないといけない時期に来ているのかも知れません。

gps_lに一勝したことにはponanzaの開発者であるisseiさんも衝撃を受けられたようで以下のようなコメントを頂戴しております。

issei_y 2011/11/09 15:37
>まさかgps_lに駒得だけの評価関数で勝てる日が来るとは..。
凄まじいですね・・・
衝撃をうけました。
オレも「駒得だけのソフトに負けた、駒得だk(ry」という練習をする必要があるようですw


さて、ひよこカルロ将棋neoは並列化によってどこまで強くなるのでしょうか。
皆様、結果を楽しみにお待ちください。

ひよこカルロ将棋neo vs ひよこ将棋

とある方面から、ひよこカルロ将棋のモンテカルロシミュレーションの有効性を示してくれと言われておりまして、実験してみました。

ひよこカルロ将棋neo 1.02モンテカルロシミュレーションあり/なしの対戦です。5分切れ負け。シングルスレッド、置換表2GBです。

40戦しまして結果は28-0-12。モンテカルロシミュレーションありのほうが7割勝ち越すという結果になりました。レーティング換算で言うとR150程度でしょうか。

まあ、しかしこの結果をもってひよこカルロ将棋neoのモンテカルロシミュレーションが有効だとは言えないと思うのです。

駒得のみの評価関数ですと玉は全く囲いませんし、金・銀すら使いませんし、平気で玉頭の歩を突いて終盤で傷になったりしますし、そういう意味では、駒得のみの評価関数の場合ですと、初手58金とやるだけでもR50ぐらい違ってくるのではないかと思います。

また、ひよこカルロ将棋neo自体、シングルスレッド時でも終盤の棋力はR2200〜R2300程度あると思われるので、序盤をもう少し改善すれば、総合棋力としてあとR100〜200ぐらいは上がるはずであり、そう考えるとマルチコア対応 + 序盤をMCTSで改善 = R2400というのはまんざら不可能な目標でもないとは思います。

しかしまあ、私はそろそろモンテカルロは飽きてきましたので、今回はもう少し別の方法で強くしてみたいと思っています。