floodgateのひよこカルロ将棋v0.19

まだ100戦終わっていませんが、次図のような状況です。

BlunderXX-r3851_4c,chie_v0.8には半分ぐらいしか勝てていません。ひよこカルロ将棋側としては序盤があれだけひどくて勝たせてもらえていること自体が奇跡なのですが、それでも両ソフトとは同じぐらいのレーティングなのに半分ぐらいしか勝てないということはひよこカルロ将棋についているレーティング(R1930前後)が高すぎるんじゃないのかという疑念を拭えません。

ここから考えられる結論としては、
1) 序盤の駒組が優れているソフトにはひよこカルロ将棋は勝率が著しく悪い
2) Blunderは本当はもっとRが高いのに、稲庭れさぴょんからRを吸い取られて低く見えているだけ
3) BlunderはC++で書きなおしてまだバグなどが残っていて本調子ではない(C#版より明らかにRが低いので)
のいずれかだと思います。

2) or 3)ならひよこ的には良いのですが、1)なら、これはもうマルチコア対応やクラスター化なんかでは勝率の向上にはほとんど効果がない可能性があって、マルチコア化はともかく、頑張ってクラスター対応させても効果がないという悲しい結末が待っていそうです。

いまのひよこカルロ将棋の棋譜を見る限り、そもそもマルチコア対応で1手や2手分探索深さが増えたとしてそれでgps_normalへの勝率が上がるとは到底思えないのですが、いやしかし、npsが倍になるごとにR50ずつぐらいは何故かあがるというのがコンピューター将棋の世界の常識であり、そのへんは人智を超えた、人間の想像を超えたことが起きかねません。

しかし駒得だけの評価関数でnpsが倍になるごとにどれくらいRが上がるのかという実験結果自体がなくて、本当にそんな単純な評価関数にもこの話が通用するのかどうかというのはよくわかりません。

「上がるのか上がらないのかハッキリしてくれ」と言われそうですが、それは私にもよくわかりません。

まずはマルチコア対応です。それによって効果があったならクラスター化をしようと思っています。マルチコア対応で強くならなければ次の方法を考えるまでのことです。

ちなみに私は棋譜からの学習にはしばらく手を出さないと思います。あれは泥沼なので私の手に負えるものではないです。私はもっと別の方法を模索したいと思います。