KKPでは決勝に残れません

KKPのための差分評価をするコードを書いてました。差分評価をするコードを書くのは結構大変で、バグがあっても即座にエラーになるわけではないのでデバッグがしにくいです。

差分評価した値と差分評価していない値とが常に一致するかを確かめるコードを書いて検証しました。なかなか大変でした。KKP用の差分評価なんて、このあと使えるわけでもないので全くもっていらない作業なのですが、KKPでどこまで強くなるのかを示しておくことが重要だと考え、頑張って書きました。

それで結局、前のバージョンよりはR50程度強くなったと思うのですが、差分評価以外にも頑張っていろいろやったわりには効果に乏しく、R2300に行くか行かないかというところです。モンスターマシンを持ってきてもR2400に行けばいいほうでしょうし、これではまだコンピューター将棋選手権の決勝に残れません。

あっ、くどいようですが、私は選手権に出る予定はいまのところ全く無く、選手権に出る気分をあれやこれや想像して一人で楽しんでいるだけです。念のため。

たぶん探索部を改良しまくってもあとR50伸びるかどうかだと思いますし、KKPの評価値はこれ以上リファインするのは難しく(Bonanzaが頑張って学習した値ですし…)、結局のところKKPだけでは来年の決勝には残れないという結論になると思います。数年前ならば決勝に残れたのかも知れませんが。

金と銀とのKPPだけでも導入すればもう少し違ってくる気もするのですが、これもやりだすとキリがないのでどうしようか考え中です。

あとKKPのパラメーターの値ですが、目で見たところあまりいい値にはなっていません。手で値を直接書いたほうがマシだと思います。(いわゆるドーピング) 手で書けばもしかしたらR30ぐらいあがるかも知れません。KKPだけならば書けなくはない分量です。(いまついている値を参考にしながら、「ここが50なら、こっちはもっと大きな値がついてなきゃおかしいだろ、70だ!」みたいな感じで)

ボナメソは非常に数多くのパラメーターに対してそれっぽい値をつけられるのですが、その精度に関しては少し疑問で、手で書ける範囲ならボナメソでついた値を手で書きなおしたほうがいいのではないかと思います。

あと、モンテカルロシミュレーションの結果より通常探索の結果が優先されるようになってきたので(通常探索の結果のほうが値が大きいから)、序盤が同じような将棋が増えてきました。そろそろ定跡を入れることを検討しないといけないかも知れません。