mctsの解説について

floodgateのmctsの作者さんが解説記事をアップされました。
なんだか催促したようで申し訳ありません。


モンテカルロ木探索将棋プログラムmcts の解説など(フダンの記録)
http://d.hatena.ne.jp/tawake/20111123/1322022038


モンテカルロ木探索の将棋プログラムをどういう評価軸で評価すればいいのかというのは、まだ統一的な見解が存在しないのだと思いますが、実際に作ってみて「他ソフトとの勝率がいくらになったよー」or「floodgateでRがXXXXだったよー」というような評価のしかた以外としまして、
・秒間のplayout回数(po/s)とそのときの強さ
がわかるといいなぁという。

強さは別の尺度で言うなら、GPS将棋/Bonanzaの何ノード分の探索に相当するのか。

すなわち、「何回のplayoutが、GPS将棋/Bonanzaの1回分の静止探索に相当するのか」という尺度で表現できるのではないかと私は考えています。

つまり「po / GPS quies」みたいな単位でもって、そのplayoutにどれくらいの価値があるのかをアバウトには評価できるのではないかと思っています。(この値が小さいほど有意義なplayout)


あとは第三者が追試できるようにGPS将棋とのソース差分などが公開されているといいなぁという…。