mctsの解説について
floodgateのmctsの作者さんが解説記事をアップされました。
なんだか催促したようで申し訳ありません。
モンテカルロ木探索将棋プログラムmcts の解説など(フダンの記録)
http://d.hatena.ne.jp/tawake/20111123/1322022038
モンテカルロ木探索の将棋プログラムをどういう評価軸で評価すればいいのかというのは、まだ統一的な見解が存在しないのだと思いますが、実際に作ってみて「他ソフトとの勝率がいくらになったよー」or「floodgateでRがXXXXだったよー」というような評価のしかた以外としまして、
・秒間のplayout回数(po/s)とそのときの強さ
がわかるといいなぁという。
強さは別の尺度で言うなら、GPS将棋/Bonanzaの何ノード分の探索に相当するのか。
すなわち、「何回のplayoutが、GPS将棋/Bonanzaの1回分の静止探索に相当するのか」という尺度で表現できるのではないかと私は考えています。
つまり「po / GPS quies」みたいな単位でもって、そのplayoutにどれくらいの価値があるのかをアバウトには評価できるのではないかと思っています。(この値が小さいほど有意義なplayout)