週刊ひよこ将棋plus2が微妙にバグっていた件など

どうも週刊ひよこ将棋plus2が弱くなっているなぁと思っていたら、評価値を計算するところでちょっとしたバグがあったようです。コンピューター将棋のデバッグはバグがあっても顕在化しにくいのでなかなか大変ですね…。

これをなおして、いくつか修正すればたぶんR2400ぐらいあるはずなので、いまやっている実験に区切りがついたらあとで修正したものをfloodgateに入れておきます。

ひよこカルロ将棋neoのほう、gps_normal(R2150)はそろそろ超えていると思うのですが、SunfishにボコられすぎてRはむしろ下がっています。(Sunfishとだけやたら当たります…)

序盤で同じような進行になるのがよろしくないので、定跡DBを早く導入したいのですが、実装するのは結構大変でして、個人的にも、いまは今月と来月は年末年始で忙しく、なかなか思うように時間がとれません。

ともかく、ひよこカルロ将棋neoのほうはSunfishが最大のライバルでして、Sunfishを追い抜くまでは改良を続けたいと思っています。駒得+αでもたぶん頑張ればR2200は行くのではないかと信じているので、もうちょっと頑張ってみます。

正直、Bonanzaの評価関数をそのまま使ってBonanzaに8割勝ち越すソフトを作るより、駒得+αだけでR2200を超えるソフトを作るほうが大変じゃないかという気はしています。まあ、そんなソフトを作っても誰も見向きもしないでしょうし、一部の開発者にしかその価値を認めてもらえないでしょうけども、私としては、強いソフトを作ることはどうでも良くて、そういうことにチャレンジしているほうが楽しいんですよね。

打倒、(駒得+αのみで)Sunfish!! 俄然燃えてきました!!!

接待ひよこ将棋の本気はR28XX

接待ひよこ将棋はfv.binをそのまま使っておりまして、要するにBonanzaの評価関数そのままです。

探索部は独自に書いているのでBonanzaとどちらが上かはよくわかりません。互角ぐらいの性能はあると思うのですけども。

試しにひよこ将棋から評価関数をfv.binに差し替えて簡単なテストをしたところ、8割程度勝ち越すようでしたが、まあ、ひよこ将棋側には定跡DBを載せておらず、序盤の進行が似たりよったりなのでこれはあまり参考になる数字ではないでしょう。

そういう状況ではありますが、“接待”をやめたときにどれくらいの力があるのかを検証するために、floodgateに投入してみました。hiyoko-dev171_PhenomIIX6です。



なかなかいい成績ですね。gps_normalには入玉されて1局落としました。nmb48は、評価関数のグラフからするとBonanza6をそこそこ速いマシンで動かしているものだと思います。kbwも評価関数のグラフからするとBonanza系のようです。

レーティングのほうは…と言いますと…

2週間レーティングにて、R2888。PhenomII X6という低スペックなマシン(コアは一応6個ありますが…)のわりには奮闘しているのではないでしょうか。


このバージョンでも改善の余地が様々あり、頑張ればまだR150ぐらいは上げられると私は思っています。そうすれば、いまのマシンのままでもR3000は行きそうです。モンスターマシンを持ってくればR3100。モンスターマシンのクラスター化(予算に余裕があるなら)でR3200と言ったところでしょうか。

その場合、将棋倶楽部のレーティングではR3500…と言いたいところですが、R3000以上をキープしようと思うとRが離れた相手から“一発”(まぐれ当たり)をもらわないことが大切で、入玉将棋で“一発”をもらっているようではなかなか難しいでしょう。(それにR3200付近からは同じぐらいのRの対戦相手がいなくて困りそうです…)

数年後には、将棋倶楽部24の上位はコンピューター将棋がすべて独占するのではないでしょうか。(将棋倶楽部24では開発者以外の方が市販の将棋ソフトなどでソフト指しするのは禁止です。念のため。) そうしますと、対戦相手に困らなくなるので(コンピューターなので24時間ずっとログインして対戦し続けているので)将棋倶楽部24のトップRはどんどん更新されていくのでしょうね。


話を戻しまして、「接待ひよこ将棋」で、接待レベル1にて勝てるようなら将棋倶楽部24でR2200〜2400ぐらいあるのではないかというのを書きたかったのです。逆に言えばR2400ぐらいの人でも「接待ひよこ将棋」が楽しめるということですね。

将棋のトレーナー(対戦相手)って、同じぐらいの棋力では良くないと思うのです。同じぐらいの棋力ですと、そこから学ぶものが少なすぎて。かと言って強すぎると序中盤で形勢に差が開きすぎて終盤の手筋を学べません。

そこで、形勢が開いているときだけ少し緩めてくれるような、そんな将棋ソフトが必要だと思って開発しました。将棋上達のトレーナーに是非どうぞ!!

ひよこはコンピューター将棋関係者ですか?

ひよこ(私)は、そろそろコンピューター将棋関係者、あるいはコンピューター将棋開発者としてクレジットされるようになってきました。

http://toybox.tea-nifty.com/memo/2011/10/post-8157.html

私としては、そのような意識は全くなく、ビールを飲みながらテレビの野球中継を観戦していたら、いつの間にか自分がテレビの向こうでバッターとして立たされていた、みたいなわけのわからない状態です。

私は他の開発者との交流もほとんど無く、大半の関係者にはお目にかかったことすらないという状況でして、しかも本格的に作り始めたのもごくごく最近ですから、開発者としての自覚を持っていないというのも無理からぬことです。

たぶん、私は世界コンピューター将棋選手権に出場しても、私だけ温度差があって、私の周辺だけツンドラ気候だと思うのですが、ツンドラであってツンデレではないです。(なんのこっちゃ…)

なんにせよ、くどいようですが、私は選手権への出場はいまのところ考えておりません。
floodgateこそが私にとっての選手権会場です。皆様、何卒よろしくお願いします。

接待ひよこ将棋v.1.71 32bit,SSEなし版を公開しました。

「接待ひよこ将棋をCore2で動かしたい」という声が聞こえてきたのでSSEなし版も公開しました。

ところで接待ひよこ将棋ですが、どうも大人気のようでtumblrでもの凄い勢いでreblogされております。

http://kogumarecord.tumblr.com/post/13762060995#notes


ひよこは、将棋ファンの皆さんを応援しています!!
上達のお供に、接待ひよこ将棋をどうぞ!!

もうソフトはとっくにプロを追い越している説

ボンクラーズと対局することになっている米長会長の日記より。

プロ側の勝率20%。目を疑いたくなるような数字ですが、プロ棋士と言えど将棋倶楽部24でR2700〜2900付近、トッププロでR3100程度のはずですから、R3300オーバーのボンクラーズに勝率20%は当然の結果と言えるかも知れません。(事前の対策なしで、かつ早指しでは、ですが。)

それにしても、引退してずいぶん力が衰えているはずの米長会長が、ボンクラーズの対戦のためにリハビリ(?)に励んでいる姿は見ていて目頭が熱くなります。

しかも悪いことに、その練習用のボンクラーズは1PCです。本番では何台ものPCでクラスターを組むのでしょうから。きっとR100ぐらい違います。

米長会長より強いであろう現役棋士が20%しか勝てないボンクラーズ1PCに6,7割勝ち越すボンクラーズですよ。


しかし長い持ち時間ですと事情が違うかも知れませんし、米長会長が何か攻略を見つけるかも知れません。(入玉将棋とか)

実際のところ将棋倶楽部24ボンクラーズが負けた棋譜にはそういうハマり形もあって、ボンクラーズが負けた棋譜通りに進めるのも一つの作戦かも知れません。セコイかも知れませんが、それも勝負のうちです。


歴史的な大勝負なので1局だけではなく先後入れ替えて2局ぐらいやって欲しいところです。(3局やるとボンクラーズ側は同じ進行で2回負かされかねませんので…)

難問題集が解けるようになる日

コメント欄でいただいたコメントに返信を書いていたらあまりの長文になったので、コメント欄ではなくここで返信させていただきます。

通りすがり 2011/12/03 22:18
順調に強くなってますね凄いです !
ちょっと質問なのですが、ひよこの作者様の技術ならコンピュータ将棋の苦手な寄せの入口の発見は可能になりますか? 難問題集なんかをやらせてみると、数手進めてやらないと正解が分からないみたいなんですが、いかがでしょうか?

数手進めれば正解がわかる場合というのは、読みの深さ(≒読むための時間)が足りていないということなので、PCのスペックが上がれば自然とそういう問題も解けるようになります。

PCスペックが上がらずともソフトの改良によってそういう問題が解けるようになるかというのがご質問の意図だと思うのですが、これは、ソフトの改良が一概に難問題集の正答率アップにつながるとは限らないです。

なぜなら、難問題集は、tacticalな(戦術的な)問題が多く、実戦に現れないような筋がたくさん出てくるからです。ソフトの改良とはいわば実戦に向けてチューンし、実戦での勝率アップを目標とする場合がほとんどですから、ソフトを改良すればするほど、そういったtacticalな問題は解けにくくなります。

以上は、私の持論ではなく一般論かと思います。


ただし、dfpnによる詰将棋探索などはそういう戦術的な問題のうち、詰み/不詰めが絡む場合になら有効に作用することが多々あるので、そういう終盤向けの改良は、終盤の難問題に対しては正答率アップにつながるのではないでしょうか。

あとは最近の研究では詰将棋のみならず必死ルーチンの研究もさかん(?)で、必死ルーチンを搭載すれば、その手の難問題のうち、必死が絡むケースの正答率が目に見えて上がるでしょうね。

ただ、dfpnの詰将棋ルーチンが実戦で使い所が非常に難しい(たとえばBonanza6ではdfpnの詰将棋ルーチンを実装してあるにも関わらず、通常の探索時にはそれを使用していません。クラスター化のときに補助的にしか使っていません)というのはあって、必死ルーチンはdfpnの詰将棋ルーチンよりさらに使い所が難しいでしょうから、必死ルーチンを組み込んだコンピューター将棋プログラムというのが本当に強いのかどうかはいまの私にはよくわかりません。

それとは別に、dfpnの詰将棋ルーチン、呼び出すタイミング、呼び出すときの探索資源配分が非常に難しいのですが、ひよこカルロ将棋neoではそのへん比較的うまくいきまして、dfpnを使わなかったとき(R2050相当?)よりも50か100ぐらいRがあがっているのは、主にそのおかげだと思います。

週刊ひよこ将棋のほうは、まだfloodgateでの対戦数が少なくよくわかりませんが、あまりうまく行っていない印象は受けます。これは、評価関数がそこそこまともですと、自然と詰みやすいほうを優先して探索するようになり(王の危険度みたいなのを評価するので)、普通に探索していれば詰みを発見できるからだと思います。

また詰将棋ルーチンでは、必死やN手すきみたいなのを判定できませんので、結局は普通に探索するほうが効率的にも優れているというのはあるのかも知れません。しかし、これに関しては私はまだ始めたばかりですので、よくわかりません。

ともかく、このようにdfpnの詰将棋ルーチンをうまいタイミングで呼び出して、終盤を強化し、総合棋力をアップさせるための研究というのはまだこれからでして、同様に、必死ルーチンをうまく通常探索に活用できるようになるのも、まだまだこれからだと思います。

そのへんの改良がうまくなされれば、いま「数手進めてやらないと正解が分からない」ような難問題も(終盤のものに限って言えば)現行のPCで解けるようになるのでしょうね。

とひとごとのように書いていますが、これらは私自身のこれからの課題でもあるので、頑張ります!!

ひよこカルロ将棋neoがR2150を突破!!

ひよこカルロ将棋neoがR2100を超えて、まぐれかなーと思っていたら、gps_normalに2-0-0で勝ち越して、現在R2166。

このあとgps_normalとSunfish1.10Test_7との戦績次第では一気に落ちる可能性もありますが、もしかしたらgps_normal(R2150)は超えたのかも知れません。

興味深いので、あと2,3日このまま投入しておきます。

自己対戦の勝率だけが上がっているのかと思っていたのですが、ひよこカルロ将棋neoの場合はそうでもなかったようです。

こうなったら、ひよこカルロ将棋neoの次の目標はSunfish(現R2220)ですね。Sunfishに勝ち越せるようになるまでひよこカルロ将棋neoの開発を続けます!!

ひよこ将棋は良きライバルに恵まれて幸せです!!