ボンクラーズの選択

 本年1月14日、将棋の米長邦雄永世棋聖が 遂に将棋コンピュータ「ボンクラーズ」に敗れました。 これを小生は、ムーアの法則によるものだと思っていました。 1997年、チェスの世界チャンピオンをやぶったスーパーコンピュータも、 チェスより指数関数的に場合の数が増える将棋では人間に敵わなかった。 これを解決するのは、コンピュータの物理的処理能力の進歩だろう と、たかをくくっていたのです。

 しかし、一見したボンクラーズは、 平凡なタワー型のワークステーションで、 洋箪笥のようなブレードシェルフを並べたものではありませんでした。 今回の快挙には、更なる進歩が関わっていたらしいのです。

 将棋ソフトは、一手一手の重みを定量化して比較演算します。 この定量化機能を「評価関数」と呼ぶのだそうで、 幾つかの観点が組み合わされているようです。 例えば、最も単純なものは取る駒の価値で、 「歩兵」なら1点、「香車」なら2点、「銀将」なら5点などとし、 予め開発者が手入力します。 人間が教えてあげるのですね。

 ボンクラーズには、先ず、そういった評価関数に、 「形勢を逆転する」という評価観点が追加されました。 課題解決の評価ですね。 しかも、そのデータを 開発者が手入力するのではなく、 自ら生成する機能をコンピュータに与えたのです。 「機械学習」と呼ぶそうですが、要は自己学習機能ですね。 そして、江戸時代からのプロの対局 5万局以上を自己学習させたのだそうです。

 更には、一手で検討に値しないと判断する手筋を その場で切り捨て、数手に限定して深読みする 「取捨選択」機能が追装されました。 これによって、一局面を読むのに 何京通り(「京」は10の16乗) という演算能力を、直感的に有効と思われる手に 集中させることができるようになったわけです。

 では、どのような対戦になったかというと、 流石は永世棋聖、初手から奇手を繰り出し、 定石を学んできたであろうボンクラーズを手玉に取り、 序盤から中盤は人間が優勢に見えました。 ところが、追いつめられたボンクラーズは、 飛車を横に振り始めます。 左に、右に、また戻し、また変え、 これは「手損」と言って、 みすみす攻守の機会を捨てているようなものです。 追いつめた永世棋聖は徐々に手を進めますが、 一瞬、小さなミスを犯してしまいます。 ボンクラーズは、その一瞬を逃しませんでした。 一気に攻勢に出て狙い駒を定め、 難攻不落と思われた永世棋聖の牙城を 見る見るうちに破壊していきました。

 ボンクラーズは、敢えて手損を犯しながら、 チャンスを伺っていたのです。 米長永世棋聖は、対戦後のインタビューで、 「まるで大山さん(※)と指しているようだった」と語っています。

 これらの機能は、電通大の研究室が、 実際に羽生善治名人の頭に電極を取り付け、 プロ棋士の思考パターンを研究した成果でした。 検討する手筋の数は、初級者、中級者、上級者と増えていくのですが、 羽生名人の場合は、逆に減少し、中級者以下、 初級者より少し多い程度ということが実証されました。 これは、羽生名人が幼年期から培った膨大な 「経験的知識」に基づく直感、 「大局観」のなせる技なのですね。 つまり、ボンクラーズは、大局観のシミュレーションにチャレンジしたのです。 すなわち、「自己学習」と「取捨選択」という二つの武器を手にしたのですね。

因みに、米長永世棋聖のインタビューにも出てきた 大山康晴十五世名人は、現代の羽生名人のような存在でしたが、 生前、「読むのは一手だけでいい」と語ったといいますから その大局観たるや、もの凄いものだったのでしょう。

推薦図書

選択の科学
(シーナ・アイエンガー)


--- 2012/02/09 橋本

back index next