理工系大学教員の随想録です。m.sakurai@ieee.org
by sakuraimac
記事ランキング
最新の記事
与謝野晶子 |
at 2017-09-11 13:54 |
|
バッハ傾聴 |
at 2017-06-13 17:37 |
|
カテゴリ
以前の記事
(2014/7/29より試用中)
|
2017年 07月 21日
情報処理学会誌の8月号に、松原仁先生の「AlphaGoの置き土産」という解説記事が載っていた。
AlphaGoはグーグルの子会社であるDeepMind社が開発したコンピュータ囲碁である。2016年にプロ棋士と互選で対局して勝ったことで大きな話題を集めた。チェスや将棋に比べて囲碁は探索空間がケタ違いに大きいために、囲碁においてコンピュータがプロ棋士に勝つには、あと10年はかかるだろうと言われていたからである。 2007年5月には、世界ランキング1位の柯潔(カ・ケツ)との対戦で、AlphaGoは3連勝をした。それまでにも多くのプロ棋士に勝っており、人工知能の威力を一般の人々にも大きく印象づけた。 何故、それほど人知を超えたような強さを発揮できるのか。私もAlphaGoに関する書籍を読んでみたが、理解して実感するのはとても難しかった。とりあえずは分かった範囲で書いてみる。 キーワードとしては、①モンテカルロ木探索、②深層学習(ディープ・ラーニング)、③強化学習の3点になる。 ①モンテカルロ木探索:指し手をランダムに最後まで打ち、結果が良かったものを次手の候補として選ぶ。しらみつぶしに調べるのは天文学的な数字になるので、適当に間引きして打ってみようという思想である。それでも探索の数は膨大なので、それを減らす工夫がこらされている。この手法で、コンピュータ碁は急に強くなった。 ②深層学習(ディープ・ラーニング):深層学習は特に画像認識の分野で大きな成果を挙げている。ごく簡単な例をあげると、1~10までの色々な手書きの数字を画像としてコンピュータに入力して、どれが1か2かということを教えて学習させる。教材に使った手書き文字の数が多いと(例えば10万とか)、新しい手書き文字が入力されてもそれを正確に1~10のうちどれかということを判定することができる。これを囲碁に適用するには、過去の膨大な棋譜を集めて、ある局面では次はどの手を打てばよいかということを学習させる。新しい対戦では、過去の棋譜と全く同じなものは無いのだが、膨大な記憶の中から類推して人間が打つ可能性のある手を選び出す。 ③機械学習:上記では人間の棋譜を学習するが、棋譜の数に限界があるので、コンピュータどうしで対戦して、その結果の棋譜を学習して、さらに精度の高い指し手を見つけ出す。 ①は囲碁のルールの範囲内で探索していくもので、コンピュータ囲碁の基本になる。②は過去の人間の行ったことのマネをする。③は①と②をベースにして、最適手をコンピュータが創造していく。③によってコンピュータは自分自身で自動的により強くなっていくことになる。 世界最高棋士の柯潔氏に完勝した時点で、DeepMind社はアルファ碁の引退を表明する。囲碁における人工知能としての役割は終えたとの判断なのであろう。 さて、松原氏の解説によれば、人間より強くなることは想定内のことであったが、柯潔氏に完勝した後に公表されたAlphaGoどおしの50局の棋譜が、人々に大きな衝撃を与えたという。それは人間の打ち方と全く違うものであったからである。その棋譜は下記に公表されている。 https://deepmind.com/research/alphago/alphago-vs-alphago-self-play-games/ 私もそれを見てみたが驚いた。私は囲碁は初級者であるが、例えば日曜のNHKの囲碁トーナメント対局を見ていて、おおよそ次の手がどこに打たれるかは半分くらいは類推ができる。ところが、AlphaGoの対局では全く予想ができない。打たれた石の意味も全く理解ができない。 人間の碁は、各所で起こる小さな戦いは一応の決着をつけてから次の戦いに移るのだが、AlphaGoは同時に各所で戦いを起こしてバラバラのまま進行する。見ているほうは何が何だかさっぱり分からなくなる。アタリはノビルとか、ノゾキは継ぐとか、ハネは切るとかごく基本的なところは分かるのだが、それ以外の戦略や意図が全く理解できない。(そもそも戦略や意図なるものが存在しているのかどうかも不明である。) コンピュータ囲碁に詳しい大橋六段は具体的には次のような指摘をしているという。①星に対しては早々に三々に入る。②石を安定させるヒラキがほとんどない。③序盤から石をすぐくっつける。 これらはすべて、囲碁の教科書では絶対に教えないことである。囲碁には棋理というものがある。人間の長年の経験の蓄積のもとに培われた囲碁の原理と理屈である。その棋理に反しても勝つというのだから何とも不思議なことである。 あるプロ棋士は「同じルールなのに違うゲームをしているようだ」と表現しているそうだ。 プロ棋士たちは、AlphaGoの棋譜を研究することによってさらに強くなろうと頑張っているそうである。違うゲームの研究をしなければならないとしたらこれは大変なことであるが、そういう余地の残されている囲碁というのもまた魔訶不思議なゲームである。 故・藤沢秀行名誉棋聖は「碁の神様が“100”わかっているとすると、自分がわかっているのは“6”だ。」と言ったという。天才棋聖の直感は当たっているのかもしれない。AlphaGoどうしの対戦を無限に続けていけば、コンピュータは残りの94%から可能性のある手を次々と見つけ出して、新しい棋理が出来ていくのかもしれない。(人間がそれについていけるのかどうかは分からないが)
(追記)私は1000円で買えるモンテカルロハイブリッド「銀星」と称する囲碁ソフトとiPad上で対戦して、中級のレベルで勝ったり負けたりしている。囲碁も初級、人工知能も専門外なので、上記に書いたことはシロウトの浅知恵で間違っているかもしれないので、その点はご容赦ください。

by sakuraimac
| 2017-07-21 11:51
| 科学技術
|
Comments(0)
|