ボードゲームマイライフ

トライボーディアン勢によるオセロ囲碁将棋その他についてのブログ

ボードゲームとAIについて、オセロ、囲碁、将棋の例から考える①(Alphago)

※筆者はAIの専門家ではないので、下記の話には多分に感覚的、推測的な要素が含まれていることをご了承ください。

 

 

 

近年はAI=人工知能の発展が目覚ましいところですが、真っ先にAIの影響を受けたのがボードゲームの領域と言えるのではないでしょうか。

 

ボードゲームの攻略はAIにとって得意分野でしょう。おそらくそれは、

 

「ルールが決まっている」

 

という点によるところが大きいのではないかと思います。

 

将棋は王様を詰ませば勝ち、囲碁は陣地の多い方が勝ち、オセロは最後に石が多い方が勝ち、というルールが決まっていて動くことがありませんし、着手のルールもあらかじめすべて厳密に決まっています。

よって、AIは定まったルールに対して抜群の計算能力・記憶能力を全力投入することで、人間よりも圧倒的に速いスピードでそのゲームを極めることができてしまいます。

 

 

人間の実生活の中でAIを活躍させようとすると、より複雑な話になってきます。何が一番良い行動なのか、というのを決定する統一的なルールがないからです。

たとえば、「おいしい料理を作るAI」を開発しようとした場合、「おいしい料理」を定義することによってはじめて、AIはその目標に向かって邁進することができますが、何が「おいしい」のかって、人によっても違いますし、時間がたつと好みが変わったりすることもありますよね。そういうふわふわした要素を妥当に評価するということ自体非常に難しそうです。

 

このような課題に対して、AIは現在「ディープ・ラーニング」という手法を主に用いて挑んでいます。

ディープ・ラーニングは、AIに超大量のデータを学習させて、AI自身でデータをパターン化して評価値に落とし込み、人間の手を借りずしてAI自ら「進化」していくことにその特徴があります。

 

このディープ・ラーニングという手法を広く世の中に認知させたのが、2016年に韓国の囲碁トッププロであるイ・セドル氏と5番勝負を行い、4勝1敗と圧倒したAI・Alphagoの登場でした。

 

 

ボードゲームはAIの得意分野」とは言うものの、それは

AIがそのボードゲームのことを「完全に理解している」ということを意味しているわけではありません。

着手のパターン・分岐が多すぎて、AIの計算能力が追い付かず、完全解析は不可能と考えられています(少なくとも現在は)。

 

AIは、合理的な時間内に、最善手をしらみつぶしに調べ尽くせる局面であれば、完全な正解を100%導くことができます。たとえば、長手数の難しい詰将棋であっても数秒でいとも簡単に解いてしまいますし、オセロであれば30個空き前後の局面ならば、多少時間をかければ全分岐についてどちらが何石勝つかを調べ尽くすことができます。

 

一方、分岐が多すぎる局面、答えが定まらないと思われる局面において良い手を選択する能力、いわゆる「感覚」というものにかけては、AIは人間を超えることはできない、ということが長らく信じられてきました。

殊に囲碁というゲームについては、19×19という着手可能箇所の多さから、ボードゲームの中でも、人間にとって最後の牙城と考えられていました。

 

私が本格的に囲碁をやっていたのは2005年から2008年くらいにかけての期間ですが、当時は「コンピュータが人間のプロに勝つには100年はかかるだろう」というようなことが普通に言われていました。

囲碁漫画の「ヒカルの碁」にもそのような言及があるのですが、中国のトッププロであるヤンハイさんが「俺には100年もいらない」と啖呵を切って未来を語るという、現在の有様から考えると非常に印象的な描写になっています)

 

このように、ボードゲームはルールが決まっているにもかかわらず、AIにとっては依然としてふわふわした「感覚」の領域が残っており、ここをどのように克服していくかが、AIにとってのボードゲーム攻略のカギだったのです。

 

「100年はかかる」のような言説は、「感覚」の克服はAIの計算能力の飛躍的な向上によって成し遂げられる、という固定観念から来ていたと考えられます。

要するに、「しらみつぶしできる範囲を広げる」アプローチですが、このアプローチではAIが「感覚」の領域を克服できたかどうか疑問が残り、そうすると人間としても、読みのAIに対して感覚の人間だ、いい勝負だ、という言い分をかろうじて保持できたかもしれません。

 

しかし、前述のAlphagoは、ディープ・ラーニングという従来とは全く別のアルゴリズムを採用することにより、「感覚」の領域において、少なくとも人間を上回ることに成功したといえます。

Alphagoは自分対自分の対局を無数に繰り返すことにより対局データを蓄積し、「このような局面では黒が少し勝ちやすいらしい」というような一見ふわふわした評価を、数理的に高度な正確性・妥当性をもって下す能力を獲得したのです。

 

 

 

GoogleのチームによるAlphagoの開発は、「ルールが決まっているゲームのふわふわした領域を克服する」ことで、よりレベルの高い「ルールの決まっていない領域におけるもっとふわふわした事柄についての問題を解決する」という試みへのステップという位置付けであったものと思われます。

 

 

長くなってしまったので一旦このくらいにして、続編として、「人間を超えたAIと人間はどう付き合うか」ということについて、オセロ・囲碁・将棋の例から書いてみたいと思います。