データ・クリエイティブ対談【第5弾】言葉や意思決定は知能のほんの一部。 AI開発における、無意識に目を向ける意義。（前編）ゲスト：三宅陽一郎（ゲーム開発者）

2019.09.13

データ・クリエイティブ対談【第5弾】言葉や意思決定は知能のほんの一部。 AI開発における、無意識に目を向ける意義。（前編）ゲスト：三宅陽一郎（ゲーム開発者）

データ・クリエイティブの進化の在り方について、博報堂ＤＹグループ社員と識者が語り合う『データ・クリエイティブ対談』。第5弾のゲストは、ゲーム開発者の三宅陽一郎さんです。ゲーム内で使われるAIを開発している三宅さんに、ゲームにおけるAI、現実への応用、eスポーツの現状や今後の発展の可能性などについてうかがいました。聞き手は博報堂ＤＹメディアパートナーズの篠田裕之です。

篠田: 僕は普段、マーケティングおけるデータ分析業務をしているのですが、データ分析を効率化やターゲティングの目的のためのみに使うと、本来のデータの価値が非常に限定されてしまうのではないか、と感じます。一方、マーケティングに限らず、世の中には様々なデータ活用の場があり、目的も多様です。そこで多様なジャンルの方にお話をうかがい、マーケティングにおけるデータ活用の幅を広げたいと考えて本連載を初め、今回は三宅さんにお声がけさせていただきました。
近年のゲームにおけるAI活用は、現実世界に非常に影響を与えるものでないかと思います。仮想物理環境におけるオープンワールド型ゲーム内では、現実では検証が難しい様々なシチュエーションにおいて人がどのように行動するか、膨大な数でスピーディーに検証できますし、その結果を現実世界の課題に応用する、ということができるのではないかと感じています。
実際に、自動運転のAI学習において、まず仮想空間上で様々な道やシチュエーションを生成し、その中でAIが車の運転をして学習し、その結果をもとに、現実の道路における運転の学習をはじめる、ということが行われ始めているようです。仮想空間では、AIが苦手なルートやシチュエーションを重点的にスピーディーに学習することができるため、はじめから現実の道路で学習をするよりも効率が良いようです。このような仮想空間上での学習を現実世界に適用することが、様々なジャンルで起こっていくのではないかと感じています。
今日はお聞きしたいことが沢山あります。大きくはゲームにおけるAIとその課題意識をうかがい、そこからマーケティングに応用できるヒントを探りたいと考えています。
まず、最初の質問ですが、元々物理学専攻だったとうかがったのですが、そこからゲーム業界にすすまれたのは何故でしょうか。

三宅: 物理学の前に、数学を専門としていました。そのうちに「数学は抽象的なものだ」と感じるようになって、物理学で法則を見つけることに興味が移り、実験物理の中の加速物理、具体的には、衝突実験によるデータ解析を沢山していました。次に、今度は扱っている実験機器を作る側に回りたいと考えるようになって、工学系の電気の専門研究に移りました。
電気の研究では、ある電気のパルスを入れて、それに対して応答を得るということをやっていました。そこで学んだことをゲームのAIに応用出来るんじゃないかと考えるようになり、ゲーム会社に移りました。最初はゲーム内の敵ロボットのAIを作り、その後、味方や敵の挙動に関する様々なAIを作るようになりました。

篠田: ありがとうございます。マーケティングにおいて生活者行動や体験による感情を理解するために、カスタマージャーニーを考えることがあります。たとえば観光であれば「SNSで何気なく興味を持った、とある観光地について、検索して情報サイトを見て下調べして、旅行サイトで予約する。現地に着いたら、ここでご飯を食べてSNSに投稿し、周遊先でインスタに写真をアップする」といった代表的な体験の流れを想定します。
でもこれがかなり難しくて、生活者は、なかなか想定通りには、きれいに動かないんです。そもそも、無計画な行動も多いですし、今は、常時スマホから情報を得ることができ、状況に応じて突発的なプラン変更が可能です。
そこで、観光のはじめから終わりまでではなく、限定的なシチュエーション、たとえば店舗内の生活者導線を予測する際は、生活者一人一人の仮想空間上でのモデルを作って、それを群像として動かしてシミュレーションする、といったアプローチを試しています。

最近のゲームでは、ゲーム内のキャラクターはベンチがあると座ったり、一人でいるときはスマートフォンをいじったり、キャラクター同士で話し始めたり、といったことをしますよね。つまりゲーム内のキャラクターと物や環境の間でインタラクションがある。インタラクションという要素は非常に面白いと思います。キャラクターの感情のようなものをモデル化することではなく、キャラクターをとりまく、その場にいる人やものの環境に注目する、というアプローチですね。

三宅: キャラクターの知能を作るときに、「キャラクターの内部に知能のモデルがある」という考え方と、「キャラクターが見ている世界のイメージは、そのキャラクターの知能そのものである」という考え方があります。後者は例えば、お茶を見たら美味しそうと思ったり、机を見たら「物が置ける」と考える、といった具合です。ゲームではこの後者の方法を採ることが圧倒的に多くて、特に群衆の場合はほぼこのやり方をします。
飲み物を飲む、疲れたら座る、夜になったら出歩く、といった具合にゲームでは街にある物や環境のほうに情報を蓄積することが可能です。街の中にキャラクターのコントロールはほぼ100％そういった仕組みで実現しています。

知能は本来、“身体”を含んでいる

篠田: 大阪大学の石黒浩先生と平田オリザさんが、ロボットで演劇をやるというプロジェクトをされています。ロボットという感情がないものをどのように演出するか。ロボットに対して「ここでとても怒る」という指示はできないので、平田さんは、「2秒こぶしをにぎってそのあと上を見上げる」といった具合にプログラミングに近い非常に具体的な一連の行動の指示をされたそうです。このような演出はロボットに対してのみに限らず、人間の役者を演出する際にも平田さんが実践されている手法ということでした。一見不思議に思えますが、見ている人はそこに感情があるように感じ、心を動かされる。知能をどう捉えるかを考える際に、感情の動きよりも物理的な動き、インタラクションで考えることが、重要なのかもしれません。

三宅: ゲームでも、インタラクションではなく感情のモデルをキャラクターに入れる取り組みは何度も試しているんです。ただ実際にモデルを入れてみると、例えばキャラクターが感情的には怒っている場合でも、それがプレイヤーに伝わらなくて面白味がない、といったことが多々起こるのです。
何故かというと、ゲームではAIの感情の動きではなくて、プレイヤーの体験が重要だからです。実際にキャラクターが怒っているかどうかよりも、プレイヤーが「キャラクターが怒っている」と感じることの方が大事になります。だから、状況からキャラクターの行動を作ることが必要になる。ゲームの中で「仲間が死んだらそこに行って泣く」といったことは、感情ではなく行動そのものが重要になります。ユーザーはそれでキャラクターの感情を理解出来る。
もう一つ、知能を考える上でとても重要なことがあります。知能というと、どうしても「意思決定をした上で行動がある」と考えられがちです。でも知能には階層が沢山あります。その中で一番難しい内容が意識まで上って来ますが、大体のものは無意識に行動に現れます。自分がどんな仕草をしているか人間はほとんどわかっていないんです。
先ほど平田さんの演出についてのお話がありましたが、演劇って意識に上るものばかりで演技を構成するととてもおかしなものになる。無意識にする仕草を多く演じる必要があって、そういう意味で平田さんの演出方法は非常に納得出来ます。
ゲームAIについて考えるときもこれは同じで、意思決定が伴うような形で意識に上るのは言語化された抽象的なものだけにして、それ以外の剣で切られそうになったら剣で跳ね返す、といった行動は状況に即して無意識で行うように設定しています。

篠田: データ分析をしているときに、意識的な行動ばかりに目を向けていていいのかなと悩むときがあります。たとえば、ある商品のターゲットの行動を理解したい場合、購買直前の検索行動などが注目されがちですが、本当は日々の何気ない検索や動きに、その人らしさが表れているのかもしれない。今まで見落としていたデータの中に、人の特徴を理解する上で実は重要なものがあるのかもしれません。

三宅: 今はネットやSNSによって意識が“過剰化”していますよね。本来、身体を含めて知能なのです。脳型人間なんてことは実際にあり得なくて、身体との関わりの中で僕らは動いています。ネットは、言語的な、圧縮された意識だけを肥大化し、どんどん身体を置き去りにする。先ほどからお話しているように、言語は知能の中でも極めて最後に現れるものだし、社会性を帯びた記号でもある。単なる反射ではないので、時間を超越して思考出来る。つまりネットは止まった状態での思考の集まりなので、それが人間を完全に表していると考えてそこからAIを作ったりすると、凄く閉じたものになってしまうと思うんです。
人間をしっかり捉えるには、もっと下の階層を見ないと駄目だと思います。記号の中だけで、人間の小さい影だけを見ていても、「このときなんでこんな反応をしたんだ」という理由が分からない。本当はもっと大きな影から実態を掴まないといけません。

篠田: 僕らは人の膨大な行動データを見ると、それであたかもその人の多くを捉えたかのような気になってしまいます。でも今うかがったように、SNSはその人の一部でしかないし、GPSもその人らしさの一部でしかないんですよね。大量のデータを収集し、各データをIDで連携しても、やはり人間全てを網羅することはできない。データ分析の際に、何のデータを扱っているかの理解と同様に、何のデータは扱っていないのかを意識することが重要だと思います。たとえば検索行動を分析する際も、誰かと話しながら検索しているのか、テレビを見ながらなのか、そういった、検索データ自体には含まれていないシチュエーションや日常の中のインタラクションを含めて考えることが重要だと思いますし、ではそのようなデータをどのように収集できるか、シミュレーションできるか、を考えることも重要だと思います。
今興味があるテーマが“混雑”なんです。観光において混雑は大きなテーマだと思います。以前は観光客の位置情報データを用いて分析していたんですが、最近はそれに加えて統計データを元にエージェントモデルを作って、ものや人同士の距離感などからの洞察をするようにしています。

三宅: そういったマルチエージェントを使った手法は今とても流行っていますよね。シンプルな知能を付けたエージェントを沢山集めてシュミレーションする。駅の設計なんかをする際に効果的です。我々は“ソーシャルビヘイビア”と呼んでいるんですが、集団がどう見えるかを探求するために使います。パーソナルスペースを測ったり、人間は無意識で「同行している人が自分の背中を見てくれているか」を安全確保のために気にしていたりするので、そういったことを把握するにはとても有用です。
一方でソーシャルビヘイビアは社会的な話なので、“個人を知る”ということとはまたちょっと違ってくるのかなとも思います。エンタメに生かす場合は「個人の深い悩みまで知りたい」となるので、そのためには別の手法が必要ですね。

ゲーム作りはエンジニアリングの前にアートがある

篠田: 個人を知る、というのはゲームで言うと、プレイヤーについて知るということですか。

三宅: プレイヤーと、ゲーム内のキャラクター両方に当てはまります。まずプレイヤーのログを取ることで、その人のエモーションを得たいというのがあります。「赤い色を見るとたじろぐ」、「いつも右から攻撃するから右利きだ」といった具合ですね。ゲーム内で緊張度のパラメーターを分かったりもします。ゲームの開発中には、プレイヤーの目線を追う“アイトラッキング”や、脳波の測定、汗の量を調べる“スキンコンダクター”などを使うことがあって、それによってプレイヤーの緊張度が分かるんです。ボスが出たら汗が出ているかを見て、必要な緊張度に達していないと判断したらフィードバックをかけて、より汗が出るように作り替えていきます。
そもそもゲームはユーザーエクスペリエンスを作るためにあります。以前はこれを勘で作っていたので、勘の良さは優れたゲームデザイナーの条件であり、人をおちょくるのが好きな人は優れたゲームデザイナーだったんです（笑）。近年は生体データと統計情報が取れるようになったことで、どこでユーザーが緊張しているか、ボスにやられているか、といったことが分かるようになり、これがゲームデザイナーの意図通りだったかを確認出来るようになったんです。

篠田: 生体データを正解データにしながら、ユーザーのプレイログを分析して体験を設計していく、ということですね。観光などのジャンルにも応用できそうです。
三宅さんの講演をうかがっていて思ったのですが、ゲームを開発する際に、そのタイトルごとに課題を設定して臨まれているんですか。

三宅: ゲームはアートとエンジニアリングの融合です。まずアートであるので、ユーザーエクスペリエンスが新しくなくてはいけない。僕が扱うのはキャラクターがどういう知能に見えているかという部分なので、プレイヤーにとってキャラクターがこれまで見たことのない姿で頭に浮かばなくてはいけないんです。この部分について、海外は特にエンジニアリングにシビアで、新しい体験のために新しい技術が入っていることに価値を置きます。日本の場合はそこが少し違って、仮に技術がこなれたものであっても、体験自体が新しければいい、という考え方ですね。

篠田: なるほど。新しい体験を提示する、という目的は海外も日本も同じだけど、新しい技術にこだわるかどうかで違いがあるのですね。新しい技術でなくても、新しい視点・切り口・使い方で、新しい体験は提示できそうですね。

三宅: ユーザー体験という話でいうと、デジタルゲームは80年代はそれ自体が新しかったので、誰がやっても同じ体験を出来るのが良さでした。「この面やった？」「あのボス強かったよね」といったことをみんなで共有するのが楽しみでした。
一方で、現在はYoutubeなどで攻略動画などを見れてしまうので、「みんなが同じ体験をするなら他の誰かがやればいい」「なるべく自分ではやりたくない」という人が増えています。それに対応すべく今AIでやろうとしているのは、プレイヤーごとにちょっとずつ違う体験を出来るようにする、ということです。大きなストーリーは変わらないのですが、例えばある街から洞窟まで行く際に、プレイヤーによっては盗賊団に襲われたり、行き倒れている人から宝の地図をもらったり、といった具合に微妙にずらしていく。選択肢をちょっとずつ増やすだけでその組み合わせは何万何億通りになるので、ゲームを通してやった場合に一人として同じ体験をしていないことになります。そうなるとプレイヤーも楽しめるんです。必ずしもプレイヤーが心地よい必要はなく、ちょっと難しいくらいでよくて、それをプレイヤーが克服していくところに楽しみがあります。こういったコンテンツの出し分けのところにAIを使っているんです。

篠田: 最近は、ユーザーがゲームプレイ中の写真や動画をSNSなどで共有することが増えていますが、その内容は、昔でいうプレイヤーみんなと同じ体験の共有、ではなく、その人だけの体験の共有が多いと感じます。もちろん、昔ながらのゲームの進捗という共有もあると思いますが、それ以上に、レアなイベントや、プレイ中に起こったハプニング的なこと、面白いプレイ、すごいプレイが出来たとかいった、その人だけの体験をみんなと共有したい人が増えているのかなと感じます。

三宅: ゲーム内の写真は、それをどこかでゲーム内に使うようにすると効果的なんですよね。エンディングムービーに入れたり、主人公のキャラクターの部屋に戻るとその写真が飾ってある、といった具合に。そうするとプレイヤーはその世界を自分が作っているということを実感出来るんです。この場合、プレイヤーのパーソナルな体験を拡大するためにAIを使っていると言えます。

（後編に続く）

この記事はいかがでしたか？

送信

三宅陽一郎

ゲームAI開発者

京都大学で数学を専攻、大阪大学（物理学修士）、東京大学工学系研究科博士課程（単位取得満期退学）。2004年よりデジタルゲームにおける人工知能の開発・研究に従事。理化学研究所客員研究員、東京大学客員研究員、九州大学客員教授、IGDA日本ゲームAI専門部会設立（チェア）、DiGRA JAPAN 理事、芸術科学会理事、人工知能学会編集委員。
著書に『人工知能のための哲学塾』『人工知能のための哲学塾東洋哲学篇』（ビー・エヌ・エヌ新社）、『人工知能の作り方』（技術評論社）、『なぜ人工知能は人と会話ができるのか』（マイナビ出版）、『＜人工知能＞と＜人工知性＞』（iCardbook）。共著に『絵でわかる人工知能』（SBクリエイティブ）、『高校生のためのゲームで考える人工知能』（筑摩書房）、『ゲーム情報学概論』（コロナ社）。監修に『最強囲碁AI アルファ碁解体新書』（翔泳社）、『マンガでわかる人工知能』（池田書店）、『C++のためのAPIデザイン』（SBクリエイティブ）などがある。
篠田裕之

博報堂ＤＹメディアパートナーズ
データビジネス開発局　

データサイエンティスト。自動車、通信、教育、など様々な業界のビッグデータを活用したマーケティングを手掛ける一方、観光、スポーツに関するデータビジュアライズを行う。近年は人間の味の好みに基づいたソリューション開発や、脳波を活用したマーケティングのリサーチに携わる。