おすすめ検索キーワード
“ 「富岳」×生成AI ”で生まれる技術革新や応用可能性 【理化学研究所計算科学研究センター 松岡 聡氏】
TECHNOLOGY

“ 「富岳」×生成AI ”で生まれる技術革新や応用可能性 【理化学研究所計算科学研究センター 松岡 聡氏】

ChatGPT の登場をはじめ、日進月歩で進化を遂げる「生成AI」。
インターネットやスマートフォンが社会を変革したように、生成AIも過去に匹敵するパラダイムシフトを起こし、広告やマーケティングにも大きな影響を与えると言われています。生成AIはビジネスをどのように変革し、新たな社会を切り拓いていくのか。

博報堂DYホールディングスは生成AIがもたらす変化の見立てを、「人間・社会の変化」、「産業・経済の変化」、「AI の変化」の 3つのテーマに分類。各専門分野に精通した有識者との対談を通して、生成AIの可能性や未来を探求していく連載企画をお送りします。

第2回は、日本が誇るスーパーコンピュータ「富岳」の総責任者でもある理化学研究所計算科学研究センター(R-CCS)センター長の松岡 聡氏に登場いただきます。 「AIの変化」をテーマに、「富岳」と生成AIの共創により生まれる技術革新や応用可能性などについて、生成AIも含めた先進技術普及における社会的枠組みの整備・事業活用に多くの知見を持つ、慶應義塾大学大学院政策・メディア研究科特任准教授であり、株式会社 企(くわだて)代表取締役のクロサカ タツヤ氏とともに、博報堂DYホールディングスのマーケティング・テクノロジー・センター室長代理の西村が話を伺いました。

松岡 聡氏
理化学研究所計算科学研究センター(R-CCS)センター長
東京工業大学情報理工学院・特定教授

クロサカ タツヤ氏
慶應義塾大学大学院政策・メディア研究科 特任准教授
株式会社 企(くわだて) 代表取締役

西村 啓太
博報堂DYホールディングス
マーケティング・テクノロジー・センター 室長代理
株式会社Data EX Platform 取締役COO

デジタルツインと生成AIの融合で「未来予測」が可能に

西村
松岡先生は現在「富岳」を使って「デジタルツイン」の構築に取り組んでおられますが、生成AIは「富岳」の中でどのような位置付けなのでしょうか。
松岡
デジタルツインとは、現実世界から収集したデータを使い、コンピュータの中に現実世界のコピーをつくり、かつ現実世界と関連づける技術です。コピーした世界では、現実には行えない実験が可能になるため、さまざまな社会課題の解決法を見いだすのに役立つことが特徴ですが、生成AIがデジタルツインにおいて期待されるのは「未来予測」です。その手段として考えているものは2つあり、1つ目は、物理(現実)の世界をコンピュータの中に再現していく「物理シミュレーション」と呼ばれるものです。物理シミュレーションはスパコンの中で最も大事な役割を担っており、それによってデジタルツインが構築されますが、生成AIが物理シミュレーションに貢献することで、さまざまな研究や産業育成、未来予測などに応用されていくだろうと考えています。

2つ目が、この物理シミュレーションを生成AIに置き換えたり連携したりといった、「新たなAIの開拓」です。生成AIそのものの研究というよりも、「サイエンスを行うためのAI」、つまり「AI for Science」を研究開発することで、これまでスパコンでシミュレーションしていたものを生成AIが未来予測してデジタルツインを形成したり、場合によってはその2つを連携させたりということを想定しています。

西村
これまではスパコンによる物理シミュレーションによって未来予測していたのを、今後は生成AIが未来を予測し、学習していくということになるのでしょうか。
松岡
そうですね。例えば、「今この瞬間に、海から聞こえる波の音を想像し、それを絵に描いてください」と伝えたときに、人間は実際にその光景を見ていなくても、ある程度は想像できますよね。これは波の様相を頭の中でシミュレーションしているからです。脳内で難しい物理方程式で計算をしているのではなく、頭の中のニューラルネットワークが視覚や聴覚情報を学習し、それを再現しているからこそ、波の音を想像して絵を描くことができるわけです。つまり、人間の頭の中ではすでにニューラルネットワークによるシミュレーションが行われているんですね。それをコンピュータでより大々的に、かつ生成AIがデジタルツインを作っていくという流れになっているのです。
西村
物理環境の予測だけでなく、社会課題の解決などにも、生成AIの未来予測は応用が可能なのでしょうか?
松岡
生成AIの大きなメリットの一つは、 物理シミュレーションよりも生成AIで行った未来予測の方が遥かに速いということです。例えば津波の予測であれば、これまで20分かかっていたことが、生成AIであれば1秒以内に予測が可能になる。それが正確なものであれば、すぐに津波警報を出すことができるのです。
西村
地震や津波といった災害時にすぐアラートを出せるのは、社会課題への新しい対応になりますね。
松岡
津波のシミュレーションはほんの一例に過ぎませんが、重要なのは生成AIが認識しているだけではなく、頭の中を想像して再現していることです。つまり、生成AIが人間の頭の中で想像される現象や言葉、または社会現象や物理現象といったものを“生成”していて、これがまさに生成AIの大きな特徴になっています。
西村
人間の頭の中で想像するものを生成していく、という観点では、言語だけではなく、画像、音、3Dなど多様な情報を学習し、生成していくことで生成AIがデジタルツインを構成していくようになるのでしょうか?
松岡
概ね合っていますが、そういった内容は「AIの古い捉え方」だと思うんですよね。例えば画像なら、その裏に何らかの物理的な背景があるわけで。世の中の森羅万象というか、そのような営みがあって、物が存在しているのです。しかし、生成AIを学習させるときにそれを“画像”と呼んでしまえば、ピクセルという単位でしか見ることができなくなり、物自体の情報量が失われてしまい非常にもったいないのです。これまでの「クラシックなAI」が適用されてきた分野を考えると、人や物が動くモデルは複雑すぎるため、AIが画像として認識するようなアプローチしかできなかった。しかしスパコンが進化すれば、単なる“画像”ではなくその背景の物理条件含めた“森羅万象”を学習することができる。その学習に基づいた生成もリアルタイムに再現できるようになる。
西村
我々生活者が使うChatGPTなど一般的な生成AIよりも、スパコンの方が格段にレベルの高い計算能力を持っているからこそ正確な未来予測が成立するのでしょうか。

松岡
実はそうではなく、ChatGPTの裏でもスパコンが動いているんですよ。GPT-4の場合は、”鉱山で採った原石を磨いて宝石にしていく”ように、最初は原石となる事前学習モデルを作り、その次にファインチューニング(※1)を行って磨いていくのですが、GPT-4ほどの高い計算性能を持つLLM(※2)の訓練というのは、「富岳」を1年間専有しなければ実現できないレベルなんです。海外のビッグテック企業などは生成AIの学習に特化したスパコンインフラを自社のクラウド内に持っていて、最先端の言語モデルを作るために莫大な投資を行っているわけです。
(※1)既存の 生成AI モデルを特定のタスクに適応させるために、新たなデータを使って追加学習させ全体を微調整すること。
(※2)Large Language Models:巨大データとディープラーニング技術によって構築された言語モデルで、人間らしい会話を高精度で行うことができる。

世界有数のスパコンがなければ大規模言語モデルの研究開発は不可能

クロサカ
GPT-4のようなLLMを実現するためには、「富岳」を1年間専有しなくてはならないというお話でしたが、スパコンの中でも世界最高クラスの計算能力を有する「富岳」を持ってしてもそれだけの期間がかかるというのは衝撃的です。

松岡
要するに、世界でトップクラスのスパコンを持っていないと、LLMの研究や開発はできないんです。だから一部の企業や組織の寡占状態になっている。技術的な観点で見ると、現在使っているGPT-3.5やGPT-4は、おおよそ数千億~1兆にのぼるパラメータ数(生成AIを作る際に必要となる学習データの変数の量)を持っていて、小規模な言語モデルとは比較にならないほどの高度な性能を誇っています。一方で、膨大なパラメータを学習させていくためには、相当な計算量やメモリ、データが必要になってきて、実際にそれらを持っていなければ、LLMを開発する土俵にすら立てない。加えて重要なのが、LLMを作るだけでなく、動かしていかなければならないということ。

例えば、GPT-3.5のパラメータ数は1,750億だといわれていますが、1パラメータ当たり1バイトとするとGPT-3.5を推論ですら動かすには175GBが必要になります。学習では色々な学習用のデータを保持する必要があるので、メモリ容量の要求はその一桁以上増えて数テラバイトになる。ところが、言語モデル用にコンシューマのGPUを買いに秋葉原へ行っても、せいぜい24GBぐらいまでのモデルしか売っていないし、増設もできないわけです。それに対し、学習用のプロ向けのGPUは100GB以上のものもありますが、一枚100万円から数百万円しますし、かつ、それらを複数枚スパコンの中に入れて超高速ネットワークで結合させる必要がある。つまり、本当に社会で使えるレベルのLLMは、普通の人が買えるような範疇を超えてしまっている。LLMはハイエンドなスパコン技術が裏側で完璧に支えていて、普通のクラウドとは全く次元の違うものになっていると言えます。

生成AIの“人間らしい会話”は偶然の産物

クロサカ
膨大なパラメータの“量”が、生成AIの回答の“質”を高めている点がLLMの特徴なのでしょうか。
松岡
おっしゃる通りですね。大規模なモデルであるからこそ、汎用性が実現できているわけです。現状、LLMを作れるのは世界のほんの十数箇所しかありません。それくらい膨大な計算量を有するネットワークを持っていないと、ChatGPTのような「人間らしい会話をする生成AI」は生まれなかったんですよね。そういう意味では、生成AIの「人間らしい会話」というのは、偶然の産物とも言えると思うんですよ。

逆に言うと、もっと多くの組織や企業がLLMを作れるようになっていたら、ひょっとすればSF映画に出てくるような人類を滅亡させるAIが生まれたり、犯罪を助長させるAIが世の中を脅かしたりしていたかもしれない。これは本当に偶然の産物以外、何ものでもないと言えるでしょう。

クロサカ
アメリカの科学雑誌(Scientific American)に、人間が言語認識をする際の仕組みとLLMは近しいようだというトピックが掲載されていました。これはまだ外部観測に基づく仮説に過ぎませんが、本当に人間の脳内の仕組みを機械が再現したのだとしたら、いわば脳を発明しているようなことでもあり、すごいなと感じています。
松岡
ニューラルネットワークの働きとして、そのような仮説が出てきたのは興味深いことですよね。人間と同じようなことが機械でも起きているというのは、科学的にも面白いことだと思います。この辺りは、理研で脳のシミュレーションの研究も行っていて、それがさらに進んでいけば、新たな発見や知見が見出せるかもしれません。

「AI for Science」から「AI for Business」へ

西村
日本で考えると、計算資源側においては「富岳」が世界トップレベルの戦いができている一方、生成AI側では完全に海外のビッグテック企業に後塵を拝していると感じます。今後の戦い方についてはどのように変わっていくのでしょうか。
松岡
現状、莫大にかかっているコストを下げないことには、我が国が海外のビッグテック企業などに対抗して数千億から一兆ものパラメータのLLMの直接の学習・開発をし、一般社会に普及させるのは大変難しいと思います。一方、コストが見合う分野であれば生成AIは有用で、実際、単価が高い産業・事業領域においては、生成AIが広く使われ始めています。しかし一般的な価格帯のビジネスサービスではコストが見合わず、生成AIの活用を断念してしまう。こうした状況のなか、やはりLLMにかかる根本的なコストを下げる必要性が生じていて、そのためには技術的イノベーションが求められています。

そこで、既存の「富岳」や「富岳」ネクストで取り組もうとしているのは、「AIによる科学」、つまり「AI for Science」です。AI自体の深化研究ではなく、「AIによる科学」を進め様々な科学分野の問題解決に適用してそれらの発展に寄与することで、科学的な発見とイノベーションを達成でき、そこで得られた知見や成果を実証していき、社会にインパクトを与えられるのはもちろん、民間のサービスとの連携を通して、生成AI市場における競争力を高めていく狙いもあります。そうした青写真があるなか、ブレイクスルーの鍵を握るのは、学習の方ではなく、生成AIによる生成、すなわち推論の高性能化、それに伴うコストの削減だと考えています。その技術をパートナーと組んで研究開発を行い、最適化させていくことで、大きなイノベーションを起こせるように尽力していく予定です。

西村
そのような取り組みを進めていけば、AIによる科学が、AIによるビジネス、つまり「AI for Science」から「AI for Business」へと広がってくるイメージですか。
松岡
そうですね。ビジネスで抱えているデータは言語データと数値などの非言語データがあり、むしろ後者の方が多い。しかしサイエンスでも、言語データ以外にもさまざまな観測データや科学データ、物理的挙動などを生成しているわけです。AI for Scienceで我々がもたらすブレイクスルーというのは、むしろ普通のLLMに閉じた生成AIよりもはるかに応用範囲が広く、実際にビジネスや産業に対して与えるインパクトが大きいと捉えています。

生成AIのブレイクスルーで肝になる「追加学習の自動化」

松岡
現状の生成AIは普通に学習させただけでは使いものになりません。学習したものを繰り返しファインチューニングしていくことで初めて使えるようになります。今のLLMは、正しい意見を言うように、変な思想を持たないようにと、色々な手法を使って人間が訓練しているんですよ。

西村
それゆえ、現状のLLMにおいてはファインチューニングで人手がかかっている部分が自動化できないということでしょうか。
松岡
そうですね。生成AIが学習した結果が正しいか否かは最終的に人間の価値観ですから、人間が介在して都度生成AIに再学習させる手間はなくなりません。しかし、刻一刻と変化するビジネス環境下では、完全な自動化はできなくても生成コストは下げていく必要がある。そこで、今後の技術的なブレイクスルーで肝になるのがさまざまな生成AIにおける「追加学習やファインチューニングの自動化」であり、その際に人間の代わりにファクトチェックする役割を担うのがスパコンです。ビジネス上の課題に対する生成AIの仮説が正しいのか間違っているのかを生成AIに教えていくことで、新たなデータを得た時の追加学習や、その後のファインチューニングに掛かる人的コストを下げ、結果として生成AIによる推論のコストを下げることができるのです。

生成AIの普及に欠かせないメモリ技術や基盤技術の高度化

西村
最後に、スパコンによる生成AIの進化が予測されるなかで、生活者やその暮らしはどのように変わっていくのか。松岡先生の見立てについてお聞かせください。
松岡
我々が生成AIの普及で重要だと思っているのが「メモリ技術」です。「富岳」はすでに優秀な計算技術を持っているので、生成AIによる推論の精度をいかに高めていけるかは、このメモリ技術にかかっていると言っても過言ではありません。日本の技術とアメリカの最先端の技術を融合させ、ブレイクスルーを起こすことができれば、高精度な推論によってさまざまな仕事のアクションが自動化される世界がくるでしょう。

知的労働というのはPDCAサイクルで成り立っていて、そのPDCAに要する時間や手間の多くを自動化し、効率化することが可能になるわけです。LLMや生成AIが人間の計画的な行動パターンを分析し、生成AIが自動でPDCAサイクルを回していく研究が出はじめていますし、これから人間が介在しつつも生成AIでさまざまなものが自動化されてくれば、人間は「思ったことをすぐに行動へ移せる」ようになります。

生成AIがスパコンで強化され、さまざまなアプローチを試みて、その結果を集約・分析して次のアクションを起こしていく。このようにPDCAサイクルを回すスピードが格段に向上することで、人間が思考に費やせる時間がかなり増えてくるでしょう。そうなれば、人間の創造性の爆発的な高まりも期待できます。

もちろん、生成AIの浸透には技術の高度化が必要になるので、我々はようやく入口に立った段階だと言えます。とはいえ、現状ではトップレベルのスパコンを持つ企業しか、先述したような完成度の高い生成AIは作れません。しかも、そうした企業がどこも頭抜けず、横並びになっているのは技術の限界点に達してしまっているからでしょう。そうなってくると、ベースのモデルは少数の企業しかできない代わりに、高性能のスパコンを持っていなくても比較的容易にできる「生成AIのカスタム化」に取り組む企業が増え、分野ごとにカスタムされた生成AIが普及してくるかもしれません。

sending

この記事はいかがでしたか?

送信
  • 松岡 聡氏
    松岡 聡氏
    理化学研究所計算科学研究センター(R-CCS)センター長
    東京工業大学情報理工学院・特定教授
    1963年東京都生まれ。東京大学大学院理学系研究科情報科学専攻。博士(理学)。専門は高性能計算機システム。東京工業大学学術国際情報センター教授などを経て、2018年より現職。スーパーコンピュータ「富岳」総責任者。2011年、2021年ACMゴードンベル賞、2021年情報処理学会功績賞、2022年紫綬褒章、C&C賞、スーパーコンピュータの最高峰業績賞である「クレイ賞」受賞。情報処理学会フェロー。
  • クロサカ タツヤ氏
    クロサカ タツヤ氏
    慶應義塾大学大学院政策・メディア研究科 特任准教授
    株式会社 企(くわだて) 代表取締役
    慶應義塾大学大学院政策・メディア研究科修了。
    三菱総合研究所を経て、2008年に株式会社企(くわだて)を設立。
    通信・放送セクターの経営戦略や事業開発などのコンサルティングを行うほか、総務省、経済産業省、内閣官房デジタル市場競争本部、OECD(経済協力開発機構)などの政府委員を務め、5G、AI、IoT、データエコノミー等の政策立案を支援。
    公正取引委員会デジタルスペシャルアドバイザー。
    Trusted Web推進協議会タスクフォース座長。
    オリジネーター・プロファイル技術研究組合事務局長。
    近著『5Gでビジネスはどう変わるのか』(日経BP刊)、『AIがつなげる社会』(弘文堂・共著)他。
  • 博報堂DYホールディングス
    マーケティング・テクノロジー・センター 室長代理
    株式会社Data EX Platform 取締役COO
    The University of York, M.Sc. in Environmental Economics and Environmental Management修了、およびCentral Saint Martins College of Art & Design, M.A. in Design Studies修了。
    株式会社博報堂コンサルティングにてブランド戦略および事業戦略に関するコンサルティングに従事。株式会社博報堂ネットプリズムの設立、エグゼクティブ・マネージャーを経て、2018年より博報堂DYホールディングスにて研究開発および事業開発に従事。
    2019年より株式会社Data EX Platform 取締役COOを務める。2020年より一般社団法人日本インタラクティブ広告協会(JIAA)にて、データポリシー委員会、Consent Management Platform W.G.リーダーを務める。