おすすめ検索キーワード
データ・クリエイティブ対談【第16弾】「目的」と「思い」がテクノロジー選択の基準となる  ゲスト:テクノコア 松尾公也氏
TECHNOLOGY

データ・クリエイティブ対談【第16弾】「目的」と「思い」がテクノロジー選択の基準となる  ゲスト:テクノコア 松尾公也氏

各界の識者を招き、広告ビジネスを越えたテクノロジーやデータ活用のあり方について対話する連載「データ・クリエイティブ対談」。今回は、長年テクノロジーメディアに関わりながら、独自のコンテンツ制作と発信を続けている松尾公也さんともに、テクノロジーと「人」や「思い」の関係について語り合いました。

松尾 公也氏
テクノコア 
テクノエッジ編集部 シニアエディター兼コミュニティーストラテジスト

篠田 裕之
博報堂
メディアビジネス基盤開発局

島野 真
博報堂
研究デザインセンター

亡き妻の声や姿を再現するプロジェクト

島野
対談コンテンツ「データ・クリエイティブ対談」は今回で16回目となります。今回は、「テクノエッジ」編集部 シニアエディターとして活躍している松尾公也さんをお招きしました。松尾さんはテクノロジー領域の編集者・ライターとして活躍される一方で、近年は生成AIの可能性に注目。2023年には「AIアートグランプリ」にて、亡き妻のイラストや音声を使ったミュージックビデオ「Desperado by 妻音源とりちゃん[AI]」でグランプリを受賞されました。はじめに、松尾さんのこれまでの歩みをお聞かせいただけますか。
松尾
当時「マイコン」と呼ばれていた個人向けのコンピューターが登場したのは、僕が大学生の頃でした。僕はそれ以前からシンセサイザーを使って演奏をしたりしていたので、コンピューターを使って音楽をつくってみようと考えました。今でいうDTM(デスクトップミュージック)です。

大学卒業後は、ソフトバンク(当時は日本ソフトバンク)に入社していくつかのPC雑誌に携わったのちに、ウェブ媒体の立ち上げなども担当しました。それ以来、テクノロジーメディアに関わりながら、記者や編集者の立場で最新のテクノロジーに触れ、それを紹介していく活動をずっと続けています。

島野
「妻音源とりちゃん」のプロジェクトを始められたきっかけは何だったのでしょうか。
松尾
妻は、結婚する前から私の音楽づくりのパートナーでした。2007年に初音ミクが登場してボーカロイドに注目が集まり、その後YouTubeやニコニコ動画で誰もがコンテンツを発信できるようになってから、僕たちもボーカロイドを使ったりしながら一緒に音楽をつくって発信していました。その妻が、がんで他界したのは2013年でした。彼女はたくさんの音楽トラックの断片を残したので、それを組み合わせて曲やミュージックビデオをつくろうと考えたのが「妻音源とりちゃん」を始めたきっかけです。
島野
生成AIを使い始めたのはいつ頃からですか。
松尾
最初に使ったのは、2022年に公開された〈Midjourney〉でした。しかし、それを僕のプロジェクトに役立てることはあまりできませんでした。僕がやりたかったのは、妻の写真を増やすことです。数百枚の写真が残っていたのですが、そのほぼすべてをミュージックビデオに使ってしまい、新たに使える写真がありませんでした。そこで、既存の写真から新しい写真を生成したいと考えたのですが、当時の〈Midjourney〉ではそれが難しかったので、ほかの方法がないか模索しました。

そんなときに登場したのが、プロンプトから画像を生成できる〈Stable Diffusion〉でした。これによって、妻の写真をもとに新しい画像を生成することが可能になりました。さらに、生成AIのボイスチェンジの技術で、僕が歌った歌を妻の声で再現することも可能になりました。その方法でつくったミュージックビデオ作品をAIアートグランプリに応募したところ、グランプリを獲得することができました。そこから一気に注目していただけるようになりました。

生成AIで「その人らしさ」を再現するには

篠田
僕から松尾さんにお聞きしたいテーマは、大きく3つあります。1つ目が、「その人らしさとは何か」というテーマです。

僕は広告会社におけるデータサイエンティストという立場で、テレビ番組制作や観光プロモーションにAIを活用する仕事に取り組んでいます。直近では、過去の名作テレビドラマを生成AIを使ってリメイクするというプロジェクトに携わっています。架空の人物を用いる動画生成とは異なり、多くの方がご存知の俳優が出演しているドラマを生成AIを用いて再解釈・再構築するというプロジェクトです。ただ、当時のすべてのフィルムが残っているわけではなく、画質も限られているという制約がありました。
その際に、「その俳優らしさ」あるいは「劇中のキャラクターらしさ」をどのように表現するかが非常に悩ましい課題でした。今や現実と見違える映像を生成することは容易になりつつあり、〈LoRA〉や〈Character Reference〉を使えば、動画内における人物の一貫性はある程度保たれます。しかし、誰もが知っているような俳優の表情やしぐさを違和感なく再現するのはとても難しいと感じます。つまりリアルではあるけれどその人・そのキャラクターらしくはない、ということです。松尾さんは「奥様らしさ」をどう再現されているのでしょうか。

松尾
そこはゆるめに考えていますね。僕は「妻は異世界にいる」という設定で作品をつくっています。だから、再現する妻の顔や体が生前の妻とは多少違っていても、あまり気にしません。とはいえ、やはりこだわりたい部分はあります。小鼻のふくらみとか、首のしわとか、そういう細部が気になることもあります。

また、あまり平均的な表情にしたくないという思いもあります。生前の写真を見ると、撮った場所やシチュエーションによって顔はかなり違って見えます。しかし、平均的な画像を再現しようとすると、その違いがなくなってしまいます。最近、〈Gemini 2.5 Flash Image〉を使うことで、そういった問題をある程度解決できるようになりました。

篠田
〈Nano Banana〉と呼ばれているツールですね。
松尾
そうです。それをほかのいくつかのツールと組み合わせることで、自分がイメージする画像を生成できるようになりました。ポイントは、よく撮れている写真だけでなく、あまり写りがよくない写真を使うことです。そうすると、「本人らしさ」がかなり増します。
島野
しぐさなどの動きの面で「本人らしさ」を再現する工夫はありますか。
松尾
ミュージックビデオをつくるときに一番難しいのはリップシンク、つまり口の動きと歌を一致させることです。そういう場合は〈Runway Act-Two〉を使うとうまくいく場合が多いですね。
篠田
「妻は異世界にいる」というお話は、たいへん興味深いと感じました。というのも、そういう設定にすると、厳密に全体として類似しているかではなく自分のこだわりたいポイントにおいて類似していれば良いと割り切ることができるからです。その結果、より印象的なアウトプットとなるのかもしれません。類似性以外の質感などでもこだわるポイントのフォーカスが重要で、最新のテクノロジーを使った滑らかな動きや解像度の高い生成が必ずしも正解ではなくて、「味」や「ニュアンス」のようなものが必要になる。そこに創意工夫があるということなのだと思います。

松尾
おっしゃるとおりです。画像の解像度が高すぎたり、画面がきれいすぎたりすることが違和感になることはよくあります。その場合は、動画編集ソフトなどを使って、あえてノイズを入れたりしています。
島野
たんにアウトプットのクオリティを上げるということではなく、つくりたいものの背景にはっきりした狙いや思いがあれば、どのようなテクノロジーを使えばいいかもおのずと決まってくるのでしょうね。

GPSデータによって思い出が可視化される

篠田
お聞きしたい2つ目のテーマは「データの使い方」です。「妻音源とりちゃん」の制作には、写真、イラスト、音声など、奥様が残されたさまざまなデータを使われています。そういった貴重なデータがあるからこそ、生成AIを使って優れたアウトプットを生み出すことができるわけですよね。

一方、「その人らしさ」を再現するには、例えば生体データや、どのようなものを食べているかといったデータもかなり役立つと僕は考えています。最近僕は〈FreeStyleリブレ2〉というセンサーを腕につけています。

松尾
僕もつけていますよ。
篠田
奇遇ですね! これは皮膚下に針を刺して血中のグルコース濃度をリアルタイムでモニタリングできるセンサーで、その人に合った食べ物や食べ方を把握することができます。このようなデータはたとえば僕自身を生成AIで再現する時にユニークなポイントとなるかもしれません。松尾さんは、像や音声以外のデータで着目されているものはありますか。
松尾
GPSデータが人生のすべての場面に紐づくのが理想だと思っています。最近だと、スマホで撮った写真にはGPSデータが残りますよね。それがあると、この写真はどこで、いつ撮ったかということがすべてわかるので、いわば思い出を視覚化できるようになります。
篠田
GPS行動履歴を解析すれば、写真撮影の前後にどのような行動をしていたか、さらにはその背景としてどのようなことを考えていたかといったことも推察できますよね。
松尾
先ほど話に出た〈Nano Banana〉には、撮影された写真の数分前の画像、あるいは数分後の画像をプロンプトで指示して生成できる機能があります。写真を撮っているときは気取った顔をしていても、その3分後の画像を生成すると気の抜けた顔をしていたりします。そんなテクノロジーも「本人らしさ」の再現には大いに役立つと思います。
島野
一つの写真から過去や未来の様子を生成できる──。まるでタイムマシンのようなテクノロジーですね。

「何をやりたいか」という問いの重要性

篠田
最後に3つ目のテーマをお聞きしていきたいと思います。「最新のテクノロジーへのキャッチアップの方法」というテーマです。

僕は今、データテクノロジー部という部署のリーダーを務めています。メンバーは12人いて、週に1回の部会でそれぞれがテクノロジーに関する最新のニュースを持ち寄るようにしています。中にはニュースだけを見てもどのようなものなのかがわからないものも少なくありません。そういう場合には、実際にそのテクノロジーを試してみる必要があります。また、そのテクノロジーを使って何かをつくってみるという作業もよくやっています。

近年は技術進化のスピードがとても速く、最新テクノロジーにキャッチアップし続けるには情報収集と実践のサイクルが必要になるわけですが、松尾さんは、新しいツールが登場するとスピーディにそれを自分で試して、紹介されていますよね。なぜそのようなことが可能なのでしょうか。

松尾
範囲を限定しているからだと思います。僕がテクノロジーを追いかけている目的は1つしかありません。亡くなった妻を再現するということです。その目的に合致するツールに絞っているので、スピーディな動きが可能になっているということです。
篠田
時間は限られているので、やりたいことに合わせてキャッチアップの範囲を限定するのはとても実践的な方法論だと思います。その限定の基準になるのが、「自分がやりたいこと」ということですね。

新しいツールが出ると、いっときすごく流行したりしますよね。顔写真をスタジオジブリ風に変換したり、〈Nano Banana〉でフィギュア風の画像をつくったり。でも、多くの場合はそこで終わってしまいます。一方、やりたいことが明確にある人なら、そこから目的に応じて使い方を深めていくことができます。やりたいことがないと、新しい技術や流行に流されるだけになってしまう。それはとてももったいないことだと思います。

島野
生成AIなどのテクノロジーが進化すればするほど、「何をやりたいか」という問いの重要性が増すということですよね。そこにこそクリエイティビティがあらわれるのだと思います。
篠田
今日は、テクノロジーの使い方だけでなく、テクノロジーに向かい合う姿勢を学ぶことができました。松尾さんのプロジェクトはこれからも進んでいくと思います。今後どのような作品が生まれるのかとても気になります。これからの松尾さんの活動を楽しみに拝見していきたいと思います。

sending

この記事はいかがでしたか?

送信
  • 松尾 公也氏
    松尾 公也氏
    テクノコア 
    テクノエッジ編集部 シニアエディター兼コミュニティーストラテジスト
    1959年生まれ。MacUserやBeginners’ Macなど数々のMac系媒体の創刊編集長を歴任し、ITmedia NEWSの編集部デスクも担当。プライベートではガジェット楽器や音楽制作を趣味とし、MIDI誕生前からDTMによる音楽制作を妻と共に行う。妻の他界後は、妻との約束のもと、残された歌声を元にさまざまな楽曲やMVを制作。現在は生成AIを活用し、音楽や画像、動画などの制作活動を続けている。2023年「AIアートグランプリ」にて、亡き妻のイラストや音声を使った「Desperado by 妻音源とりちゃん[AI]」がグランプリを受賞。
  • 博報堂
    メディアビジネス基盤開発局
    データサイエンティスト。ビッグデータ、データサイエンスを用いたマーケティング戦略立案、メディア・コンテンツ開発、ソリューション開発に従事。データを用いたTV番組企画立案・制作、レシピデータ分析に基づいた食品開発、GPS位置情報データを用いた観光マーケティングなどの事例多数。データ/テクノロジー活用に関するセミナー登壇、執筆寄稿多数。単著に『となりのアルゴリズム』(光文社、2022)など。
  • 博報堂
    研究デザインセンター
    博報堂に入社後マーケティング部門に在籍し、通信、自動車、ITサービス、流通、飲料など数々の得意先の統合コミュニケーション開発他に従事。2012年よりデータドリブンマーケティング領域の新設部門でマーケティングとメディアのデータを統合した戦略立案の高度化、ソリューション開発、DX推進等を担当。2020年よりメディア環境研究所所長 兼 ナレッジイノベーション局局長として、メディア環境の未来予測他の研究発表を行う。25年より現職。