おすすめ検索キーワード
【知っておきたい「AI技術」最新事情②】 2020年代の「AI技術」の基礎知識 ~画像処理に関するAI技術はどこまで進んでいるのか~ 後編
TECHNOLOGY

【知っておきたい「AI技術」最新事情②】 2020年代の「AI技術」の基礎知識 ~画像処理に関するAI技術はどこまで進んでいるのか~ 後編

AI技術の基礎的な知識や最新動向、最新の事例などについて分かりやすく紹介する本連載(第一回目はこちら)。第二回のテーマは、画像処理に関するAI技術です。技術の現状と今後の展望について、AI技術について研究している博報堂DYホールディングス マーケティング・テクノロジー・センター(MTC)の木下陽介、熊谷雄介、青木千隼に聞きました。

前編はこちら

架空の人の顔をリアルに作れてしまう今話題のディープフェイクは使う人の倫理観が問われる

青木
AIの画像処理技術が具体的に世の中でどのように活用されているかをユースケース別にお話していますが、前編で取り上げた「自動運転」「カメラフィルター」「製品の異常検知」に続いて、四番目のユースケースはディープフェイクです。存在しない人間のリアルな顔や体の生成です。この技術が一般に広く知られたきっかけは、顔を交換するアプリが不適切な文脈で使われた事例でした。そのため良くない印象を持たれることも多いのですが、正しく使うと大きな効果を発揮する可能性もあると思っています。例えば、20年前の映画に登場した過去の役者の顔画像を用いて学習し、新しい映像に適用することで、過去の役者の顔のまま擬似的に新規カットを制作するなど、今となっては撮影できない映像の再現が可能です。
 架空のデータを生成する敵対的生成ネットワーク(GAN)という技術の応用先の一つが顔画像です。ひと目見た限りでは、十分に学習した GAN による出力は現実の人と見紛うほどです。このほか、顔の表情の動きを抽出して、別の人の映像の表情を動かす技術もあります。VTuberへの活用などがわかりやすい事例でしょう。
熊谷
ディープフェイクは不正な活用をどう防ぐかも大きな課題です。例えば、オンラインで本人確認を行うサービスでは、いかに本人ではない登録を防ぎ、本人による登録を受け入れるかが重要です。
青木
政治家の映像を使い、本人が話していないことを喋らせるなど、フェイクニュースを拡散させる悪意ある活用も考えられます。そのため、ディープフェイクを見抜く「ディープフェイク検出」の研究も盛んに行われています。

青木
最後のユースケースはOCR(Optical Character Recognition、光学文字認識)です。OCRは画像からテキストを抽出して復元する技術です。まず、画像の中のどこに文字が入っているかを検出し、それぞれの文字を認識します。
熊谷
OCRの要素技術としてノイズ除去があります。例えば1970年代の論文のPDFには、スキャンした際に黒い汚れのようなノイズが入ったものが沢山あります。そういったノイズを除去することで、文字の認識精度が高まります。

―OCRは以前からある技術ですが、AI技術によって認識精度が上がった、ということがあるのでしょうか。

熊谷
近年は精度が飛躍的に上がっていますね。商用ソフトに付属しているOCRの機能はかなり実用的なレベルになっています。対応する言語が増えているのも近年の変化ですね。アラビア語などさまざまな言語だけでなく、古典や古文書の認識も活発に研究開発が行われています。

自動化出来るところはAIに任せ、人間はクリエイティブに集中する

―ここまで画像に関するAI技術の現状、社会実装の状況についてお聞きしてきましたが、さらなる普及に向けて、どのような課題があるのでしょうか。

青木
計算の軽量化、高速化ですね。サーバーに送らなくても、エッジ(端末)で処理が出来るようにモデルを軽量化したり、今まで2段階で処理していたものを1段階で終えることで処理スピードを向上する、といったことが挙げられます。たとえばエッジ処理については、高価なGPU(画像処理プロセッサ)を潤沢に搭載したマシンを前提とするのではなく、汎用的なスペックのPCやスマートフォンでもAIが満足に動作できなければなりません。
熊谷
高精度な予測のために複雑な数理モデルを作る場合、気を付けないとすぐモデルサイズがとてつもなく大きくなってしまいます。ですので、従来の数百分の1のサイズにモデルを圧縮しつつ遜色ない精度を実現する「モデル蒸留」と呼ばれる研究がここ数年の流行です。
木下
AIに学習させるデータが多ければ多いほど性能がが改善することは分かっているのですが、データを沢山使うと保存や処理にコストがかかります。これをどう低減するかも大きな課題です。

―博報堂DYグループとしてはこの分野でどのようなことに取り組んでいますか。

熊谷
画像や動画、マルチメディアに対してAI技術に関連して近年特に取り組んでいるのは二つです。
 一つは、動画やテレビCMの効果測定です。博報堂DYホールディングスではどのテレビCMを見た際にどのような印象を抱いたか、といったことについて長年に渡り調査をしています。この調査結果とテレビCMの動画素材とを組み合わせることで、「こういう動画だったら、こういう広告効果があります」という評価の予測が可能です。
 もう一つは画像広告の効果の予測ですね。画像広告の効果を測る指標の一つとして、表示された回数に対するクリック数があります。画像広告とクリック率の関係をAIに学習させることで、画像そのものからクリック率を予測できます。既存の広告に対しても、よりクリック数が増えるように文字などの要素をどこに配置すべきかの示唆が得られます。
木下
自動化出来るところは可能な限り自動化し、人間はクリエイティブワークに集中する、という意識です。
青木
こういった自動化をする志向する際の一番のネックにが、データを集める部分です。例えば広告制作のワークフローは非常にアナログであり、長い歴史の中でクライアントやチームごとに独自のルールが構築されていることが多く、データを中央集権的に管理することが難しいのが現状です。AI技術の下支えとなるデータ基盤の構築を遂行する際には、こうした現場のワークフローを尊重しながら、収集や格納・管理方法を適切に考えなければならないと痛感しています。
熊谷
人といい形で共存できるアルゴリズムを作っていきたいですね。博報堂DYグループには優秀なクリエイターやコピーライター、デザイナーなどクリエイティブな人材がいるので、クリエイターの知見とアルゴリズムの示唆が協調するモデルを実現したいです。
 気を付けなくてはならないのは、AI技術でプロダクトを作ったからといってすぐに会社の売上が飛躍的に改善するわけではない、ということです。クライアントから、「AI技術を使ったビジネスで売り上げを大幅に改善したい」といった相談をいただくことがあるのですが、GAFAのようなAI技術に強い企業も、過去の歩みを見ると非常に地道な改善を続けて今に至っていますし、データにもとづいて行った施策のすべてが成功しているわけではありません。我々も、一発逆転ではなく、地に足がついたAI技術の活用を考えたいと思っています。
青木
AIはどこまでいっても技術でしかないので、現実的な課題に適応するなど、地に足がついた取り組みは欠かせないと本当に思います。一方で、広告会社としてクリエイティビティが期待される場面があることもまた事実ですので、適切に技術をまなざし、活用しながら、世の中にないまさしく別解を打ち出していけるといいですね。
木下
博報堂DYグループの立場としては、そこを狙うべきでしょうね。クリエイティブとデータサイエンティストの間を繋いで、お互いがお互いを理解した上で同じステージに立てるような仕組みが作れればと考えています。そしてクリエイティブ自動生成を活用した新たな社会実装事例を世の中に投げかけたり、今後有るべきクリエイティブ業務のあり方実践していける環境を作っていければと思います。

sending

この記事はいかがでしたか?

送信
  • 博報堂 研究開発局 主席研究員
    博報堂DYホールディングス
    マーケティング・テクノロジー・センター
    開発1グループ グループマネージャー
    チーフテクノロジスト
    2002年博報堂入社。以来、マーケティング職・コンサルタント職として、自動車、金融、医薬、スポーツ、ゲームなど業種のコミュニケーション戦略、ブランド戦略、保険、通信でのダイレクトビジネス戦略の立案や新規事業開発に携わる。
    2010年より現職で、現在データ・デジタルマーケティングに関わるサービスソリューション開発に携わり、生活者DMPをベースにしたマーケティングソリューション開発、得意先導入PDCA業務を担当。
    2016年よりAI領域、XR領域の技術を活用したサービスプロダクト開発、ユースケースプロトタイププロジェクトを複数推進、テクノロジーベンチャープレイヤーとのアライアンス、共同研究も行っている。
    また、コンテンツ起点のビジネス設計支援チーム「コンテンツビジネスラボ」のリーダーとして、特にスポーツ、音楽を中心としたコンテンツビジネスの専門家として活動中。
  • 博報堂DYホールディングス
    マーケティング・テクノロジー・センター
    開発4グループ 上席研究員
    通信業界を経て2015年博報堂入社。統計的機械学習を用いた購買予測、メディアプランニング、シミュレータ開発、動画像広告の効果予測、データフュージョンの研究開発、実案件対応に従事。
  • 博報堂DYホールディングス マーケティング・テクノロジー・センター 開発1グループ テクノロジスト
    2017年博報堂入社。FMCG領域におけるマス/デジタルマーケティング業務に従事。2019年より現職、広告自動生成を中心としたAI,XR等先端技術のプロダクト開発、ID/データマーケティング領域におけるメディア企業とのアライアンス推進・ソリューション開発業務に従事。