データビジュアライズがもたらす、多面的な議論の重要性
私は山口県岩国市生まれだが、岩国の日本酒、といえば、獺祭を思い浮かべる人が多いだろう。
特に近年は、杜氏を置かず、データ分析に基づいた独自の製造スタイルがメディアに取り上げられることが多い。しかし、先日、岩国の叔父の家を訪問した際、「岩国は、獺祭のほかに美味しい日本酒がある。金雀と日下無双だ。」と言う。もちろんこれは、あくまで叔父の主観であり、ほかにも良い岩国の日本酒はあるだろう。ちなみに金雀と日下無双は杜氏を置く従来型の製造方法だ。
獺祭の製造工程は、これまで杜氏が長年の経験と勘によって行っていた作業を、「データを取る」、「そのデータを可視化し人間が考察・解釈する」、「マニュアル化する」、ということを高度に行うことで代替した。しかし、この「データを可視化し人間が考察・解釈する」という過程には、気をつけなければならない点がある。データの可視化は、「シンプルに・メッセージを絞って・わかりやすく」、ということがよく言われがちだが、この「人間のわかりかた」に沿った「人間にとってのわかりやすさ」は、実は大きな制約かもしれないという点だ。第六感、センス、勘、などと言われるように、言語化できないが潜在的なルール、というものが、もし存在するとした場合、既存のわかりかたでは、重要な点を見落としてしまい、ミスリードしてしまう可能性があることになる。
杜氏に頼っていた工程をデータ化する試み(たとえば、獺祭)は先進的だが、その解釈・ルール化が人間的な理解に基づく場合、実はさらなる潜在的なルールが潜んでいる可能性がある。
一方で、杜氏の勘に基づく工程(たとえば、金雀、日下無双)は、言語化しづらいが精度が良いという点で、データ化されていなくても処理的にはAI的であるといえる。
工程をデータ化した上で、杜氏ではなく杜氏AIによって作られる日本酒、はできないだろうか。
とは言っても、まだ現状のAIは、人間との共創によって真価を発揮するものであるとするならば、データからの理解のとっかかりによって、人間の、わかりかた自体をアップデートすることが重要だ。その、わかりかたのアップデートを促すものとなり得るものがデータビジュアライズかもしれない。どういうことだろうか。
AIの代表格として最近注目を集めているdeeplearningは、精度が高い反面、なぜ精度が良いのか、どのように判断したか要因がわからないということがデメリットとして挙げられがちだ。しかし近年、"Grad-cam"始め、「deeplearningが画像中のどこを参照して判断しているかを、入力に対する出力確率変化の大きさを用いてヒートマップで可視化する」手法などが提案されている。これにより、「なぜ、そこをみているのかはわからないものの、この箇所を見てAIが判断した」という根拠は得られる。実はこのような、「わからないものはわからないままに、見えないものを見えるようにするデータビジュアライズ」がいま、求められる「わかりかたをアップデートする」方法ではないかと思う。
「わからないものはわからないままに」するビジュアライズとは、静的でメッセージが端的に示されたもの"ではない"。たとえば、インタラクティブで詳細なデータが示されたものである。よって、必ずしも明示的な解釈が生まれるものではなく、むしろ一見わかりづらい可能性すらある。もちろん、最低限の伝わる工夫、詳細を触りたくなるようなデータの見せ方の工夫はビジュアライズに必要である。その上で、より重要なことは、ビジュアライズを見る中で、
「なぜ、このようになるのか」、「ここはどうなっているのか」、といった議論を生じることだと思う。そのようなビジュアライズこそが、新たなわかりかたに基づく、新たなルールの発見を生むのではないだろうか。
私が手がけた事例として神戸市のデータビジュアライズを紹介したい。これは、神戸市観光サイトに導入したDMPで蓄積したデータを基にビジュアライズしている。各スポットにマウスオーバーするとDMPからの観光客の詳細情報を確認できるほか、どこで何時にどのような人が、AIが推薦した情報(赤色のエリア)と、AIからは推薦しないような逆張りの情報(青色のエリア)、どちらに反応したかを示している。このビジュアライズを通して、たとえば三宮などの市街地において、ナビゲーションシステムが、性年代、時間帯ごとにそれぞれ異なる観光スポットを効果的に推薦することができていたことに気づく。これは他のエリアと比較して、豊富なアクセスデータとともに目的ごとの多様な観光スポットが存在するという仮説にたどりつく。また、有馬温泉などのエリアでは、ナビゲーションシステムによって推薦された観光スポットではない、意外なスポットへ観光客が訪問していることに注目することも可能だ。有馬温泉は観光前の目的が「温泉宿」と明確で、過去のアクセスデータからは、人気・有名な温泉などへの訪問が集中していた。しかし、実際の観光中には、自分の知らない別の観光スポット情報を求めているためであるという仮説をたてることができる。さらに、例えば六甲エリアの観光客に、一足伸ばして有馬温泉に誘導するナビゲーションは、精度が高かったことをピックアップし、議論を深めることもできるだろう。
近年のフェイクニュースの事象に代表されるように、人間は端的なメッセージに惑わされやすい。だからこそ、加工した情報がミスリードとならないような工夫をするとともに、能動的に考える時間を与え、議論を起こし、多面的な解釈をもたらすデータビジュアライズを開発していきたい。
この記事はいかがでしたか?
-
博報堂DYメディアパートナーズ データビジネス開発局Python/R/SQLなど様々なプログラミング言語による、統計、機械学習を用いたビッグデータ解析全般を担当。特にDMPを用いたウェブマーケティング施策立案、および、データビジュアライズ業務に従事。