データから世の中を捉え社会に役立てる。ビッグデータ時代におけるjeki移動者調査の役割とは。
相原健郎氏(国立情報学研究所)×大山浩之・菅原大二・小川直哉(コミュニケーション・プランニング局)

jeki 移動者調査 VOL.1

通勤や通学、買い物、旅行など様々な目的による「移動の実態」を把握するために、株式会社ジェイアール東日本企画(jeki)が3年ごとに実施する「jeki首都圏・関西圏移動者調査(以下、移動者調査)」。デジタルデバイスやIoT機器などから多量のデータが自動的に取得できるようになった今、なぜあえて“聴き取り”による調査が必要なのか。2019年版の調査設計を監修いただいた国立情報学研究所の相原健郎准教授を迎え、ビッグデータ時代における統計データのあり方や活用の可能性について伺いました。
※「jeki首都圏・関西圏移動者調査」のリリースはこちら

相原健郎(あいはら けんろう)さん
国立情報学研究所 コンテンツ科学研究系 准教授
東京大学大学院工学系研究科博士課程修了。博士(工学)。
情報工学の中でも、特に人間と機械のインタラクション、創造性支援などを専門とする。サイバーフィジカルシステム(CPS)における実世界からの情報獲得と、マクロおよびミクロでの分析、活用に関する研究に従事している。

人の「移動」を分析し、新たな気づきを提供する「jeki 移動者調査」

大山:jekiでは1995年より3年ごとに「移動者調査」を実施しており、今回で9回目の調査を行いました。もとは交通広告の指標とするデータの取得を目的にスタートしましたが、現在は目的も活用法も変化し、何より世の中側が大きく変わってきたことを強く感じています。様々な技術的な進化もあってビッグデータのような大量データの取得も容易になり、特に「位置情報」の精度は恐ろしいほど高くなりました。そうした状況下で、統計データとして「移動者調査」もいっそう精度を高めていくべきなのではないかと考え、情報技術の専門家であり、先進技術を活用して人の行動を研究されている相原先生に監修をお願いした次第です。

相原:今回の監修においては、私自身も本当にいろいろな気づきを得ることができました。実は数年前に移動者調査データで、「街の集客力」を分析したことがあったんです。人には移動する目的があり、長い時間を要してでも行くような集客力がある街もあれば、逆に通過されてしまう街もあるわけです。そうした「移動」からそれぞれの街の魅力を導き出し、街づくりに役立てようと考えました。そこで改めて感じたのが、「移動」には人々の強い意志が込められているということです。それを調査し、統計データとするまでに様々な工夫や苦労があったことを改めて知りました。

大山:今回、相原先生に調査設計の監修をご依頼したのも、まさに我々がいうところの「移動」というニュアンスや価値をご理解いただけると感じたからです。
先生のご研究は「移動」を対象に、実社会に役立つことを意識したアウトプットに取り組まれていますし。

相原:そこは強く意識していますね。私の専門分野は情報技術なのですが、「おまえは何者だ」と問われれば「工学者」と答えています。人が役立つものを作り出す技術に関する学問が工学であり、人々の生活・幸せ・豊かさにつながる技術をつくることが仕事なのだと。テーマとしては「創造性支援」を掲げており、たとえば、人は自分を客観視することがとても苦手ですが、自分を外から顧みることができれば、自分に足りないものや欲しいものなど“気づき”を得て、創造的な行動に結びつくのではないかと考えています。

菅原:自分の姿を知り、新しい気づきを得て新たな行動を起こすために、自身の記録を取って分析するというわけですね。それも個人だけでなく、組織や社会も含めて。

相原:そうです。近年ではスマートフォンが大活躍で、一人ひとりのデータを分析して、その上で次に欲しいものまで予測してリマインドまでしてくれる。もしかすると自分では忘れていたものまでリマインドされるかもしれません(笑)。いわばデジタルで自分の内面を映し出す鏡をつくるようなものです。その対象が個人から集団へと広がれば、社会全体を映すこともできるでしょう。そのようにしてミクロから持ち上げて、抽象性の高いマクロ的な世界も捉えられたら…と考えているわけです。

注意すべきはデータの偏りと実験者バイアス

小川:データから社会の状況を捉えようとしたときに、最も意識すべきなのはどのようなことなのでしょうか。

相原:「このデータ、この分析で本当に社会を正しく捉えることができるのか?」ということでしょうか。ビッグデータ時代といわれ、様々なデータが取得できるようになり、分析やビジュアライズも簡単にできるようになりました。そうやって分析したものも、テレビなどで取り上げるとすごく説得力があるんですよね。「すごい!世の中はこうなんだ!」と思わせる力がある。しかし、それが本当に社会を正しく反映しているかどうかはわかりません。データの多くは偏っており、偏ったデータを分析してもやはり偏った姿にしかならないことが多いのです。

大山:たしかに。たとえば、ひとくくりに「スマートフォン」といいますが、使われ方は世代によってずいぶん違ったりします。そうした場合に、スマートフォンの情報だけで「旅行における行動」を分析しようとしてもデータ自体が偏っているということですよね。モバイルのGPSしかり、SNSのデータしかり…。

相原:ええ、さらに分析結果についてもデータの偏りを考慮できているかが問われることになります。研究者は基本的にデータから「有意でなかった」という結果が出ても“事実”として許されるのですが、インパクトのある結果を求められるプレッシャーがかかることもあります。そのときに意識的または無意識的に「こういう結果を出したい」と思って分析すると、期待通りの結果が出やすくなるのです。「実験者バイアス」というのですが、その結果をもとに根拠が薄いことを口にしてしまうわけです。学術研究の世界では、誰でも再検証できるよう、分析データや分析に使用したプログラムを全てオープンにすることが求められるなど、様々な対策が講じられています。しかし、企業などではなかなかそうもいかない場合もあるのではないでしょうか。

菅原:データの取得が容易にできるようになったことも背景にありそうですね。

相原:それはありますね。データが簡単に手に入るし、AIの開発も進んでいますし、分析ツールも手軽でビジュアライズが簡便にできるものが増えてきました。データを活用しやすくなったということはとても良いことですが、弊害も少なからずあります。データを拾って分析し、面白そうな結果が出たら、魅力的なビジュアルとともにパッと発表してしまう。たとえそれが偏ったものでも、インパクトのあるものは拡散しやすいですから。

大山:広告やマーケティングの世界にいる人には要注意な話ですね。ブレイクスルーのアイデアや仮説をひねり出したい気持ちは、誰しもありますから。

相原:何か結果を踏まえて仮説を出したいのなら、「ある条件のもとで」という但し書きが必要です。そして当然ながら、分析してもいいデータなのか、出典はどこかを明らかにしなければなりません。データを分析する人が一歩引いて「どういうことを自分がやっているのか」という感覚を持つことが、実は一番重要です。知識やスキルはもちろんですが、倫理観や社会常識、実感と照らし合わせて理解できる感覚が欠かせません。
気をつけたいのは、データの代表性や分析の正当性、前提などをなおざりにすると、ミスリードにつながることです。

大山:数字は怖いですからね。

相原:だからこそ、根拠となったデータの出処や分析・解析の正当性を、真面目に1つずつ確認していくことが重要だといいたいのです。

偏りを知るために不可欠な統計データのあり方とは

大山:データの出処や分析・解析の正当性という意味で、「移動者調査」の精度を高めるべく、2019年では相原先生の監修のもと様々な改善を行いました。

小川:調査エリアの区分も悩ましいですよね。首都圏や関西圏をどのように区切るか。かつては住民基本台帳で市町村ごとに1,000地点10人ずつで1万人という設計をしていたんです。それが調査会社が管理している調査パネルに変わったため、バランスをとれるようにと考えたのが東京駅から70km圏の同心円を圏距離でカットする方法でした。ただ、はたしてそれで良いのか確証を求めていました。これについては、相原先生に、人の行動圏や経済圏で区切ってはどうかと示唆をいただきました。

相原:人の行動を塊で捉えると、たとえば、北九州と下関は一塊に見えるでしょう。この2つのエリアは県も市も違うし、本州と九州で全く違うエリアなんですが、経済圏としては同じ。広島と松山とか、岐阜と長野の県境もそういうところがあります。おそらくここにビッグデータを使うと、実際の塊ごとにクラスタが分かれていくと思います。そう考えると、統計データのエリア設定にビッグデータを活用するというような考え方は、今後有効かもしれませんね。

菅原:調査サンプルについても、これまでは中学生以上の12歳から69歳を対象としていましたが、高齢化が進む中でシニア層の移動も重要と考えて、前期高齢者にあたる74歳までに対象年齢を広げました。回答される方は、電車の遅延など意外と細かく回答してくださるので、チェックは大変でしたが、ありがたかったですね。他にも、直通運転など電車の乗り入れが増えていますので、複雑な鉄道網をどう区切ってデータ化するか、毎日路線図とにらめっこでした。

相原:いろいろご苦労されていて(笑)。まさにデータが容易に取得・分析できる時代だからこそ、統計データのブラッシュアップはとても意味のあることだと思います。世の中の実態を正しく反映するデータは重要ですが、自分たちが求めるドンピシャなデータは存在しないものだったりします。手に入れようとすれば、コストと手間暇をかけてつくらざるを得ない。「移動者調査」もそれに相当するものだと思います。ただ、そうした「統計データ」があることで、知りたい人々の移動実態がわかると同時に、ビッグデータ解析に用いた場合には、解析結果がどれだけ偏っているかがわかるようになる。

菅原:いわゆる統計データと解析結果との突き合わせは、普段のご研究の中でも行われるのですか。

相原:もちろんです。しっかりと調査されたデータと、自分たちのデータを突き合わせて偏りを確認することは必ず行っています。それによって自分たちのデータにかかっているバイアスをあぶり出し、その分を加減して分析結果を見るわけです。

大山:先生の2017年の論文※1に、「データの諸元を整理して把握しておくことが、データ活用の大前提である」と、わざわざ項目を立てて書かれていたことが印象的でした。それだけ大切なことなんですよね。

※1 相原健郎「ビッグデータを用いた観光動態把握とその活用」2017年

相原:はい、近年の社会に対して警鐘を鳴らすつもりで書きました。前述のようにデータ活用が進む中で、偏った結果が独り歩きして、誤解を生むことも少なくありません。ビッグデータといっても、所詮全ての活動が正しく含まれている理想のデータではありません。位置情報にも偏りがありますし、当然ながらSNSなどではかなり偏りがある。その事実を踏まえつつ、データとして取られているものが世の中のどの部分を反映しているのか考えることが大切です。その上で、正解データや統計データなどを組み合わせて活用する技術が必要となるでしょう。そのとき、あまり科学的な言い方ではないかもしれませんが、データを見極める目や勘も必要なんです。

人の移動目的を含む移動データが、社会の動きを知るためのきっかけになる

大山:ビッグデータといえども完全ではなく、偏りを補正するためにも他のデータと照らし合わせていく必要がある。それなら、統計データとして「移動者調査」がどのように活用されるといいのか、どう役立つのか。
先生には、過去に移動者調査データで分析をお願いしたことがありましたが、移動者調査の印象や可能性をどのように感じられましたか。

相原:まず“移動経路とその利用した目的が一緒になっている”というのが大きな特徴だと思います。GPSでは移動経路や路線などは想像できても、その人の心の内はわかりません。たとえば外国人が成田空港から移動していく様子はわかりますが、目的や理由は不明ですし、SNSのツイートを分析しても完全には難しいわけです。一方、私が2014年に携わった訪日外国人観光客の調査は、行動の目的までしっかり取ったので、リアリティが全く違いました。同様に「移動者調査」も人の移動目的や理由が明確なデータであることが、強力な点です。

小川:位置情報はわかっても、何故そこにいるのかがわからないビッグデータがあって、その一方で移動経路や移動目的がわかる統計データがある。組み合わせると、世の中がよりわかるということですね。

相原:私たちは「グラウンドトゥルース※2」という言い方をするんですが、正解のデータ、実態のデータという意味です。もちろん「移動者調査」だけで事象を全て捉えられるわけではありません。しかし、代表性に配慮された移動者調査のデータであれば、ある条件下での実態を正解とみなして、機械学習に使用することで学習や分析が進み、実態をより深く広く理解し、的確な予測ができるようになります。
今後はGPSデータとスマホによる回答データを同時に取得することができれば、よりビッグデータとの連携において整合性が高まり、強力な正解データとして活用できるのではないかと期待しています。

※2 グラウンドトゥルース(ground truth)人工衛星や航空機などの観測データから地表の対象物を判読する際に参照される、その対象物の実際のデータのこと。正解データともいわれる。

大山:新しい手法や技術は積極的に取り入れていきたいですね。
「移動者調査」は統計データとして、もっともっと、人の行動や生活、想いなどを生き生きと捉えられるようにしたいと思っています。そうすることで、ビッグデータと組み合わせたときでもリアリティが増し、より有用な分析ができるようになるでしょう。

小川:先生のお話を聞いて、統計データとビッグデータというのは共存並列していて、お互いが補完し合うものだと改めて感じました。組み合わせ方によって思わぬものが見えてきたり、知りたかったことを明らかにしたり、様々な可能性が広がりそうです。

相原:ええ、基本的にデータというのは、そこで起きていることをいかに復元できるかということが重要なんです。自分が知りたいこと、感じていることを復元するのに必要なデータをどう取得し、どう組み合わせるか。センスが求められるでしょう。
私なら、たとえば、モバイルや車のGPSデータと「移動者調査」を突き合わせてマクロな社会の実態を捉えてみたり、目的を持って恵比寿に来た人がどう動くのかをミクロに掘り下げたりしてみたいですね。

菅原:専門家である先生に「移動者調査」の価値について聞けたことで、たいへん自信が持てました。

相原:「データで創造性を支援する」というのが、私が研究で目指していることです。
今回、調査設計の監修をさせていただきましたが、人の移動のグラウンドトゥルースを目指して「移動者調査」を育ててくださればと思います。

大山:はい、精進します(笑)。本日はありがとうございました。

jeki 移動者調査

「移動」という視点で様々な人々の生活の足跡を見える化し、マーケティング発想のヒントをつかむ。
jeki移動者調査から見る今をご紹介します。

>記事一覧はこちら

>記事一覧はこちら

  • 大山 浩之
    大山 浩之 コミュニケーション・プランニング局マーケティングソリューション部長

    前職では、トイレタリーメーカーのブランドAEや商品開発に従事。 1996年12月 マーケティング部(現コミュニケーション・プランニング局)入社。 マーケターとして、ブランド、広告、メディア等の戦略策定から調査まで幅広く担当。 2018年から現職。jeki移動者調査、メディアプランニング支援システム開発運用など。最後の晩餐に食べたいものは、銀座某老舗店の黒豚スペシャルカツ丼。

  • 菅原 大二
    菅原 大二 コミュニケーション・プランニング局 シニア・システム・プロデューサー

    前職では大手広告代理店の情報系システム開発に従事。 2000年1月 マーケティング局(現コミュニケーション・プランニング局)入社。 社内プランニング支援システムの開発・運用及び関連調査業務を担当。 jeki移動者調査(旧10,000人調査)は、2001年より担当し現在に至る。 最後の晩餐は、あったかいごはんとアサリの味噌汁、納豆・卵・冷ややっこ、焼き鮭。

  • 小川 直哉
    小川 直哉 コミュニケーション・プランニング局 シニア・メディア・ストラテジスト

    2009年jeki入社。交通媒体局を経て、2013年よりコミュニケーション・プランニング局に所属。アナリシスからストラテジー、エグゼキューションまで一貫したメディアプランニングを担う。jeki移動者調査は、2013年より担当。犬好き。最後の晩餐に食べたいものは、手巻き寿司。