■「推しアイドル」も「引っ越し先」も、グーグルは全てお見通し
特集:私の知らないネット上のワタシ(1)
「あなたの名前はタカオヤスアキ、男性で20代ですね。現在のご自宅の住所は東京都××区●●の▲▲というマンションで、以前住んでいたのは千代田区■■町の◇◇というマンションです。主に使っているクレジットカード会社は……」
プロフィルを言い当てられるたびに、記者(29)の顔はどんどん青ざめていく。パソコン画面越しに話しかけてくるのは、頻繁に自宅を訪れる親しい友人でもなければ、身内と行政以外では記者の個人情報を最も多く保有しているであろう、日経BPの人事担当者でもない。初対面の男性だ。米グーグルが保有しているデータを基にすれば、記者の個人情報や行動パターンだけでなく、秘密にしておきたかった趣味嗜好まで的確に把握できるという。
10種類のデータをグーグルから入手
過去数年で「データ資本主義」という言葉が当たり前のように使われるようになった。データを「21世紀の石油」に例える人も多い。グーグルや米アップル、米アマゾン・ドット・コムなど巨大IT企業は、保有するビッグデータを駆使して急成長を遂げている。米フェイスブック(現・米メタ)を含めたGAFA4社の時価総額合計は2021年7月に日本株全体を上回った。一方で消費者の立場からは、自分のデータがどのように収集され、GAFAなどに活用されているかが見えづらい。
ならば実験してみよう。グーグルやアップルから記者の行動履歴データを取り寄せて、ネット上の「ワタシ」がどんな姿をしているのか、専門家に分析してもらうのだ。協力してくれたのが、情報管理サービスなど手がけるデータサイン(東京・新宿)の太田祐一CEO(最高経営責任者)である。
冒頭のシーンの数日前、記者は太田氏にメールを送った。添付したのは「Googleデータエクスポート」というサービスを通じて取得したファイル。グーグルのアカウントを保有するユーザーなら誰でもダウンロードできる行動履歴データである。アカウントにログインした状態でアクセスすると、電子メールの「Gmail」や動画の「ユーチューブ」、地図や連絡先などグーグルが提供する40種類以上のサービスがずらりと表示される。記者は今回、その中から10種類のデータを入手した。データサイズは46.7MBと、高画質な写真数枚分に過ぎない。
「グーグルの履歴なら、これだけあれば十分です。初対面の私がなぜタカオさんの個人情報を類推できたのか、これから説明していきますね」。太田氏はビデオ会議システムで「種明かし」をするかのように語り始めた。
例えば住所は、2つのデータから類推できるという。まずは、グーグルのウェブブラウザー「クローム」や、スマートフォンOS(基本ソフト)「アンドロイド」で活用する「自動入力」機能のデータだ。もう1つは地図サービスの「グーグルマップ」。記者は普段、スマートフォンのGPS機能を極力使わないようにしている。アプリを起動したときのみGPSの作動を許可し、バックグラウンドでは「オフ」にしている。盲点だったのは、家を出る前や帰宅時に地図アプリを起動して目的地までの所要時間を調べるのが習慣になっていたこと。このデータを基にすれば、自宅の位置はもちろん、記者の行動履歴をかなり正確に把握できるというわけだ。
記者はもともと、20年3月までの勤務地だった東京・大手町の日本経済新聞本社から徒歩15分ほどの場所に住んでいた。ところが、新型コロナウイルス感染拡大に伴い在宅勤務へ移行。広さと快適さを求めて今年5月、都心から少し離れた東京・湾岸エリアのマンションに移り住んだ。通勤ルートを変更する目的で会社に転居届を出した記憶はあるが、グーグルに対して情報を提供しているつもりはさらさらない。でも、グーグルはそれをお見通しだったようだ。
妻との「おこもりステイ」、記者の目的地は?
「9月末には沖縄へ旅行に行きましたね」。太田氏は過去数カ月の目立った行動も次々と言い当てていく。9月中旬、高尾夫婦は仕事で疲れ果てていた。記者は「日本勢は「ガラゲー」か? ゲーム進化論」の取材・編集を進めつつ、「コロナ禍で消えた航空需要 ANA・JAL 苦闘の600日」の構想を練る。妻は勤務先で進めていたプロジェクトが山場を迎えていた。家庭内を漂う若干よどんだ雰囲気を打破しようと考えたのが、約2年前に妻と挙げた結婚式の会場である、沖縄県恩納村のホテル「ハイアットリージェンシー瀬良垣アイランド沖縄」での「おこもりステイ」だった。
「利用したのはANA(全日本空輸)ですね」。太田氏は畳みかける。1年半前から航空業界を担当するようになった記者は、取材の一環として可能な限り様々な航空会社を使うようにしている。9月の旅行を準備するにあたっては複数社を比較した上で、安い価格を提示したANA系のサイトで航空券とホテルを手配した。その事実を太田氏は、グーグル検索で使ったキーワードとウェブサイトの閲覧履歴から正確に見抜いた。
グーグルが抱える検索履歴は、利用者がどういう人物であるかを類推する格好の材料になる。例えば今年7月4日の午後5時頃、記者はグーグルで「銀だこ レシピ」と検索している。読者の皆さんの想像通り、記者は大阪名物のふわふわのたこ焼きよりも、ホットランドが展開するチェーン「築地銀だこ」のような外側がカリカリしたたこ焼きが好きなのだ。その後、レシピサイトにアクセスした記録も残っている。この事実を、記者はダウンロードしたデータを見るまで思い出せなかった。本人よりも正確に、グーグルは記者の生活パターンを覚えているのだ。
趣味嗜好がより際立つのが「ユーチューブ」の検索履歴だ。取り寄せたデータをのぞいてみると、なんと14年、記者が大学4年生だった頃の履歴まで残っている。当時ハマっていたアイドルグループ、「ももいろクローバーZ(ももクロ)」関連のワードがずらっと並ぶ。「15年頃からは私立恵比寿中学(エビ中)のファンになったようですね」。太田氏は「推し変(応援する対象の芸能人などを変えること)」の時期もズバリと言い当てる。
エビ中はももクロの「妹分」的な立ち位置で、同じ芸能事務所に所属している。アイドル界は例えば「ジャニーズ系」「AKB系」「坂道系」というような形で、所属する芸能事務所などごとに系統が分かれており、その中でファンが推し変していくことは往々にしてあることだ。そして記者も初めて訪れたライブでまんまと「エビ中」にハマる。そのライブが開かれた15年8月22日以降、ユーチューブの検索履歴にエビ中関連のワードが頻出するようになる。
太田氏が類推した記者の趣味嗜好は、グーグルは既にお見通しだ。記者が私物のアンドロイドスマホでよく閲覧する、お薦めの記事などを表示する「グーグルディスカバー」のヘッドラインには、エビ中関連の記事が大量に並ぶようになった。興味を持ちそうな見出しを表示しておけば、記者がクリックして広告収入につながるということを見透かしているかのようだ。
広告で年間2000億ドルの収益
グーグルは得た情報をどのように使っているのか。まずは利便性の向上だ。ネットで調べたい情報や、経路を検索したい目的地は人それぞれ。利用者が求める情報を提供するまでに必要な手間や時間を省ければ、グーグルを使う頻度が高まる。例えば「自動入力」機能を設けたきっかけは、利用者がいちいち自宅住所などを入力する手間を省くことにあったはずだ。
利用者が頻繁に使うほど、グーグルには多くのデータが蓄積されていく。居住地や旅行先、推しアイドルなどはほんの一例だ。同社はこうしたデータを解析し、ユーザーの属性や嗜好に合った広告を出していく。例えば引っ越し前後には家電量販店の広告を出したり、たこ焼きについて検索したらホットプレートの広告を出したりといった具合だ。
収集するデータが増えるほど解析の精度は高まり、ユーザーが「クリックしそうな」広告を出せるようになる。自動車メーカーからレストランまで、多くの企業がグーグルに広告を出す理由はここにある。親会社である米アルファベットによると、21年7~9月期のグーグル関連の広告収入は前年同期比4割増の531億ドル(約6兆円)。単純計算で年間24兆円規模の収益をグーグルは広告で稼ぎ出しているわけだ。
一方でグーグルなどGAFAの情報寡占に対する視線は厳しさを増している。米司法省は20年10月、反トラスト法(独占禁止法)違反の疑いでグーグルを提訴した。グーグルが米国のネット検索市場で90%のシェアを占めるなか、検索・広告市場での独占を維持・拡大するために、反競争的な手段を用いてきたとの指摘だ。欧州連合(EU)は18年に罰則規定を伴う「一般データ保護規則(GDPR)」を施行し、プラットフォーマーへの規制を強化している。
太田氏は「グーグルなどによるデータ寡占は安全保障上の問題だ」と指摘する。グーグルが本気でやろうと思えば、批判的な記事を書いた記者の自宅を特定したり、行動履歴を逐一監視したりすることも不可能ではないだろう。
そうした懸念を打ち消すためか、グーグルはプライバシー保護策を相次ぎ打ち出している。行動履歴を利用者が簡単に取り寄せられる「データエクスポート」などのサービスが、データに関する透明性を高める一助になっているのは確かだ。
ネット上の行動データは誰の物か。それを考えるヒントになるのが、アップルが最新OS「iOS15」に搭載した「Appアクティビティを記録」という仕組みだ。iPhone内のアプリがいつ位置情報やマイクなどのデータを活用したのか、アプリがどんなドメインと情報をやり取りしているかを、利用者が確認できる機能である。
このデータを分析してみるとGAFAだけにとどまらない、情報流通を巡るさらに根深い問題が見えてきた。特集「私の知らないネット上のワタシ」では次回以降、データ資本主義が作り出した新たな「鉱脈」の実情に迫っていく。
[日経ビジネス]