« 自分自身を本当に勇気付けることができるのは、、、 | メイン | 犠牲者がなかったのは不幸中の幸い、、、それにしても前向き。。。 »

どこまで行くのか。。。

■新オプションで検索結果に20秒前のコンテンツも
グーグルとTwitterはリアルタイム検索で激突するか

 グーグルがリアルタイム検索で、また一歩 Twitterに詰め寄ったようだ。2009年10月1日、同社は9つの検索オプションを公開した。検索時点から1時間以内のコンテンツだけに絞り込むフィルタや、買い物関連情報を優先するフィルタ、書籍・ブログ・ニュースに絞り込むフィルタ、自分の過去のページ訪問履歴から、過去に訪問したページに絞り込んだり、逆に未訪問のページに絞り込むフィルタなどを利用できる。

 1つの注目ポイントはリアルタイム検索だろう。
google01.png 新しい検索オプションを使うと、最短で十数秒前の最新コンテンツが表示される

 これまで、5月に導入した検索オプションには時系列関連のオプションとして、

* 「Recent results」(最近の結果)
* 「Past 24 hours」(24時間以内)
* 「Past week」(1週間以内)
* 「Past year」(1年以内)

が選べたが、これに加えて、

* 「Past hour」(1時間以内)
* 「Specific date range」(特定の期間)

が指定できるようになった。例えば、ある語彙で検索し、直近の話題に限定したければ、「Search options→Past hour」と選択することで、過去1時間に作成、更新された検索結果のみを表示させることができる。特定の期間のページに絞り込むほうは、例えばある企業の2004年夏ごろのニュースを探したり、ある製品の発売日時を探している、といったケースで役立つ。ちなみに、日本語版にはないが、英語版の検索には “タイムライン”と名付けられた機能があって、横軸を時間、ヒットする件数を縦軸にしたヒストグラムを表示して、2004年→第3四半期→9月というようにドリルダウンしながら絞り込む機能もある。

timeline.png ヒストグラムを見ながら検索対象を特定の期間で絞り込んでいくこともできる

最短で十数秒前の新規コンテンツも表示

 やってみれば分かるが、リアルタイム性の高い検索は従来の検索とはかなり異なる。

 @ITらしい検索例(実は私自身の例でしかないが)で言えば、JRuby for Goolge App Engineのライブラリの対応状況について知りたいとき、ふつうに検索すると、いちばん良く情報がまとまっている解説や、初期リリース発表の情報がトップに出てきてしまう。ところが、JRubyのように開発が活発で動きの速い分野だと、こうしたページの情報はすでに古くなっているケースが多々ある。こうしたとき、1週間以内の情報に限定したり、「Recent results」で新しいものから順に並べることができれば、より直近の情報にアクセスしやすくなる。

 昨日ついに10万人規模のベータテストが始まった「Google Wave」で言えば、通常の検索と、リアルタイム性の高い検索の違いはもっと鮮明だ。

 TwitterでGoogle Waveを検索すると、1秒間に数件〜十数件程度のつぶやきがあって(2009年10月2日現在)、それが検索結果に加わっていくのが分かる。そして誰もがベータテストアカウントの招待を熱狂的に待っている様子も分かる。“人々の口の端に上る”というのがハッキリと視覚化されて興味深い。Twitterで多くの人がつぶやくようなネタでは、似たような情報(リンク)や個人的感想が多く、S/N比はかなり悪い。しかし、いずれこのリアルタイム検索が広告と結び付く可能性を考えると、そのポテンシャルは計り知れない。つぶやきの自然言語処理を行うことで、ポジティブ/ネガティブな発言を拾い出すこともできるだろう。また、もう少しニッチな情報であれば役立つつぶやきをしている人を見つけるのは容易だ。例えば私はいまLinuxカーネルの新しいスケジューラ「BFS」を Android端末に適用すると劇的に応答性が向上するという報告が気になっている。こうした「確かに速い」というような感想は、わざわざブログには起こさないかもしれないが、つぶやく人は多い(「bfs fast」でTwitterを検索)。これまでブログであれば、あるトピックについて2、3のエントリが目に付くところ、感覚的にはつぶやきはその10倍程度あって、これまで人々が画面の前で文字通りつぶやいていたようなことが可視化されているようだ。

 さらに、Twitter周辺ではTweetmemeのようにつぶやき情報を整理、分類した検索結果を提供するベンチャーが登場していて、この分野の可能性はまだまだ広がりつつある。Tweetmeemに類するサービスは、Scoopler、Collecta、Topsyなど雨後のタケノコ状態だ。
tweetmeme.png Twitterのつぶやきを整理して検索できるTweetmeme。つぶやき検索ではなく、よく参照されているリンク先を期間別、ジャンル別、つぶやき数の多さなどで絞り込める
scoopler.png Scooplerで検索するとTwitterのつぶやきがリアルタイムでAjaxで流れ込んでくる。右サイドには多くの人が言及しているリンクが一覧され、リアルタイム性と情報の重要度による検索をうまく両立させている

 通常の検索でGoogle Waveを調べれば、当然“本家サイト”や半年前の解説ページが出てくるだろう。グーグルはこうした検索でも、かなり前から“ユニバーサル検索”(検索クエリに応じて動画検索や地図検索などの結果も混ぜ込むこと)の一環としてニュース検索を上位に出すようにはなっている。このため、数日以内にニュースサイトが一気に報じていれば、それらニュースがトップに出てくるようなバランスの取り方はしている。しかし、Twitterのように最新情報が流れ込んでくるような新鮮さはない。

 一方、今回新たに導入されたオプションで1時間以内に限定すると、検索結果に「1分前、12分前、48分前……」というように、新鮮な情報だけが表示されるようになる。さらにここで「Sorted by date」(日付で並べ替え)をクリックすると、上位には数十秒前から1、2分前と、(必ずしも重要でないかもしれない)直近の情報が出るようになる。「Google」「wave」のような検索語であれば、少し間をおきながら検索ボタンをクリックするたびに結果が変わり、次々にWebの世界に情報が加わっていくさまが見て取れるほどだ。私が試した検索では最短で“16秒前”というページがあった。

そもそも“秒単位”は必要か?

 秒単位で更新される新しい情報や、その検索に意味はあるのか?そう疑問に感じる人が多いのではないか。グーグルのエンジニアたちもそうだったようだ。グーグル共同創業者のラリー・ペイジ氏は、この辺りの事情について、2009年1月にヨーロッパで行った会見でTwitterに対する見解を質問され、こう答えている(動画。ちなみに質問者はTwitterクライアントで注目されているSeesmicのCEO、ロイック・ル・マール氏。以下、翻訳は@ITの西村)。

 「人々はリアルタイムのものを強く求めていて、Twitterは非常にうまくやりました。われわれは秒単位で動かすという点では、比較的まずい仕事しかできていません。私はこれまで検索チームに対して秒単位の検索が必要だと頼んできたですが、『大丈夫ですよ、古くても数分前程度の話ですよ』と私を笑ったものです」

 「いやいや違う、それじゃダメなんだ、毎秒でないとダメだと言いました。今や(Twitterのおかげで)、彼らもそれを理解しました」(グーグル共同創業者のラリー・ペイジ氏)

 1月にこう答えて以来、5月に検索オプションを導入、さらに今回10月に「1時間以内」というオプションを追加してリアルタイム性を上げてきているというわけだ。

 ペイジ氏は、また情報の処理(おそらくランキング処理のこと)には時間がかかるもので、秒単位で出す検索結果は、数分の処理の後に出す結果ほど良いものにならないとしながらも、何が起こっていてるのかということについて、Twitter検索のように「感触」が分かるようにしなければならないのだと言っている。Twitter検索は情報検索という意味では雑音だらけだが、人々が何を考え、どう反応しているのかを眺めるという点では、きわめて有用な手段となる。それと同様のことを実現しようとしたのが、今回の検索オプションと言えそうだ。

 今回新たに加わったオプションでは、「1時間以内」を選択した段階では、上位には秒単位の結果は出てこず、過去1時間に登場した有力サイトの情報が上位に出て来る。ここでさらに時系列ソートをすると、(ホットなトピックであれば)上位に数十秒から1分程度のきわめて新鮮な情報が出てくる。上位に来るのはブログや掲示板などさまざまで、人々がどういう発言やアクティビティをしているのかが可視化される感じがある。20〜30秒おきに検索ボタンを押していると、そのたびに結果が変わり上位に新情報が加わるので、検索しているというよりもWebという世界の最新情報をリロードしている感覚に近くなる(日本語の検索結果はリアルタイム性がそれほど高くないので、試すなら時差を考慮しつつ英語でどうぞ)。

 Twitter検索に対する人々の熱狂を見て、リアルタイム検索を取り込みつつあるグーグルだが、当然両者には大きな違いがある。Twitter の個々の発言が個人的、あるいは小さなグループを前提にしたものが多いのに対して、グーグル検索の結果に出てくるのは、ブログや掲示板といった公的な場を意識した情報が多いという違いだ。両者の違いはきわめて大きい。端的に言えば、Twitter上のつぶやきのほとんどは、公的な場であるWebや現実世界に対して人々がリンクを張り、感想を述べるメタ情報といった感がある。もしこの対立軸が成立するのだとすれば、グーグルの検索がいくらリアルタイム性を上げていっても、Twitter検索とは異なる性質のままになるだろう。現に、グーグルの検索ではアカウント名でも入れない限り、Twitterのつぶやきが検索結果に出てくることは、きわめてまれだ。今後はどうか分からないが、今のところグーグルとTwitterが直接競合するということにはなりそうもない。

 リアルタイム性を取り入れるグーグルだが、Twitter検索のように本当の意味で秒単位となっていくかどうかは分からない。技術的制限はもちろん、ペイジ氏は、そうした秒単位の検索の価値について疑問を呈しているからだ。「誰もが秒単位で物事を見る必要があるかは分からないし、それが正しいモデルかどうかも私にはよく分からない」(ペイジ氏)。

通常の検索とリアルタイム検索はまったく別物

 よく観察してみると、今回導入された9つの検索オプション(フィルタ)は、利用目的が相反するために、統一的な検索方法では対処しきれないニーズに応えるもののように思える。

 例えば、ショッピング情報の優先/非優先というフィルタは、その相反するニーズを解決する。商品名検索にはレビューやスペックなど商品情報を求めている場合と、購入前の価格の下調べ、あるいは購入そのものを目的としたものがあって、これらは検索クエリからは判定しづらい。

 「訪問済み/未訪問」を区別するフィルタも、まったく相容れないニーズに対応するものだ。つまり、調べ物をしているときに検索クエリを工夫していると、何度も同じサイトをクリックしてイライラすることがある。そういうとき「未訪問」だけに限定したいというニーズはあるだろうが、現状、フィルタを用いた方法以外でそれをすることは難しい。

 まったく同様に、時間軸をある程度無視して、もっとも読むべきコンテンツやサイトを上位に持ってくる従来の検索と、リアルタイム性の高い検索は、相容れない。例えば数日以内の動向を知りたいときに、Wikipediaのリンクを提示されても困る。逆に何の予備知識もない状態では、リアルタイムの最新情報よりも、まず基本情報や基本サイトを提示してもらったほうがうれしい。

 ブログや掲示板、Twitterなど情報更新の容易なCMS、あるいはCGMの登場によって、Webの世界はリアルタイムコンテンツという大きな領域が登場しつつある。その領域を対象として、さまざまなベンチャーが新検索サービスを試みている。今回のグーグルのオプション追加には、このリアルタイム検索という新領域に対する検索の巨人グーグルの回答が含まれている。

[アットマーク・アイテイ]

ここから続き

Posted by nob : 2009年10月04日 23:48