レポート

《JST共催》知りたい×コンピュータ—「情報ひろばサイエンスカフェ」で「検索システム」を考える

2019.04.26

腰高直樹 / サイエンスポータル編集部

 多くの人が毎日のように使う「検索システム」。知りたい単語を入れて“虫眼鏡マーク”を押すスタイルはずいぶん昔から変わらないが、その内部の仕組みは少しずつ進化している。例えば、スマートフォンの検索窓に検索ワードを入力すると、ある頃から「合わせて利用されやすい検索ワード」が表示されるようになった。単語や固有名詞が少しくらい間違っていても、正しいものに置き換えて検索してくれるようにもなった。最近は音声による検索機能も精度が高くなった。かなり適当な検索ワードでも、それなりの情報を探しだしてくれる。

 「知りたい×コンピュータ〜情報検索技術がもたらす未来〜」と題した「情報ひろばサイエンスカフェ」が3月22日、文部科学省ラウンジ内で開かれた。講師は検索システムを研究する東京工業大学助教の欅惇志(けやき・あつし)さん、ファシリテーターはIT技術を利用したデザイン支援を研究する明治大学准教授の五十嵐悠紀(いがらし・ゆき)さんが務めた。普段はあまり意識せずに利用している検索システムに意識を向けるサイエンスカフェとなった。

情報ひろばサイエンスカフェ「知りたい×コンピュータ」の様子
情報ひろばサイエンスカフェ「知りたい×コンピュータ」の様子
講師の欅惇志さん
講師の欅惇志さん
ファシリテーターの五十嵐悠紀さん
ファシリテーターの五十嵐悠紀さん

使われるほど進化する検索システム

 欅さんによると2019年3月現在で、世の中にあるウェブページはおよそ56億ページ。サイト数だけでも16億を超えるという。この途方もない情報の山から、利用者が欲しいものを探し出してくれるのが検索システムだ。

 キーワードを入れて検索ボタンを押すとすぐに検索結果が表示されるが、もちろんこの間に何十億ものページを調べているわけではない。検索システムは、インターネット上のあらゆるサイトからあらかじめ情報収集(クローリング)をしておいて、データベースとしてまとめ上げ、いつ何を聞かれても答えられる状態にある。検索ボタンを押したときに表示されるのは、そのデータベースを元にした検索結果だ。あらかじめ収集する情報は古くなると使えなくなるので、定期的に情報を取り直して新鮮な状態を保っている。

検索システムは、ウェブ上からあらかじめ情報を集めたデータベースを作っておくことで実現している
検索システムは、ウェブ上からあらかじめ情報を集めたデータベースを作っておくことで実現している

 検索の仕組みは日々進化している。欅さんは一例として、キーワードの入力間違いに対する対応を挙げた。検索のキーワードに入力ミスがあった場合、最近の検索システムは「○○の検索結果を表示しています」などとして、正しいスペルで検索した場合の結果を表示してくれる。これを実現しているのは、大量のユーザーによる大量の検索記録の蓄積だという。以前に同じような入力ミスをした人の情報や、その人たちがその後にした行動などを蓄積し活用することで、入力ミスを判別し対応している。だから、人に使われれば使われるほど、検索記録が蓄積されて精度が上がっていくのだという。「皆さんがたくさん検索するほど、日本語の検索精度が良くなるんですよ」とファシリテータの五十嵐さん。近年はスマートフォンからの検索利用が増加したことから、検索結果の情報をコンパクトにして提供する仕組みや、スマートスピーカーなどを介した音声検索システムが充実してきているという。

検索システムが個人化していく

 従来の検索システムは、あらゆるウェブサイトから情報を集めて順位付けをして、検索結果を表示していたが、最近は順位付けを「個人化」する技術が進んでいると欅さん。検索システムの利用の仕方や、よく見るサイトの傾向などは人によって違う。だから、パソコンやスマートフォン端末の持ち主個人に合わせて、検索結果に個別の重み付けをするのだ。これには問題もある。検索システムがより個人向けになることで使いやすくなる一方、知らず知らずのうちに一部の情報や広告に隔離されてしまう、または個人の行動が筒抜けになってしまうといった懸念がある。欧州連合(EU)では、検索システムやサイト閲覧記録などの一部が個人情報に該当するとして、「一般データ保護規則(GDPR)」によってデータの保管期間などの規制を始めた。システムが便利になる中で、情報利用の在り方が見直されている。

未来の検索システムを考える

 情報ひろばサイエンスカフェで恒例となったグループワークは、「10年後の検索システムを考える」というテーマで行われた。

 多くの人が頻繁に利用する検索システムの話題なだけに、熱のこもったたくさんのアイデアが出た。「ウェブ上にない情報を調べる筋道を教えてくれる検索システム」「AR(拡張現実)などを活用した検索システム」「匂いなど言語化できない情報を識別して、検索することができるシステム」など。「孫の視点で検索をすることで、情報や気持ちを共有するシステム」といったユニークなものもあった。欅さんは、ARを利用した検索の仕組みは実際に研究が進んでいることなどを補足した。

グループワークのようす
グループワークのようす
発表のようす
発表のようす

 個人が利用するインターネットサービスが日本にも登場して20余年、スマートフォンができてからまだ10年ほどだ。次の10年ではどうなっているのか。身近でありながら最先端をいく検索システムの面白さに触れたサイエンスカフェになった。

サイエンスカフェ終了後の一コマ。欅さん(左)と五十嵐さん(右)
サイエンスカフェ終了後の一コマ。欅さん(左)と五十嵐さん(右)
ギジログ1
ギジログ1
ギジログ2
ギジログ2
ギジログ3
ギジログ3
ギジログ4
ギジログ4

サイエンスカフェをまとめた「ギジログ」(ギジログガールズ 記録)

関連記事

ページトップへ