ハイライト

“類は友を呼ぶ”新しい画像検索システム-気づきが築く異分野連携-(長谷山美紀 氏 / 北海道大学大学院情報科学研究科 教授)

2013.02.04

長谷山美紀 氏 / 北海道大学大学院情報科学研究科 教授

バイオミメティクス・市民セミナー「生物画像から“気づき”を生み出す新しいデータベース」(2012年12月1日、主催:北海道大学総合博物館 協賛:高分子学会バイオミメティクス研究会)から

北海道大学大学院情報科学研究科 教授 長谷山美紀 氏
長谷山美紀 氏

 「何かを伝え、残したい」という発想から、「データ」というものが生まれた。デジタル方式に限らなければ、約4万年前の洞窟壁画がデータの起源とも言える。ただ、それが先史時代を知る重要な資料になりえたのは、たまたま発見され、学術的に調査・分析されたからである。データは、「発見と分析」の両方が成り立つことで宝物に変わる。

 人類は、数学や物理学、生物学という多くの基礎的な学問を用いて工学分野を発展させ、生活基盤を形成してきた。しかし社会が抱える問題が極めて複雑になると、一見、基礎的な学問と現実社会とが乖離(かいり)して見える。実はiPS細胞(人工多能性幹細胞)の研究のように、社会と密接に関わり、貢献しているのだが。

 従って、困難な問題を解決するには、専門分野の融合、つまり、〈基礎科学〉〈応用科学〉〈実用化〉の連携が必要である。例えば生物学では、世界中にたくさんの貴重な研究データが存在する。これらをどのように活用できるか。従来のデータベースは、「過去から現在までの知識の蓄積」を役割としてきた。情報科学の力で、「未来を支える技術の創造」という使命を持たせ、独創的なアイデアを生み出す宝庫にできないだろうか。

大量デジタル時代の到来

 米国最大のITコンサルティング会社「IDC(International Data Corporation)」は、2008年以降、2つのレポートで次のように発表した。

  2000年頃からデジタルデータが急増している。2011年には、世界中のデータベースの総量は1.8ゼタバイト(ゼタ=10の21乗)になり、それらの約半は蓄積されずに捨てられるだろう。

  2020年までに、世界中のデジタルデータの量は、09年の44倍に達する見込みだ。もしその全てをDVDに保存して地球上から積み上げた場合、火星までの距離の半分に達する。だがITの専門技術者は、09-20年の間に1.4倍に増える程度の見込みしかない。必要なときに望む情報を、膨大なデータからどのように見つけ出すか。さらに、注目すべきことは、デジタルデータは、画像や音声パケットなどの“非構造化データ”が大半であるという点である。「百聞は一見にしかず」をモットーに何かを発見するような、独創的な検索ツールが必要となる。

 1.8ゼタバイトのデジタルデータとは、2時間のDVD映画(1枚4.7ギガバイト)にすると、全て見終えるのに10億年以上かかる量である。情報科学では、1980年代から自動計算でデータを解析する研究が行われてきたが、これほど途方もない量のデータが生成されることは想定外であったと言える。

画像、映像検索による情報の獲得

 私は、音楽や映像などを含むマルチメディアのデータ処理を研究している。既存の検索サービスでは、画像や映像などの情報を対象として検索を行った場合、大きな限界があることが確認されている。例えば、Web上に存在する北海道大学のクラーク像を見つけ出すために、既存の検索サービスで、検索クエリ(質問の言葉)に片仮名や英語の名前を入れてみても、漫画や自筆の手紙画像まで出てくるのに、目指す画像と同じものが現れず、試行錯誤することになる。これらは、現在の画像認識技術の精度が完全ではない点、検索用語(検索クエリ)が的確に与えられなければならないという点に起因する。

 私が開発した類似画像検索エンジン「IMAGE VORTEX(3D)」は、「気づき」をキーワードにしている。大量の画像データを俯瞰(ふかん)する形で見せて、個々の情報がもつ潜在的な共通性を浮かび上がらせる。そこから情報にまつわる知識や記憶を呼び覚まし、必要なものにたどり着かせることが、本エンジンのコンセプトである。これらは、2007年にテレビ東京の番組「ワールドビジネスサテライト」の中で、3分間弱放送された。(取材撮影は4時間半だったが〈笑い〉)。

 具体的には、「検索エンジンに北海道の観光画像140枚をセットして、私が撮影した1枚のクラーク画像を入れると、140枚が互いに動き出す。画像同士が段々と近づき、3次元の空間で“塊”のように集まっていく」という仕組みだ。中で黄色が目につく塊には、雨竜町のヒマワリや本学の銀杏並木の黄葉の画像があり、連想や何かを思い出すきっかけが得られる。

 「塊」というのは、人間の認知特性に関係していると言われる。人間はまず塊に目が行き、面白そうだと思うと細かく見る。これは認知科学におけるゲシュタルトの「群化」という概念だ。10年以上も前にこの研究を始めたが、他の研究者に理解をしてもらうには、多くの労力を要した。しかしながら、ノーベル賞を受賞された山中伸弥教授の、新しい研究の困難を乗り越えたお話を聞いて、とても勇気をいただいた。

生物画像から工学的「気づき」を生み出す

 いま、バイオミメティクスという「生物の機能や構造を人工的に模倣・再現して、さまざまな応用を目指す研究」の推進に向けて、「発想支援型画像検索システム」の開発に取り組んでいる。バイオミメティクスは、生物、材料、ロボティクス、環境など広範囲な知見を必要とする。しかしながら、これまでは研究から製品化まで、ほとんどを個々の研究者や個々の企業に負ってきた。このように、これまでは個別に行われてきたものを互いに結びつけ、新たな発想を生み出すということは、バイオミメティクスにおいて必要不可欠である。つまり、異なる各々のデータベースは、部分的に小さなつながりがあるものの、全体的には孤立気味である。しかも専門分野が違うと、何かを探そうとしても、検索する専門用語が異なり、求める情報と結果のミスマッチが起ることが多い。

 生物の隠れた有用性に対して、いかに効率よく「気づき」を与えられるか。「発想支援型画像検索システム」では、従来のように、クエリとして決まった専門用語を与えるのではなく、画像中の視覚特徴の利用をデータベースの機能に組み込んでいく。このシステムは2012年、BSフジの「ガリレオX」で紹介された

 このような技術によって、異なる専門分野同士で、専門用語がさまざま異なる場合においても、画像同士を、視覚特徴に基づき関連づけることで相似や相違を判断でき、情報も共有しやすい。つまり画像を糊代にして、異なる研究分野が「糊付け」される。将来的には、人間のようにイメージを理解して、最大100万枚の画像をベースに検索できるシステムを目指している。

 現在、バイオミメティクス研究会では、本学の大原昌宏教授の数千枚の昆虫コレクションの写真を基に、定期的に画像検討会を行っている。時おり、昆虫の大きさや種の系統が離れているのに、画像が類似することがある。具体的に、昆虫の顕微鏡像を拡大していくと、細部に同じ構造を持っていることが確認される場合が存在する。「生態が似ているので、同じような機能が生まれたのでは」という結論に至る場合もある。ある時、昆虫の脚を拡大した数枚の画像の中に1枚だけアクリル繊維の画像を混ぜると、なぜか一緒のグループに分類された。材料系の研究者は「アクリルを引っ張って伸ばした状態ではないか」と見破ったが、伸ばしたアクリル繊維には、昆虫の脚と共通する未知の機能があるのかもしれない。このように画像同士のつながりが「気づき」を誘発させ、新たな知識を創出する。

研究の展望とバイオミメティクスの世界の動き

 2012年5月20日、バイオミメティクスが新たな1歩を踏み出した。国際標準化機構(ISO)における技術委員会(Technical Committee:TC)の新分野「TC266」として、バイオミメティクスの設置が決定した。産業社会におけるバイオミメティクスの意義について、世界が話し合いを始めたことになる。因みに「TC1」分野はネジ、「TC2」分野はボルトやナット、「TC226」分野がナノテクノロジーだ。

 TCでは、各分野それぞれにワーキンググループ(WG)を作って議論する。TC226のWG1ではバイオミメティクスの定義の標準化、WG 2ではバイオミメティクスに基づく新しい機能の標準化、WG 3は生物の成長原理の工学的な展開、最適化プロセスの標準化が課題だ。2012年10月、ベルリンで、第1回のTC266の会議があり、我々も参加した。日本代表の下村政嗣・東北大学教授が、「バイオミメティクスのデータベース」について論議するWG 4の設置を要望した。幸い受諾され、プランを提出した。

 大学人は、国際的な共同研究を通じて日本の学術および産業技術を強め、発展させるミッションを負っており、我々はフランス、ドイツなどの国家プロジェクトとも連携してきた。バイオミメティクスの基盤になるナノテクノロジーやバイオサイエンスは、日本が先頭を走ってきた。WG4を機軸に、新しい産業の構築に向けて、世界に情報発信していきたい。

(SciencePortal特派員 成田優美)

北海道大学大学院情報科学研究科 教授 長谷山美紀 氏
長谷山美紀 氏
(はせやま みき)

長谷山美紀(はせやま みき)氏のプロフィール
北海道札幌南高校卒業。1986年北海道大学工学部卒業、88年同工学研究科修士課程修了、同大学電子科学研究所助手、同大工学研究科助教授を経て、95-96年米国ワシントン大学客員准教授。2006年から現職。工学博士。2007-09年経済産業省『情報大航海プロジェクト』技術アドバイザー、07-11年総務省総情報通信政策局・情報通審議会専門委員、08-10年NHK放送技術研究所・放送技術研究委員会委員、2010年-NHK放送審議会委員。映像情報メディア学会(ITE)英語論文誌「Transactions on Media Technology and Applications」編集委員長。

ページトップへ