サイエンスポータル SciencePortal

コラム - インタビュー -

第4回「特許情報の翻訳対応が急務」

情報通信研究機構 多言語翻訳研究室長 隅田英一郎 氏

掲載日:2012年9月28日

「ここまで来た音声翻訳システム」

自動翻訳それも言葉を音声で入力するとたちどころに話し相手の言葉に翻訳してくれる携帯機器は、語学が不得手な人に限らず多くの人の夢といえよう。日本語と英語といった1対1の翻訳にとどまらず、同時に5つの言語の間で音声翻訳できるシステム開発が、日本がリードする国際協力で急速に進歩している。世界21カ国、23の研究機関と連携した研究共同体「ユニバーサル音声翻訳先端研究コンソーシアム(U-STAR)」の代表を務める情報通信研究機構は、iPhone(スマートフォン:多機能携帯電話)を介して23の言語を翻訳できるソフトを7月に公開した。23の言語は、世界の人口の95%をカバーする。ソフトはだれでもiPhoneに無料でダウンロードでき、iPhoneが利用可能な地域なら世界のどこでも利用可能だ。ロンドンオリンピックでは早速、iPhoneを持つ人々が、別の言語しか話せない目の前の人たちと音声応答する実証実験が行われた。情報通信研究機構でこのシステム開発の中心となっている隅田英一郎・多言語翻訳研究室長に、開発の現状と見通しを聞いた。

- 長文の翻訳を可能にするのは相当難しそうですが、めどはあるのでしょうか。

隅田英一郎 氏
隅田英一郎 氏

文脈とは意味を理解することなのですけれど、意味を理解するには知識が必要です。意味に相当するものは、これまでの音声認識や翻訳では使っていません。何も加工しないデータ中心でやっていましたが、データを集めるのに限界がありますから、「意味」へのシフトが必要です。

今その知識を情報通信研究機構の別のグループが研究しておりまして、インターネットからいろいろな知識を取ってくることが可能になっています。今までと桁違いの量の基礎的な知識がたまっています。これを使うことで、例えば「劣っている」と、全く違う発音の「劣化している」や「低下している」が同じ意味ないし類似の意味である、と判定することが既にできるようになっています。こうした技術を活用することで文脈の処理も見えてくるという感じで研究も進んでいくのではないかと考えています。

- 音声翻訳について伺ってきましたが、機械翻訳全体の将来像を最後に伺います。

国によって異なりますが、例えば米国で最も必要とされているのは防衛関係です。9.11の同時多発テロを防げなかった理由の1つとして、アラビア語で流れていた情報の収集に失敗したことが挙げられています。これを機に、アラブ諸国のニュースや会話をすぐに翻訳することができる、機械翻訳システムに対する関心が高まっています。

欧州では、EU(欧州連合)の公文書は20数カ国ある加盟国の言語にそれぞれ翻訳しなければならない規則があります。これは相当な費用と労力を要しますから、以前からこうした多言語のテキスト翻訳が盛んに研究されています。

日本で、今、関心が高まっているのは特許です。世界各国の企業間では、お互いの特許権をめぐる訴訟が増加しています。昔は知財保護に熱心でなかった国でも、現在は全く逆に、特許の権利化・保護を掲げ、政府主導で大幅な助成策が講じられています。最近は、特にアジア圏で、急速に特許出願数が伸びています。

各国の企業は、自国以外の特許情報までしっかり把握しておかないと、特許侵害訴訟を起こされる可能性が高い、というのが現実になりつつあるのです。日本の企業にとっても、日本国外の企業が特許を取っている技術情報に違反するような製品を、その国で売ろうとしてもできなくなりますから、特許に関する外国語-日本語の翻訳需要は、ますます大きくなるのは必至です。

- 国によって力を入れようとしているところはいろいろということでしょうが、今後ますます必要とされる機械翻訳の分野における日本の研究レベルは、世界各国と比べるとどの辺りにあるのでしょうか。

情報通信研究機構のほかにも、世界中の研究機関や大学、企業で機械翻訳の研究開発が進められていて、優秀な研究者がたくさんいます。現在、この分野は、油断しているとすぐに他者の新しい技術によって追い越され、キャッチアップしないと確実に置いていかれます。「3日会わざれば刮(かつ)目して見よ」ですね、抜きん出た存在はいません。

今後は、他の言語対に比べて特に難しい日本語と英語の対の翻訳が、特に重要な技術革新の一つとなっていくでしょう。

(完)
( 第1回 | 第2回 | 第3回 | 第4回 )

隅田英一郎 氏
隅田英一郎 氏
(すみた えいいちろう)

札幌市生まれ、東京都立新宿高校卒。1982年電気通信大学大学院修士課程修了。京都大学大学院博士(工学)。株式会社日本IBM、株式会社国際電気通信基礎技術研究所(ATR)を経て、現在、独立行政法人情報通信研究機構(NICT)多言語翻訳研究室室長。言語処理学会副会長(総編集長)も。83年科学技術庁(当時)の自動翻訳の研究プロジェクトMuに参画、規則翻訳の研究に従事。89年名詞句「AのB」を英語に翻訳するという困難な課題に用例翻訳が有効であることを実証し、これを文の翻訳まで拡張する。その後、統計翻訳の研究をベースに音声認識と自動翻訳を組み合わせて、音声翻訳システムの実用化に貢献した。現在は、翻訳支援サイト「みんなの翻訳」、音声翻訳アプリ「VoiceTra」、eコマースや特許の専用自動翻訳などの研究開発を統括する。主な受賞は、日本科学技術情報センター賞学術賞(96年)、アジア太平洋機械翻訳協会長尾賞(2007年)、情報処理学会喜安記念業績賞(08年)、文部科学大臣賞(10年)。

ページトップへ