インタビュー

第1回「4年間で飛躍的進歩」(隅田英一郎 氏 / 情報通信研究機構 多言語翻訳研究室長)

2012.09.07

隅田英一郎 氏 / 情報通信研究機構 多言語翻訳研究室長

「ここまで来た音声翻訳システム」

隅田英一郎 氏

自動翻訳それも言葉を音声で入力するとたちどころに話し相手の言葉に翻訳してくれる携帯機器は、語学が不得手な人に限らず多くの人の夢といえよう。日本語と英語といった1対1の翻訳にとどまらず、同時に5つの言語の間で音声翻訳できるシステム開発が、日本がリードする国際協力で急速に進歩している。世界21カ国、23の研究機関と連携した研究共同体「ユニバーサル音声翻訳先端研究コンソーシアム(U-STAR)」の代表を務める情報通信研究機構は、iPhone(スマートフォン:多機能携帯電話)を介して23の言語を翻訳できるソフトを7月に公開した。23の言語は、世界の人口の95%をカバーする。ソフトはだれでもiPhoneに無料でダウンロードでき、iPhoneが利用可能な地域なら世界のどこでも利用可能だ。ロンドンオリンピックでは早速、iPhoneを持つ人々が、別の言語しか話せない目の前の人たちと音声応答する実証実験が行われた。情報通信研究機構でこのシステム開発の中心となっている隅田英一郎・多言語翻訳研究室長に、開発の現状と見通しを聞いた。

―音声翻訳の実験は4年前の北京オリンピックでも行われましたね。当サイトでもニュースとして紹介したのですが、今回の実証実験は4年前に比べ、どこがどう進歩しているのでしょうか。

実は、北京オリンピックの時は、音声翻訳機を使って評価してもらう実験の前後が大変でした。まず、携帯端末が高価で1台25万円くらいし、重さは当時とし ては軽いのですが、500グラムもありました。ハイテクや知財の塊のようなものですから、貸した端末がもし戻って来なかったらどうしよう。そんな実験の本 質でないところで心配や苦労がありました。50台用意したのですが、リチウム電池の入ったこの端末の通関手続きやログデータの回収も大変でした。

この4年間で音声翻訳技術も格段進歩し、性能も上がりましたが、携帯端末の能力と通信環境が格段に変わったことも無視できません。その上、北京オリンピッ ク後に急速に普及したスマートフォンは、アプリケーションを簡単に開発して簡単に載せられます。今、iPhoneやAndroidフォンなどを持っている 人は世界中で山のようにいますし、われわれが作ったアプリケーションは、約70万人くらいの人に自由に使ってもらっているのです。

音声翻訳はもちろん音声のデータが重要ですが、それが70万人から自動的に取れるわけです。それをフィードバックしてまた性能を上げることをしています。1年ほど前、30万人くらいのデータが集まった時に、フィードバックすることで実際に性能向上を確認しています。

アプリケーションをダウンロードするのは無償です。これまで日本でダウンロードされた数が多く、日本人のデータが圧倒的に多いのですが、現在、世界中で宣 伝していまして、例えば、タイでは、1週間に3,500という割合でダウンロードされています。ダウンドロード数に応じて音声のデータも比例して多く取れ ています。これは、私たちの提携相手であるNECTEC(タイ国立電子生産技術センター)が、タイのマスコミからしっかりとした信用できる研究機関とみな されているので、宣伝もうまくいっているのだと思います。

―アジア主体で世界展開を図ったようですが、そもそも情報通信研究機構が開発したシステムを世界に広げるきっかけは何だったのでしょう。

最初は、科学技術振興機構の予算でやらせていただきました。アジア各国を巻き込む国際共同研究課題の一つ「アジア言語の壁の克服に向けた音声翻訳共通研究 基盤の構築」 という2003年から3年かけた国際研究です。われわれの技術は、「対訳コーパスに基づく統計翻訳」というもので、多言語化が簡単にできる長所がありま す。コーパスというのは、文章を大量に集積したものを指します。この共同研究によってまずアジア諸国との関係を強め、続いて国際電気通信連合(ITU)の 標準をとりました。ITUというのは国連の下位組織です。そこの国際標準を得たということで「一緒にやらないか」とアジアに限らずいろいろな国の研究機関 に話を持ちかけることも可能になりました。情報通信研究機構単独でも、日本語はもちろんのこと、英語、中国、韓国語、ベトナム語、インドネシア語と6カ国語の多言語音声翻訳はできます。しかし、音 声翻訳というのはやはりその言語を使っている国の人間が一番良いものがつくれます。性能を上げるためには、多くの国のデータと研究者が必要です。1国だけ でやろうとしても性能は上がりません。さらに多くの国と協力して進めることで、新たに加わる国もどんどん増えます。新たな参入国は音声認識と音声合成のプ ログラムを提供するだけで、既存の加盟国全てと多言語の音声翻訳システムができてしまうからです。国際コンソーシアム「U-STAR」は、雪だるまのよう に加盟国が増えて、現在23カ国26機関になりました。

―IT技術の特徴そのものですね。

ええ。

(続く)

隅田英一郎 氏
(すみた えいいちろう)
隅田英一郎 氏
(すみた えいいちろう)

札幌市生まれ、東京都立新宿高校卒。1982年電気通信大学大学院修士課程修了。京都大学大学院博士(工学)。株式会社日本IBM、株式会社国際電気通信基礎技術研究所(ATR)を経て、現在、独立行政法人情報通信研究機構(NICT)多言語翻訳研究室室長。言語処理学会副会長(総編集長)も。83年科学技術庁(当時)の自動翻訳の研究プロジェクトMuに参画、規則翻訳の研究に従事。89年名詞句「AのB」を英語に翻訳するという困難な課題に用例翻訳が有効であることを実証し、これを文の翻訳まで拡張する。その後、統計翻訳の研究をベースに音声認識と自動翻訳を組み合わせて、音声翻訳システムの実用化に貢献した。現在は、翻訳支援サイト「みんなの翻訳」、音声翻訳アプリ「VoiceTra」、eコマースや特許の専用自動翻訳などの研究開発を統括する。主な受賞は、日本科学技術情報センター賞学術賞(96年)、アジア太平洋機械翻訳協会長尾賞(2007年)、情報処理学会喜安記念業績賞(08年)、文部科学大臣賞(10年)。

関連記事

ページトップへ