オピニオン

劣化起こさない圧縮法 - 高品質音声音響信号の符号化技術の進展(守谷健弘 氏 / NTTコミュニケーション科学基礎研究所 守谷特別研究室長、NTTフェロー)

2008.09.03

守谷健弘 氏 / NTTコミュニケーション科学基礎研究所 守谷特別研究室長、NTTフェロー

NTTコミュニケーション科学基礎研究所 守谷特別研究室長、NTTフェロー 守谷健弘 氏
守谷健弘 氏

 音声や音響(オーディオ)信号のデジタル信号としての分析や符号化技術の研究は1960年代から始まっています。幸いにもその成果は近年急速に発展し、普及しているデジタル携帯電話、インターネット電話、さらに音楽の配信や携帯プレーヤなどの実現に不可欠な基本技術として世の中に広く役立ってきています。

 私もこの分野のエンジニアの一人として微力ながら貢献できたことを誇りに思い、先輩、同僚、後輩に感謝したいと思います。これまで貢献できたというのは、限られた電波資源、限られた伝送路、限られた処理速度の装置の制約の下で、できるだけ多くの人たちに低価格で情報を提供するためには、情報圧縮技術が不可欠だったからです。もちろん情報量を5分の1から20分の1程度まで圧縮すれば、それによるひずみは避けられないものですが、そのひずみや品質低下を防ぐために、あらゆる工夫を重ねてきたことが研究の歴史そのものでもあります。

 21世紀を迎え、私どもは研究課題を限られた情報の中で可能な範囲で品質を維持する符号化から、情報の送り手や作り手からの信号をまったく変形せずに可能な範囲で節約をするロスレス符号化に転換しました。この背景には、圧縮の基本技術は洗練された形で国際標準として共有されて普及し、その一方で有線のネットワークや蓄積媒体のブロードバンド化に伴い、映像情報と比較して相対的に情報量の少ない音声や音響信号の品質を犠牲にした圧縮の改善効果の意義が小さくなったことがあげられます。

 圧縮という言葉は品質劣化を想像しますが、ロスレス符号化は劣化を伴わない圧縮です。さらにこのようなロスレス符号化技術は世界に共通に世代を超えて使えることが特に重要であることを訴え、世界の専門家と協力してMPEG(Moving Picture Expert Group: ISO/IECの標準化グループ)国際標準としてまとめることができました。

 このようなロスレス符号化技術を利用する一つのサービスの例として、豊かで高品質な音楽の製作や配信があげられます。現状では多くの人が手軽に鑑賞できる音楽はCDや放送の信号のフォーマットの制約(例えばCDは2チャネル、振幅16ビット、サンプリング周波数44.1 キロヘルツ)の中で製作されています。ところがネットワークでの配信を想定すれば、多チャンネル化、振幅の範囲の拡大、周波数の拡大といった多様な高品質化の要望に柔軟にこたえていけるものと考えます。その際にひずみを許さずに情報量を圧縮できるロスレス符号化の特徴が生かせるわけです。

 現在のネットワーク配信の音楽は簡便に鑑賞するスタイルが主流になってしまっているようですが、今後はインターネット放送も含む高品質サービスのメニューのひとつとして発展させていくことが期待されます。なお、ロスレス符号化は情報量が時間的に変動するため、一定の情報量を伝送する一般の放送には不向きで、音声だけの圧縮によって電波を有効利用することはできません。今後、映像と音声を統合して情報量を制御する技術を確立することで、電波の有効利用が可能になります。

 また現在世界的に歴史的アナログ音源信号をデジタル化して長期保存することが重要な課題となっています。音声や音楽は感情や芸術の領域まで及ぶ人類の文化の継承に重要な役割を果たすことに議論の余地はありません。近年のデジタル化や蓄積媒体の進歩で音の保存は簡便化されてきましたが、0と1だけのデジタル信号の系列の約束事と意味は標準化により厳密に記述され継承されなければ、後世にその信号を再構成することができません。

 また人間の耳は周波数が20キロヘルツ以上の音波を感じることはできないので、これまでのデジタル化ではそれ以上の周波数成分を切り捨ててきました。ところが最近20キロヘルツ 以上の音波が人間の脳内活動に直接影響を及ぼす例が見出されています。すなわち、20キロヘルツ 以上の成分が人間にとって重要な役割をもつ可能性があります。このため将来の科学の進展の可能性を視野にいれて20キロヘルツ以上の成分も忠実に保存する必要があります。この際に増大する情報量を削減し蓄積コストを抑えるためにロスレス符号化技術が役に立ちます。

 このように膨大な音源資産をできるだけ高品質で長期に残すためには、ロスレス符号化技術も含む標準化フォーマットを整備し、維持管理していく道筋を確立することが重要であると思います。実際の貴重なアナログ音源が散逸劣化する前に、できれば公共投資のひとつと位置づけて、文化財産として世代を超えて継承する必要があろうと考えます。

 上記の二つの例のようにロスレス符号化技術は高品質サービスへの応用が期待できますが、これはあくまでも一つの道具です。今後は真に豊かで品質の高い情報、満足できる情報とは何かを多面的に見極め、それを活用できる仕組みを作る必要があると考えます。

NTTコミュニケーション科学基礎研究所 守谷特別研究室長、NTTフェロー 守谷健弘 氏
守谷健弘 氏
(もりや たけひろ)

守谷健弘(もりや たけひろ)氏のプロフィール
1955年生まれ、78年東京大学工学部計数工学科卒、80年同工学系研究科計数工学専門課程修士修了、日本電信電話公社武蔵野電気通信研究所入所、89年NTTヒューマンインタフェース研究所主任研究員、04年NTTコミュニケーション科学基礎研究所人間情報研究部部長、07年から現職。音声音響信号の符号化の研究、標準化に従事。工学博士。IEEEフェロー、日本音響学会理事、情報処理学会規格調査会SC29専門委員長。08年文部科学大臣表彰(科学技術賞・研究部門)など数々の賞を受賞。
ホームページ

ページトップへ