オピニオン

ビッグデータ利用の壁 産学連携で挑戦(中野純司 氏 / 統計数理研究所 モデリング研究系 研究主幹 教授)

2016.02.02

中野純司 氏 / 統計数理研究所 モデリング研究系 研究主幹 教授

中野純司 氏
中野純司 氏

大学共同利用機関法人情報・システム研究機構 統計数理研究所(樋口知之所長、以下統計数理研究所)と、SAS Institute Japan株式会社(堀田徹哉社長、以下SAS)は、企業や公共団体がビッグデータを活用するための実践的研究の場として、ビッグデータ イノベーション ラボ(Big Data Innovation Lab:BIL)を共同で設立しました(2015年8月12日「ビッグデータで共同研究所設立 統計数理研究所と外資系企業」参照)。

 近年、計算機、インターネット、センサーなどの技術の飛躍的な発達により、これまでとは比較できないほどに多量の多種多様で精細なデータが計算機上に蓄積されるようになっています。このようなビッグデータを有効に活用すれば、これまでは不可能であったような現象分析が可能になることが期待されます。そこで独自のビッグデータを所有する多くの企業や公共団体がそれを活用して新しい価値を創出することを模索・検討しています。しかしながら、実際にビッグデータを活用し成果を出すに至っている組織はいまだ限定的です。なぜなら、ビッグデータの利用には、はじめの一歩を踏み出すためにいくつかの大きな壁があるからです。

人材、組織ともに不足

 まず、ビッグデータの活用を行うためには、データの蓄積・整理および解析のためのハードウェア・ソフトウェアなどの準備に多大なコストがかかります。したがってその投資の根拠となる効果の検討・実証が必要ですが、そのためにさえかなりのコストが必要です。またビッグデータを分析し成果を創出できる人的資源が圧倒的に不足しています。ビッグデータ分析のためには統計学と計算機科学の両方の知識が必須ですが、そのような知識のある人材を集めることは容易ではありません。そのため組織が保有するデータと人材のみでは創出される価値が限定的になりがちです。そして、現状では統計学に関する高度な知識とビッグデータをハンドリングできるような計算機環境を提供したり支援したりする組織や場はほとんど存在しません。このような状況を踏まえ、統計数理研究所とSASは、共同でBILを設立しました。

 統計数理研究所は1944年に文部省直轄の研究所として設置され、統計数理研究の中心的な研究機関として、その発展のための先駆的役割を果たしてきました。1985年に国立大学共同利用機関として改組され、2004年からは大学共同利用機関法人情報・システム研究機構の一員となり、共同利用を推進する立場として、研究所内外の研究者の交流の場を提供しながら、統計科学の理論と応用における多面的な発展に寄与しています。これまで極めて広い分野の研究者に開かれた研究所として、国内はもとより国際的にも多種多様な共同研究活動を発展させ、世界をリードする成果をあげてきました。

 また、総合研究大学院大学の基盤機関として、若手研究者の育成に取り組みながら、一般社会人などを対象とする統計科学の知識や技術の普及活動や国際的な研究協力・交流促進の機能を果たすよう積極的に努力しています。そして、大規模で複雑なデータから有益な情報を抽出する研究のためのインフラストラクチャ(基幹施設)としてスーパーコンピュータ、プライベートクラウドシステム等の豊富な計算資源を保有しています。

 ただ、これらの計算資源は主として研究者のための大規模計算手法を実行するためのものであり、ビッグデータ分析はそれらとは異なる機能も必要となります。すなわち分析者がある程度簡単に、超大量のデータを現実的な時間で取り扱うことのできるシステムが不可欠なのです。そのためには分散並列処理環境が必須であり、それも計算機の専門家でない人にも使いやすいソフトウェアが必要です。

有用な統計解析システムSAS

 統計解析システムSASは歴史の長い、広く普及しているソフトウェアです。SASは1976年に設立され、現在では、世界各地の75,000以上の顧客サイトでその製品が利用されています。近年は最新の分析アルゴリズム、機械学習処理を高速で実行するためのビッグデータ分析に特化したビジュアライゼーション(可視化)やインメモリ・アナリティクス(外部記憶装置を使わない分析)技術を実装しており、さらにはHadoopクラスター上での分散並行処理が利用可能となっています。これらはビッグデータ分析のために非常に有用なものです。

 しかしながら、全体のシステムは大規模なため、どこででも利用できるというものではありません。BILではこれらを統計数理研究所のプライベートクラウドシステム上に構築することにより、ビッグデータを分析するための実践的研究の場を提供します。

ビッグデータ分析の人材育成も

 BILは統計数理研究所の統計思考院の中に設置されています。統計思考院は統計数理研究所における統計数理の普及・教育の場であり、BILはビッグデータ分析のできる人材育成も目的としています。統計思考院に企業から派遣される人材をビッグデータ分析の実践的な共同研究の場で訓練する教育の場としても位置付けることなどで、不足するアナリティクス人材の育成にも貢献します。さらにSASは独自に推進する、アナリティクス人材育成のための広範囲の高等教育イニシアチブ、SAS? Analytics Uの一環としても、BILによる人材育成活動を支援します。

 BILは、一般企業をはじめとしたさまざまな組織に、ビッグデータを活用するための実践的研究の場を提供することをミッションとします。BILによって、統計数理研究所が得意とする複雑・不確実な現象を対象とした、アナリティクス・スキルを活用した高度な数理モデル開発と、SASが提供するHPA(ハイパフォーマンスアナリティクス)やビッグデータ分析基盤を融合することで、企業および公共団体の研究課題、特に研究初期段階の概念実証、POC(Proof Of Concept)の成果創出を加速できます。BILでは、医療健康、エネルギー、インフラストラクチャ、モビリティーなどビッグデータが継続的に創出される企業、公共団体の課題解決に固有分野専門家、統計科学研究者、ソフトウェア技術者が協力して取り組み、ビッグデータ分析のはじめの一歩を踏み出せるようにします。

中野純司 氏
中野純司 氏(なかの じゅんじ)

中野純司(なかの じゅんじ)氏プロフィール
東京大学大学院工学系研究科計数工学専門課程修士修了。理学博士(東京工業大学)。徳島大学助手、埼玉大学講師、一橋大学助教授を経て1998年統計数理研究所教授。現在、統計数理研究所 モデリング研究系 研究主幹 教授。2015年6月から日本統計学会理事長。専門は計算機統計学。

関連記事

ページトップへ