非線形班(C01-1)
研究課題名:カーネル法による高次元データの非線形スパースモデリング
研究概要
近年発展してきた計測技術によって大量の高次元データが得られるようになっている.そのようなデータのモデリングには従来単純な線形モデルが広く用いられてきたが,現実の観測データは複雑で非線形な構造を内包しており,従来手法では本質を捉えきれないことが多い.
本研究課題では,カーネル法によるスパースモデリングを拡張することにより,マルチモーダルデータや時系列データ,さらに階層的・論理的な構造が内在するデータなどから複雑な構造を抽出することのできる新たなスパースモデリング手法の確立を目的とする.
本研究に関連する国内・国外の研究動向及び位置づけ
大量かつ高次元のデータを扱う際,計算量やモデルの解釈のしやすさから単純な線形モデルをあてはめることが多い.ところが複雑な過程を経て観測されるデータは必然的に非線形な構造を内包しており,非線形モデリングの効率的な手法が求められている.カーネル法は非線形モデルの高い記述力と線形モデルの計算効率性を両立させるものとして,機械学習の分野で近年著しい発展を遂げている.しかしながら,現状では得られたデータがそれぞれ独立に同じ分布に従うと仮定されるなど,生物・地学データのもつ複雑な構造を十分反映したものとはなっていない.また,自然科学の対象領域に関する固有な知識を手法の設計に適切に反映させるための体系的な方法論を確立するためには,実験計測の専門家とデータ解析の専門家とが協力し,お互いに結果を循環させることによって研究を進めてゆくことが不可欠である.
これまでの研究成果を踏まえ,着想に至った経緯
研究代表者は,カーネル法の研究を長年にわたり行っている.特に正準相関分析と呼ばれる複数の観測系(モダリティ)からの計測をもとに,それらに共通して含まれる低次元(スパース)な構造を抽出する手法のカーネル法への拡張について先駆的な研究を行なってきた.その枠組みは多くの実験計測系に応用可能で,それを発展させることにより,時間的な関係を有するデータや,より一般に階層構造や論理式で表現されるような構造を内包するデータのスパースモデリングが可能ではないかという着想を得た.こうした手法によってデータの本質的な構造を抽出できれば,単純な線形モデルに対するスパースモデリングの適用範囲を大幅に広げられる上に,実験家にとっても解釈がしやすい情報が抽出されることにより,自然科学における実験計測とデータ解析のそれぞれの専門家の協力関係を大幅に促進することが期待される.
本計画研究の目的
本計画研究では,カーネル法を軸として,データに内在する非線形性・階層性など複雑な構造を抽出する手法を開発し,高次元データ駆動科学の基盤となる枠組みの構築を目指す.具体的に,今後5年間で生物・地学データの解析において重要と考えられる三つの課題に着手する.
【課題1】マルチモーダルスパースモデリング
複数のモダリティを持つ計測データに共通して含まれる情報をカーネル法によって非線形に抽出するための手法を確立する.
【課題2】ダイナミカルスパースモデリング
時系列データに内在する非線形な潜在構造をカーネル法によって抽出する手法を開発する.
【課題3】構造的スパースモデリング
階層構造や論理構造として表現される構造的なスパース性を抽出するための全く新しいカーネル法を開発する.