総括班
スパースモデリングと高次元データ駆動科学創成への支援と広報
研究概要
とどまることを知らない計測技術の向上が大量の高次元観測データを日々生み続けている.また,生命情報科学のように,各論的なデータ科学が推進される中,天文学における高次元データ解析手法が,全く対象とスケールの異なる生命科学でも有効に働くような状況に遭遇する(右図上,Science, Feb. 11, 2011).こうした多様な視点の導入は様々な場面で革新的展開を生み出す原動力となっている.
本計画研究では,多様な視点の導入による革新的展開を引き起こす方法論として,スパースモデリングに着目する.右図下のように,理科第2分野に属する生物学・地学の幅広い分野の実験・計測研究者と情報科学研究者の有機的連携により,高次元データから隠れた規則性を発見する高次元データ駆動科学ともいうべき新学術領域を創成する.
本研究に関連する国内・国外の研究動向及び位置づけ
日本学術会議大型研究計画「e-サイエンス実現のための革新的アルゴリズム基盤」の発足からもわかるように,データ科学の時代が今まさに到来しつつある.大量のデータを先端情報科学技術により処理する基盤・応用研究は国内外含めて隆盛を極めている.その中で,データベースの構築やソフトウェア開発など,ユーザーに対する情報の可用性を高めることを主目的とした研究が多くなされている.一方,科学的知識抽出を目指すプロジェクトについては,具体的なアルゴリズムや研究アプローチを今まさに模索している段階である.
我々は,高次元データから科学的知識抽出を行う普遍的枠組みがスパースモデリングであると考える.2000年代半ばから,スパースモデリングの一種である圧縮センシング(CS)が計測工学,通信工学,医用工学,生化学など幅広い分野で革新的情報抽出技術として大きな注目を集めている.
これまでの研究成果を踏まえ,着想に至った経緯
代表者の岡田は,地球科学や脳科学の実験研究者との共同研究を通じて,津波堆積物と神経細胞という全く異なる対象の高次元データから,データに潜む潜在的な構造や法則を抽出する普遍的なスパースモデリング手法を開発した(右図).これらの成功例から,情報科学と単一の自然科学分野の共同研究だけではなく,情報科学と幅広い様々な自然科学分野の緊密な融合こそが革新的な自然探求の方法論の開発を促すという着想に至った.
本計画研究の目的
本領域は情報科学者と幅広い自然科学の実験・計測研究者が参加する.総括班はこの特長を生かすべく,領域メンバーの緊密な連携を促進させ,個々の成果がモデリング原理の確立を通じて高次元データ駆動科学の創成につながるように,領域全体を先導する.また,データ解析技術の導入による実験・計測分野の進展だけにとどまらず,高次元データ駆動科学の情報数理基盤の形成へつなげる.このような支援活動および広報活動に関連し,以下の三つの課題に取り組む.
【課題1】高次元データ駆動科学の実践
実験G(A01, A02)とモデルG(B01)から数名の担当を配置し,各計画研究間の研究進捗の調整を行い,本応募領域の要である情報科学と自然科学の有機的連携を促進する.
【課題2】高次元データ駆動科学の情報数理の基盤形成
スパースモデリングはデータ圧縮(情報源符号化)の一種である.情報G(C01)の持つ最先端の数理情報科学をスパースモデリングに融合し,種々の自然科学の状況に柔軟に対処できる符号理論の構築につなげる.
【課題3】高次元データ駆動科学創成に向けた若手人材育成と広報・アウトリーチ活動
次世代の高次元データ駆動科学を担う中核的研究者の育成を図るべく,融合支援員が主体となった若手主催のシンポジウムや,若手の海外研究機関での共同研究やセミナー発表を支援する.