研究内容

経験的動的モデリングに基づく自然科学のダイナミクスの分析と可視化

SDGs(持続可能な開発目標)に掲げられているように生態系保全や持続可能な利用を進めるうえでは、生態系のダイナミクスを理解することや予測をすることは、主要な研究課題になります。近年、生態系のダイナミクスを計測された時系列からデータ駆動的に解析を行うEmpirical Dynamic Modeling(EDM)という手法が注目を集めています(Sugihara et al. 2012)。EDMでは計測時系列データの状態空間への埋め込み(図1A)により得られる幾何的な特徴をもとに、生物種間関係の経時変化を計算します(図1B)。しかし、計算された生態系のダイナミクスは高次元データであり且つ経時変化をするので、その特徴を詳細に把握し、機構的な理解を得ることは困難です。

そこでEDMを開発したUC San Diegoのグループと共同で、EDM解析と次元削減、連携可視化を統合し、生態系のダイナミクス理解に資するビジュアル分析システムを研究開発しています(図1)。開発しているビジュアル分析システムは、生態系のダイナミクスの状態を特定し、可視化された特徴を基に注釈を付け、状態間の移り変わりを可視化することができます。本システムを海洋メソコスムデータに適用したところ、生態系の新たな特徴を見つけることができ、メカニズムに迫る状態の変化を描写することに成功しました。このように、先端の解析手法と情報可視化技術を組み合わせることで、よりよいデータ理解を可能にします。

図1 生態系ダイナミクスのビジュアル分析 (A)個体群動態時系列データにEDMを適用することで( B) 生態系の種間関係を表す動的グラフを構築する。(C)構築した動的グラフから次元削減法や連携可視化を用い、生態系の状態を特定し、(D)状態遷移を表現する。

データ駆動型科学を促進するビッグデータのビジュアル分析

生命科学や人文科学にわたるまで、様々なビッグデータ・異種のデータを可視化しデータ解釈を促進するアプローチを研究しています。

生命科学の分野では、細胞内のすべてのmRNAやタンパク質、代謝物の発現量や、タンパク質間相互作用など、生体分子についての大規模なデータが公開されています。またこれまでハイスループットな計測が難しかった形質(形や行動様式)にかかわる表現型特徴もバイオイメージインフォマティクスにより可能となってきました。

生物学において遺伝子やタンパク質、表現型特徴など異なる階層の情報をまるごと理解することが生物の理解につながると期待されていますが、単にデータを紐付けるだけでなく、複雑な遺伝子や表現型特徴をわかりやすく可視化し、階層横断的に探索できる仕組みは、これまで頭の中で閉じていた研究者の思考を表出させ、研究プロセスを促進させます。

そこで私たちは、線虫の大規模な表現型特徴データベースを有する理化学研究所のチームと共同して、表現型特徴—遺伝子ネットワークの横断的探索を支援するビジュアル分析システム「PheGeNet」を開発しています。図2に示すように、遺伝子ネットワーク(左)と表現型特徴ネットワーク(右)を同時に可視化し、遺伝子のノックダウン(RNAi)により変化する表現型特徴関係をもとに2つのネットワークを結び付けることにより、どの遺伝子がどの表現型に効き、どの表現型がどの遺伝子に関連するのかを調べることができます。さらに生物学的データベースや論文情報などをシステム上で参照可能であり、様々な思考実験をデータドリブンに行うことのできるワークスペースをWeb 上に構築しています。

図2 表現型特徴ー遺伝子ネットワークの横断的探索を支援するビジュアル分析システムPheGeNetの画面

 

また、人文科学において、多くの古代文献は、その成立に謎を抱えています。紀元前の古代インドのヴェーダ祭式文献という宗教聖典間のマントラ(祝詞)の共起関係をデータ化し、様々な特徴をデータに紐づけながら相互に連携して可視化する、「ビジュアル分析」システムを作成することで、個々のデータを並べただけでは把握できない、古代インド文献の示す時空間的特徴の全体像を得ることを目指しています。

特にマントラの共起関係は文献間の1対1の関係だけではなく、あるマントラが様々な文献に登場します。マントラの共起関係を単純なグラフ構造で表現するのでなく、グラフを拡張した概念であるハイパーグラフとみなしその構造を可視化すると、多数の文献間の大域的な共通性や局所的な特徴を捉えることができ、複雑な構成を持つ古代インド文献の成り立ちに迫ることができると考えています。

図3 古代インド文献のマントラの共起関係探索システム

可視化と視覚認知

データを可視化したものを見るということは、あるがままを見ているわけではありません。モニタの光が目に入り、網膜で電気信号に変換され、視神経を通じ外側膝状体を経由し視覚野へ至り、視覚情報処理されることではじめて何であるかが見えるのです。

多くの視覚認知の研究や神経科学研究がヒトの視覚特性の一端を明らかにしてきた一方で、より複雑な幾何形状を有するグラフ描画やインタラクティブな可視化などの情報可視化に対して、視覚的複雑さの認知負荷への影響などは未だに解明されていません。

そこで私たちはグループ構造を持つグラフ描画レイアウトであるGroup-in-a-boxレイアウトのレイアウト方法がヒトの情報探索に与える影響を眼球運動計測や生体計測などを通じて評価し、データを可視化するための人により良いデザインについて研究しています。

生体計測による可視化手法の評価や再設計に取り組み、見ることを介したヒトとコンピューティングのあり方を日々研究しています。

図4 ノードリンクダイヤグラムのユーザー実験と視線情報の分析

スポーツデータサイエンスと視覚認知

(作成中)

TOP