宇宙の大規模構造の複雑な統計パターンを高速予言、人工知能ツール「ダークエミュレータ」

このエントリーをはてなブックマークに追加
宇宙の構造形成シミュレーションを元に構築された大規模なデータベースを学習した、人工知能フレームワーク「ダークエミュレータ」が開発された。任意の宇宙モデルにおける宇宙の大規模構造の観測量を正確かつ高速に予言でき、実観測データから宇宙の根源的な情報を素早く引き出すことが可能となる。

【2020年2月12日 東京大学国際高等研究所カブリ数物連携宇宙研究機構

宇宙の基本的な枠組みを観測的に実証する分野である「観測的宇宙論」は、宇宙の標準モデルの確立など、科学者が扱うことのできる最大スケールの実証科学として成熟してきた。しかし、宇宙の大半はダークマターやダークエネルギーといった未知の要素が占めており、この「ダーク成分」の性質を理解しなければ、真の意味で宇宙の基本的な成り立ちを解明したとはいえない。

その理解のために重要と考えられているのが「宇宙の大規模構造」だ。大規模構造は、多数の銀河が密集した銀河団や超銀河団、これらをつなぐフィラメント、広い領域に渡ってほとんど銀河が存在しないボイドなど、近傍宇宙に存在する銀河が織り成す網の目構造のパターンで、宇宙がこれまでに経てきた複雑な進化の歴史を反映したものである。大規模構造を詳細に観測、分析することで、宇宙の進化に大きな影響を及ぼすダーク成分の謎に迫ることができると期待されている。

宇宙の大規模構造
「ステラナビゲータ」で表示した宇宙の大規模構造

大規模構造の観測から得られたデータを分析し、宇宙論的に有用な知見を引き出すためには、物理理論に基づいて、宇宙の構造進化に対して正確な予言を与える必要がある。そのためには、スーパーコンピューターを用いて様々な宇宙の大規模構造の進化を計算し、観測で得られたデータと照らし合わせることが有効だ。しかし、数十万から100万にも及ぶパラメーターの組み合わせに対して精巧な理論計算を多数行うのは膨大な計算コストが必要となる。

京都大学基礎物理学研究所(兼 東京大学国際高等研究所カブリ数物連携宇宙研究機構)の西道啓博さんたちの研究チームは、機械学習の手法を用いてシミュレーションの宇宙と観測データとの対応を関係を学び取らせ、新たなシミュレーションを実行することなく高速に宇宙を予言する研究に取り組んだ。

学習に使われたデータは、国立天文台のスーパーコンピューター「アテルイ」および「アテルイII」を用いて約3年かけて計算された262個の「仮想宇宙」だ。「ダークエミュレータ」と名付けられたシステムは262個それぞの宇宙について、代表的な101組の宇宙論パラメーターを用いて、宇宙の大規模構造の理論予言に必要なあらゆる基本的な統計量を学習した。

学習結果を詳細に検証した結果、ダークエミュレータは弱重力レンズ効果に関するすばる望遠鏡の観測データや、スローン・デジタル・スカイ・サーベイによる銀河の3次元空間上の分布パターンの観測データを、概ね誤差2~3%程度の精度で予言できることが実証された。さらに、ダークエミュレータは与えられた宇宙論パラメータ及び銀河の複雑さを表すパラメータに対して、標準的なノートPCでも数秒以内に理論予言を行うことができ、計算コストをおよそ1億分の1に低減した。実観測データから宇宙の根源的な情報を引き出す操作が飛躍的に高速化されたことになる。

ダークエミュレータの概略図
ダークエミュレータの概略図。シミュレーション内に採用された宇宙の基本的枠組みを決める「宇宙論パラメーター」と、得られた大規模構造との対応関係を、複数の統計学的手法と物理モデルとを組み合わせた方法によって学習する。訓練されたダークエミュレータは、シミュレーションと遜色のない高い精度で、宇宙の大規模構造の複数の統計量を瞬時に予言する(提供:京都大学基礎物理学研究所、国立天文台)

「スーパーコンピューターを用いて3年かけて作り上げた巨大データベースが、手元のPCでほんの数秒で再現できるようになりました。データ科学の手法の大きな可能性に手応えを感じています。この成果を応用し、現代物理学最大の難問とされる『ダークエネルギー』などの宇宙の根源的謎に迫りたいです。また、本研究の手法は、多自由度を持ち計算コストが大きい自然科学・社会科学の諸問題に対して広く応用できると期待しています」(西道さん)。