先端計算科学推進室

計算科学は、理論、実験・観測と並び、21世紀の科学の最先端を切り拓く柱となるものです。次世代のエクサフロップスマシン実現を目指し、アプリケーション、システム技術の開拓が急務です。

HA-PACSプロジェクトでは、先端計算科学推進室を中心として、素粒子、宇宙、原子核、物質、生命、地球環境の各分野におけるブレイクスルー達成のために、分野間連携および学外連携のもと、主要アプリケーションのホットスポット解析とGPU化を進めています。また、データ基盤、計算機システム分野との連携を推進します。

計算科学における挑戦的課題とHA-PACS計画の位置づけ

1.素粒子分野

2.宇宙分野

3.原子核分野

4.物質分野

5.生命分野

6.地球環境分野

7.データ基盤分野

1.素粒子分野

マルチスケールの物理

格子QCDによる原子核の直接構成とその諸性質解明

GPU加速:大規模疎行列線形方程式求解

有限温度・有限密度の物理

幅広い有限温度・有限密度領域における相構造解析

GPU加速:密行列の行列・行列積計算


期待されているQCDの相図

2.宇宙分野

6次元計算宇宙物理の実現

初代天体形成過程の解明

宇宙再電離過程の解明

6次元輻射流体シミュレーション:原子を3次元流体、光(輻射)を6次元輻射輸送で解く。Ray tracing による光の強度計算と化学反応計算をGPUで高速化。Strong scaling且つGPU向きの計算。流体計算とカップルさせた輻射流体計算が可能になる。

衝突系重力多体シミュレーション

巨大ブラックホールの合体・成長過程の解明

100億年におよぶ球状星団の進化過程の解明

Tree法などによるアルゴリズム的な高速化では精度が足りず、直接計算が必要。重力加速度と 加速度微分(jerk)の計算をGPUで加速し,高い精度の軌道計算を実現。

 

3.原子核分野

実時間・実空間計算法によるフェルミオン多粒子系のシミュレーション

方法論:時間依存密度汎関数理論(TDDFT, TDHF, TDHFB)の実時間・実空間(3次元差分)解法

GPU計算の利点:ハミルトニアンの波動関数への作用がホットスポットであり、GPUによる高効率な計算が期待できる。

原子核の応答・反応ダイナミクスの研究

元素合成の解明に関連する原子核の生成・応答・反応。
r過程核を生成する核子移行反応
軽い核の融合反応
原子核応答の系統的計算

中性子過剰核を生成する原子核衝突のTDHFシミュレーション

原子核分野で発展した手法の関連分野への応用

光と物質の相互作用の第一原理計算
高強度パルス光の物質伝播
アト秒(10-18s)科学への展開

パルスレーザーにより誘起される固体結晶中のアト秒電子ダイナミクス

4.物質分野

目的:物質の構造や動的な過程の解明と量子過程の制御

計画:量子多体に対して汎用の時間依存Schrodinger 方程式を解く方法の開発

特徴:計算量が多い、並列化がしやすい、GPUが有効(同じ計算手法で多種類の原子・分子・クラスターの様々な過程を研究できる、バラメータが多い)

制御の例

オージェ崩壊できない原子にレーザーを加えることによって、オージェ崩壊させる。レーザー強度と到着時刻によって、何時、どの程度崩壊させるかを制御できる(図に示した崩壊率の計算がGPU(Tesla C2050)で半日ぐらいかかるが、分子・クラスターの場合は計算量が100倍以上になってしまう)。

期待される成果

数値計算で、短時間に(フェト秒、及びアト秒の範囲)動的な過程に対して有効な制御方法を見つけることが期待される。


オージェ崩壊率とレーザー強度の関係。実測計算速度270 Gflops /GPU [ Phys. Rev. Lett. 106 (2011) 053002.]

5.生命分野

生命計算科学フロンティアの新展開

 

6.地球環境分野

次世代型大気大循環モデルNICAMのGPU化

Large Eddy Simulation(LES)のGPU化

3次元ノーマルモード展開のGPU化

期待される成果

LESモデルのGPU化によって、空間分解能10mでの計算が可能となる。

NICAMは物理過程の計算にGPUを用いることで、計算時間の大幅な短縮が期待される。

高解像度での大気大循環のエネルギー循環の計算が可能に。

GPU使用の有効性

一般的に格子点方の気象モデルはステンシル計算になるため、メモリーアクセスが比較的単純になるので、高いメモリバンド幅を持つGPUを使用することで、数倍から数十倍の高速化が期待される。


空間分解能50mの地形

7.データ基盤分野

GPGPUによる大規模データベースからの知識発見

目的と計画

大規模データベースからの知識発見(マイニング)を、GPUを用いて高速化

対象とするマイニングアルゴリズム

文書クラスタリング:PLSI (Probabilistic Latent Semantic Indexing)、LDA (Latent Dirichret Allocation)
(確率的)相関ルールマイニング

単体GPUの手法は一部確立済み

GPUクラス手向けにマルチGPU化を行う

期待される成果とブレイクスルー

数値計算、シミュレーション以外のGPUクラスターの応用を目指す。

計算機科学分野では、データマイニングのマルチGPU化の事例は少ない。

GPUクラスターの、大規模データ分析プラットフォームとしての利用を加速。

GPU使用の有効性

データやマイニングアルゴリズムによって適・不適あり。

CPUとGPUを適切に組合せることによって高い実行性能が期待される。

計算規模

少なくとも、単体GPUで実行が困難な規模のデータを想定。