研究部門主任
研究分野の概要
最先端の計算科学を推進するためには、常に超高速・大容量計算が要求されます。その要望に応えるため、様々なハードウエアおよびソフトウエアの研究開発を行っています。センター内の応用系の研究部門との連携により、実問題に対する理想的な高性能計算システムの提供を目指しています。
研究紹介
①分野の説明
高性能計算システム研究部門では、最先端の計算科学の推進のために求められる超高速・大容量計算の要望に応えるため、様々な高性能計算(HPC)向けハードウエアおよびソフトウエアの研究開発を行っています。センター内の各応用分野チームとの連携により、実問題に対する理想的なHPCシステムの提供を目指しています。
研究対象は、高性能計算アーキテクチャ、並列プログラミング言語、大規模並列向け数値計算アルゴリズムおよびライブラリ、GPUなどの演算加速システム、大規模分散ストレージシステム、グリッド/クラウド環境など、多岐に渡ります。
②研究トピックスと成果
多重複合型演算加速計算システム
GPU (Graphics Processing Unit)は、大規模な超高速並列システムの演算性能を大幅に高めることで高い演算加速性能を持ちますが、並列性が低かったり頻繁な並列通信を求めるアプリケーションでは十分に性能を発揮できません。我々はこの問題に対し、GPUとFPGA (Field Programmable Gate Array)を組み合わせ、両デバイスの持つ並列演算特性を組み合わせ、さらにFPGAが持つ高性能並列通信チャネルを組み合わせた、Strong Scaling並列性を高めるシステムコンセプト AiS (Accelerator in Switch)の研究を行なっています。同コンセプトは2019年4月から本センターで運用を開始した新型スーパーコンピュータCygnusに全面的に採用されています。今後、各種アプリケーションへの適用を行いその有効性を示し、次世代の演算加速システムの姿を提案します。
図1 FPGA間通信性能(左)、GPU・FPGA間DMA通信性能(右)
エクストリームビッグデータの基盤技術
エクストリームビッグデータ(EBD)アプリケーションの実行に求められる、数万~数十万プロセスからの並列アクセスを想定したIOPS、プロセス数に比例した読込、書込アクセスバンド幅性能を目標として、分散オブジェクトストアの研究を行っています。POSIXインターフェースに基づく分散メタデータサーバPPMDSの研究開発を進めています。ビッグデータサイエンスに関する研究としては、すばる望遠鏡におけるHyper Sprime-Cam(HSC)で撮影された天体データのパイプラインデータ処理の高速化を行っています。従来使われていたGPFSファイルシステムの代わりに、計算ノード数を増やしても性能が頭打ちにならないGfarmファイルシステムとデータ解析ワークフローに対しPwrakeを用い、高速化を図っています。
図2 PPMDSメタデータサーバのスケーラビリティ(上)と、HSC処理における従来のGPFSによる処理(中央)と我々の手法による処理(右)の比較
高性能・大規模並列数値アルゴリズム
FFTEは我々の部門で開発されているオープンソースな高性能並列FFTライブラリで、自動チューニング機構を持ち、PCクラスタから超並列システムまで幅広く対応します。また、複数右辺ベクトルをもつ連立一次方程式の近似解を高精度に計算する数値解法の研究を行っています。開発されたBlock GWBiCGSTAB法は、従来法よりも高精度の近似解を得ることを可能にしました。
図3 Oakforest-PACS(1024ノード)における並列一次元FFTの性能(左)とブロッククリロフ部分空間反復法の近似解精度(右)
関連リンク:ハイパフォーマンス・コンピューティング・システム研究室
(最終更新日:2019.12.10)