プロジェクトの目的

超高速計算を軸とする計算科学研究と、それを支える最先端の計算機科学を密に連携・協働する「学際計算科学」のアプローチにより、エクサフロップス(毎秒100京回の演算性能)の実現に向けて、計算基盤の能力および機能の飛躍的な向上をめざしたハード・ソフト双方の要素技術の確立と、計算科学の重要アプリケーションの革新に取り組みます。

特に、限られた電力の中で最大の演算性能を引き出せると期待される演算加速装置を中心とした大規模並列システムにおいて、装置間通信性能の向上と大規模システムの構築を可能とするTCA(Tightly Coupled Accelerators: 密結合並列演算加速機構)の提案、及びこれらに基づく計算科学アプリケーションの大規模化・高速化を次世代計算科学における重要課題と位置づけ、アプリケーション研究者とシステム研究者の共同研究による研究開発を進めます。

これをエクサスケール・システム実現の礎にするとともに、実証システムにより最先端の計算科学を着実に開拓し、先端学際計算科学教育研究拠点の充実を図り、これからの計算科学を担う人材の育成を行います。

HA-PACSプロジェクト3つの課題

背景および必要性

期待される成果

年次計画

課題と対策

HA-PACSプロジェクト3つの課題

課題1 エクサスケール実現へ向けた計算科学の革新

密結合演算加速機構により加速する、計算科学アプリケーション・アルゴリズムの研究開発を行います。密結合並列演算加速機構実証システムHA-PACSによって、計算科学研究センター重点3分野のグランドチャレンジ・アプリケーションへ挑戦し、先端領域の開拓を行います。

ha-pacs1

課題2 密結合並列演算加速機構アーキテクチャの研究開発と実証システムの構築

TCA(密結合並列演算加速機構)アーキテクチャの研究開発

演算加速機構を直結するPEARL(PCI-Express Adaptive and Reliable Link)ネットワークリンクを開発します。演算加速機構としては、GPGPU(本来グラフィック処理に用いられていたプロセッサを科学技術計算の加速機構として利用)を基本とし、さらにGrape-DR等の演算加速機構についても検討します。また、演算加速機構間の通信を直結するPEACH2 (PCI-Express Adaptive Communication Hub ver.2)チップにより、通信性能の改善を図り、新規アプリケーションの開拓を行います。

密結合並列演算加速機構実証システムHA-PACSの構築

上記の加速機構を搭載したノードクラスター(Node Cluster)をInfinibandネットワークにより並列化した1ペタフロップス規模のシステムを開発します。

ha-pacs2

課題3 演算加速機構のプログラミングを支援する基本ソフトウエアの研究開発

TCA機構をユーザアプリケーション上で利用可能とするためのシステムファームウェア、システムソフトウェア及びアプリケーションAPIの開発を行います。TCA機構は高性能通信機構であるだけでなく、そこに直結された演算加速装置間の能動的かつ超高速な通信を実現する新しいコンセプトです。このため、その制御は複雑で、様々な階層のシステムソフトウェアの構築が必要です。これらを開発し、高速な並列アプリケーション開発を実現します。

背景および必要性

  • ・計算科学は、21世紀の科学の最先端を切り拓く、最も重要な「実験・観測装置」です。
  • ・京速コンピュータ「京」(10ペタフロップス)が平成24年に完成予定ですが、国内外では、その先のエクサフロップス(10ペタの100倍)を目指す動きがあります。
  • ・エクサスケール・システム実現への有望な手段である演算加速機構を利用するには、アルゴリズムやプログラミングの工夫が必要です。
  • ・筑波大学計算科学研究センターは、広範な先進的計算科学分野と高性能計算工学分野の研究者を結集し、連携協働を行う組織です。これまでに、計算機開発に多くの実績を有しています(CP-PACSが1996年TOP500で世界1位を獲得)。

期待される成果

  • ・HA-PACSにより、最先端の知の未踏領域を開拓します。
  • ・重点アプリケーションによりライフイノベーションを創出し、わが国の科学技術力による成長力の強化に貢献します。
  • ・演算加速機構を活用した優れた電力効率のスーパーコンピュータで、情報通信のグリーンイノベーションに貢献します。
  • ・これからの計算科学に必要な「学際計算科学」を担う人材育成を行います。

年次計画

ha-pacs3

課題と対策

課題1 現在のすべてのアプリケーションがそのまま、演算加速機構に使えるわけではない

対策 計算科学研究センターの学際計算科学の推進体制を大いに活用し、性能を大幅に向上させるためのアプリケーションの選択、モデルの見直し、アルゴリズム研究を行います。

課題2 現在の演算加速機構(GPU)では通信速度がボトルネックになっている

これまで行ってきたネットワークリンクの開発成果を活用し、演算加速機構(GPU)を直結して、通信速度を大幅に改善する密結合並列加速機構アーキテクチャを開発します。

課題3 演算加速機構を使いこなすためのプログラミングが困難

これまで行ってきた並列プログラミング言語の開発成果を活用し、演算加速機構のソフトウエア開発を容易にするプログラミング言語・基本ソフトウエアを研究開発します。