● 最先端の省通信アルゴリズムによって流体計算、構造解析、量子計算等の大規模科学技術計算の並列処理を高速化
● MPI+OpenMP/CUDA並列処理による高性能計算
キーワード: スーパーコンピュータ、高速化
■メニーコアCPUおよびGPU向きにMPI(プロセッサ間並列処理)とOpenMPもしくはCUDA(プロセッサ内並列処理)を組み合わせたハイブリッド並列処理を実装し従来 ソルバと比べて計算コストとメモリ使用量を削減。
■従来のクリロフ部分空間法(CG法、BiCGstab法、GMRES法)に加えて最新の省通信クリロフ部分空間法(チェビシェフ基底省通信CG法、省通信GMRES法)を採用し、 大規模並列処理で問題となる通信処理のボトルネックを解決。
■データインターフェースとして3つの行列形式(Compressed Row(CRS)形式、Diagonal(DIA)形式、領域分割(DDM)形式)、2つのデータ型(倍精度、4倍精度) をサポートし、CおよびFortranで書かれた幅広い科学技術計算コードに対応。
7683格子の3次元ポアソン方程式をSGI8600スーパーコンピュータにおける32台のCPUもしくはGPUで計算し、米国エネルギー省で開発されたPETScおよびNVIDIA社で開発されたAmgXと処理時間、 メモリ使用量を比較。CPUではPETScに対して1/3のメモリ使用量で処理時間を4割削減。GPUではAmgXに対して同程度のメモリ使用量で処理時間を2割削減。
技術のステージ
|
利用分野
|
---|---|
流体計算、構造解析、量子化学計算等、大規模疎行列 の連立一次方程式を取扱う科学技術計算分野 |
関連業種
|
知財・関連技術情報
|
---|---|
学術・開発研究機関 |
オープンソース行列計算ライブラリ「PARCEL」(https://ccse.jaea.go.jp/software/PARCEL/) |