9-1 汚染物質拡散解析の高速化

−GPUスーパーコンピュータに適した通信削減型時間発展法の開発−

図9-2 通信削減型時間発展法のアルゴリズム

図9-2 通信削減型時間発展法のアルゴリズム

各格子点では隣接格子点(x方向)の情報を用いて物理量の時間ステップ(y方向)を進めます。通信削減型時間発展法では、複数時間ステップ分(4回)の袖領域をまとめて計算及び隣接GPU(z方向)と通信することで、袖領域内の通信回数を最大で1/4に削減します。

 

図9-3 シミュレーション時間と実時間の比のスケーリング

図9-3 シミュレーション時間と実時間の比のスケーリング

TSUBAME3.0を用いた並列計算でのスケーリング結果となります。通信削減型時間発展法()により実時間処理(縦軸が1との交点)が100台のGPUにより実現され、従来の時間発展法()の400台に対して大幅な高速化が達成されました。

 


緊急時における、大気中への汚染物質の拡散予測を目的として高解像度風況解析コードが開発されています。このような風況解析は原子力分野だけでなくスマートシティ設計等、幅広い産業応用ニーズがあります。都市部は高層ビルが密集した複雑な形状をしており風の流れが乱流状態となるため、マルチスケールの大規模解析が必須となります。また、汚染物質の拡散予測には実時間よりも速い解析が求められます。しかしながら、私たちが開発している既存の局所風況解析手法では、都市街区を捉えた数メートル解像度及び数キロメートル四方の計算領域に対する実時間解析は不可能であるため、それを克服した新たな数値流体解析手法を開発する必要があります。

本研究では流れのスケールに応じて格子解像度を変化させる適合細分化格子法に基づく流体解析コードに対して、画像処理用に開発されたGPUを用いて高速処理することにより上記課題を解決しました。GPU型スーパーコンピュータでは従来の汎用CPU型スーパーコンピュータに比べてプロセッサ当たりの演算性能は10倍程度向上しますが、プロセッサ間の通信性能は同程度となっており、GPU間の通信処理が大きなボトルネックとなります。特にGPUによる並列処理の場合には、袖領域の通信に関連した袖領域データの変換や並列計算機間のデータの同期処理等の複雑な前処理や後処理が必要となるため、それらの処理の高速化が求められていました。本研究では、この問題の解決策として、ボトルネックとなる処理を別の処理に置き換えることで同一の結果が実現できるテンポラルブロッキング法に基づく通信削減型時間発展法を開発しました(図9-2)。従来の時間発展法では、各GPUは計算領域のみに対して計算を行い、時間ステップ(y方向)を進めるごとに隣接したGPU(z方向)と通信を行って袖領域を更新します。新しい手法では袖領域に対する逐次の通信処理を、袖領域の冗長な時間発展計算(図9-2:) 及び複数時間ステップ分の通信処理(図9-2:)に置き換えることで、ボトルネックとなっていた袖領域の通信処理を削減しました。

提案手法の実証実験として、国内最大級のGPU型スーパーコンピュータであるTSUBAME3.0(東京工業大学)を用いた風況解析を実施しました。袖領域を4格子と設定した条件では、新しい手法によって袖通信のコストを64%削減し、全体で約1.6倍の性能向上を達成しました(図9-3)。この性能向上により、1 m解像度2 km四方の実時間風況解析が100台のGPUで実現できました。以上の成果により、緊急時の汚染物質拡散予測やスマートシティ設計などの現実問題に適用可能な高解像度の風況解析が、実時間で実施できる見込みが立てられました。

本研究は、学際大規模情報基盤共同利用・共同研究拠点(課題番号:jh180041-NAH)の支援により得られた成果の一部です。