4倍精度Basic Linear Algebra Subprograms on GPU
:QPBLAS-GPU
QPBLAS-GPU 1.0
QPBLAS-GPU 1.0がリリースされました。
ダウンロード
ソースコード |
---|
サンプル(左枠内のリンクはマニュアルの説明箇所になります) |
|
---|---|
ライセンス
オープンソースとし、2条項BSDライセンスとします。
過去のバージョン
バージョン 0.9 |
|
プログラム開発の目的及び概要
一般に、大規模シミュレーションはプロセッサを多数並べた並列計算機を利用することで原理的に実現可能であり、プロセッサ毎の利用可能メモリーを集めれば全体として巨大なメモリー領域が確保され、超並列シミュレーションが実行可能となる。しかし、計算機上での演算は有限の有効桁数で実施するため、1回の演算ごとに丸め誤差が混入し、演算量の増加とともに累積誤差は増大する。従来規模のシミュレーションでは、累積誤差の影響は顕在化していなかったが、京コンピュータや今後開発される超大規模並列計算機の性能を極限まで利用したシミュレーションを行うと、場合によっては計算精度が大きく損われる可能性がある。そこで、日本原子力研究開発機構・システム計算科学センターは理化学研究所・計算科学研究センター・今村俊幸チームリーダーと共同研究を行い、計算機シミュレーションにおいて頻繁に利用される基本演算ルーチン群であるBLASの4倍精度化に関する研究開発を行ってきた。
その後、本研究開発の新たな発展として、近年計算速度の向上が著しいGPU上での計算に対応した4倍精度BLASルーチンの研究開発を、東京大学・新領域創成科学研究科・奥田洋司教授と共同研究を行い、QPBLAS-GPUを開発した。従来利用されてきたBLASルーチンに対し、対応するQPBLAS-GPUのルーチンで置き換えることで、簡単に4倍精度化および高速化が可能となる。また、基本演算に留まらず、GPUに対応したアプリケーションならば4倍精度計算が利用可能となり、利用者はGPU上で手軽に4倍精度計算を実施できる。今後、4倍精度化は全ての大規模シミュレーションに共通な普遍的問題へと広がる可能性も高いと考え、計算科学分野の進展や我が国の基盤技術強化に資するため、その開発成果を機構外の研究者にも提供する。
参考文献
[1]BLAS:http://www.netlib.org/blas/
[2]MPACK (multiple precision arithmetic versions of BLAS and LAPACK) :
http://mplapack.sourceforge.net
(理研中田氏による高精度線形代数演算ライブラリ)
開発者
システム計算科学センター・シミュレーション技術開発室 山田進、佐々成正、町田昌彦
理化学研究所・計算科学研究センター・大規模並列数値計算技術研究チーム 今村俊幸
東京大学・新領域創成科学研究科 奥田洋司
連絡先
ccse-quad(at)ml.jaea.go.jp
※ (at) は @ に置き換えて下さい。