1 クリロフ部分空間法

　本ライブラリルーチンで用いた各反復法アルゴリズムについて紹介する. 以下では,n $\times$ nの実行列Aを係数行列に持つ連立一次方程式 $Ax = b$ を解くものとする.ここでは,適当な前処理行列を $K$ ,初期値ベクトルを $x_0$ とする.

1.1 前処理付共役勾配法

　共役勾配法(CG法)は対称行列向けのクリロフ部分空間法である.

アルゴリズム

$\mathbf{{Compute\ }}\mathbf{r}^{\mathbf{0}}\mathbf{= b - A}\mathbf{x}^{\mathbf{0}}\mathbf{{\ for\ some\ initial\ guess\ }}\mathbf{x}^{\mathbf{- 1}}\mathbf{=}\mathbf{x}^{\mathbf{0}}\mathbf{\ }$
$\mathbf{p}^{\mathbf{- 1}}\mathbf{= 0}$
$\mathbf{\alpha}_{\mathbf{- 1}}\mathbf{= 0\ }\mathbf{\ }$
$\mathbf{\beta}_{\mathbf{- 1}}\mathbf{= 0}$
$\mathbf{{solve\ s\ from\ }}\mathbf{K}\mathbf{s = \ }\mathbf{r}^{\mathbf{0}}$
$\mathbf{\rho}_{\mathbf{0}}\mathbf{=}\left\langle \mathbf{s,}\mathbf{r}^{\mathbf{0}} \right\rangle$
$\mathbf{for\ i = 0,1,2,3}\mathbf{\ldots}$
　　 $\mathbf{p}^{\mathbf{i}}\mathbf{= s +}\mathbf{\beta}_{\mathbf{i - 1}}\mathbf{p}^{\mathbf{i - 1}}$
　　 $\mathbf{q}^{\mathbf{i}}\mathbf{= A}\mathbf{p}^{\mathbf{i}}$
　　 $\mathbf{\gamma =}\left\langle \mathbf{p}^{\mathbf{i}}\mathbf{,}\mathbf{q}^{\mathbf{i}} \right\rangle$
　　 $\mathbf{x}^{\mathbf{i}}\mathbf{=}\mathbf{x}^{\mathbf{i - 1}}\mathbf{+}\mathbf{\alpha}_{\mathbf{i - 1}}\mathbf{p}^{\mathbf{i - 1}}$
　　 $\mathbf{\alpha}_{\mathbf{i}}\mathbf{=}\mathbf{\rho}_{\mathbf{i}}\mathbf{\ /\ \gamma}$
　　 $\mathbf{r}^{\mathbf{i + 1}}\mathbf{=}\mathbf{r}^{\mathbf{i}}\mathbf{-}\mathbf{\alpha}_{\mathbf{i}}\mathbf{q}^{\mathbf{i}}$
　　 $\mathbf{{solve\ s\ from\ }}\mathbf{K}\mathbf{s = \ }\mathbf{r}^{\mathbf{i + 1}}$
　　 $\mathbf{\rho}_{\mathbf{i + 1}}\mathbf{=}\left\langle \mathbf{s,}\mathbf{r}^{\mathbf{i + 1}} \right\rangle$
　　 $\mathbf{{if\ }}\left\| \mathbf{r}^{\mathbf{i + 1}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ the}}\mathbf{n}$
　　　　 $\mathbf{x}^{\mathbf{i}}\mathbf{=}\mathbf{x}^{\mathbf{i - 1}}\mathbf{+}\mathbf{\alpha}_{\mathbf{i - 1}}\mathbf{p}^{\mathbf{i - 1}}$
　　　　 $\mathbf{{qui}}\mathbf{t}$
　　 $\mathbf{{endi}}\mathbf{f}$
　　 $\mathbf{\beta}_{\mathbf{i}}\mathbf{=}\mathbf{\rho}_{\mathbf{i + 1}}\mathbf{\ /\ }\mathbf{\rho}_{\mathbf{i}}$
$\mathbf{{\ en}}\mathbf{d}$

1.2 前処理付安定化双共役勾配法

　安定化双共役勾配法(Bi-CGSTAB)は非対称行列向けのクリロフ部分空間法である.

アルゴリズム

$\mathbf{{Compute\ }}\mathbf{r}_{\mathbf{0}}\mathbf{= b - A}\mathbf{x}_{\mathbf{0}}\mathbf{{\ for\ some\ initial\ guess\ }}\mathbf{x}_{\mathbf{- 1}}\mathbf{=}\mathbf{x}_{\mathbf{0}}$
$\mathbf{p}_{\mathbf{0}}\mathbf{=}\mathbf{r}_{\mathbf{0}}$
$\mathbf{c}_{\mathbf{1}}\mathbf{=}\left\langle \mathbf{r}_{\mathbf{0}}\mathbf{,}\mathbf{r}_{\mathbf{0}} \right\rangle$
$\mathbf{for\ i = 0,1,2,3}\mathbf{\ldots}$
　　 $\mathbf{{solve\ }}\widehat{\mathbf{p}}\mathbf{{\ from\ K}}\widehat{\mathbf{p}}\mathbf{= \ }\mathbf{p}_{\mathbf{i}}$
　　 $\mathbf{q = A}\widehat{\mathbf{p}}$
　　 $\mathbf{c}_{\mathbf{2}}\mathbf{=}\left\langle \mathbf{r}_{\mathbf{0}}\mathbf{,q} \right\rangle$
　　 $\mathbf{\alpha =}\mathbf{c}_{\mathbf{1}}\mathbf{\ /\ }\mathbf{c}_{\mathbf{2}}$
　　 $\mathbf{e =}\mathbf{r}_{\mathbf{i}}\mathbf{- \alpha q}$
　　 $\mathbf{{solve\ }}\widehat{\mathbf{e}}\mathbf{{\ from\ K}}\widehat{\mathbf{e}}\mathbf{= e}$
　　 $\mathbf{v = A}\widehat{\mathbf{e}}$
　　 $\mathbf{c}_{\mathbf{3}}\mathbf{=}\left\langle \mathbf{e,v} \right\rangle\mathbf{\ /\ }\left\langle \mathbf{v,v} \right\rangle$
　　 $\mathbf{x}_{\mathbf{i + 1}}\mathbf{=}\mathbf{x}_{\mathbf{i}}\mathbf{+ \alpha}\widehat{\mathbf{p}}\mathbf{+}\mathbf{c}_{\mathbf{3}}\widehat{\mathbf{e}}$
　　 $\mathbf{r}_{\mathbf{i + 1}}\mathbf{= e -}\mathbf{c}_{\mathbf{3}}\mathbf{v}$
　　 $\mathbf{c}_{\mathbf{1}}\mathbf{=}\left\langle \mathbf{r}_{\mathbf{0}}\mathbf{,}\mathbf{r}_{\mathbf{i + 1}} \right\rangle$
　　 $\mathbf{{if\ }}\left\| \mathbf{r}_{\mathbf{i + 1}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ }}\mathbf{{the}}\mathbf{n}$
　　　　 $\mathbf{{quit}}$
　　 $\mathbf{{endif}}$
　　 $\mathbf{\beta =}\mathbf{c}_{\mathbf{1}}\mathbf{\ /\ }\left( \mathbf{c}_{\mathbf{2}}\mathbf{c}_{\mathbf{3}} \right)$
　　 $\mathbf{p}_{\mathbf{i + 1}}\mathbf{=}\mathbf{r}_{\mathbf{i + 1}}\mathbf{+ \beta}\left( \mathbf{p}_{\mathbf{i}}\mathbf{-}\mathbf{c}_{\mathbf{3}}\mathbf{q} \right)$
$\mathbf{{end}}$

1.3 前処理付一般化最小残差法

　一般化最小残差法(GMRES(m))は非対称行列向けのクリロフ部分空間法である.リスタート周期m回の反復計算で解が収束しない場合はm回の反復で得られた解を初期値として反復を再開する.PARCELでは直交化手法として古典グラムシュミット法と修正グラムシュミット法が整備されている.

アルゴリズム

$\mathbf{H}_{\mathbf{n}}$ は $\mathbf{h}_{\mathbf{j,k}}$ を要素に持つ上三角行列, $\mathbf{\ }\mathbf{e}_{\mathbf{i}}$ はベクトル $\mathbf{e}$ の最初のi成分からなるベクトルである.

$\mathbf{for\ j = 0,1,2,3}\mathbf{\ldots}$
　　 $\mathbf{r = b - A}\mathbf{x}_{\mathbf{0}}$
　　 $\mathbf{v}_{\mathbf{1}}\mathbf{= - r\ /\ }\left\| \mathbf{r} \right\|$
　　 $\mathbf{e =}\left( \mathbf{-}\left\| \mathbf{r} \right\|\mathbf{,0,\ldots,0} \right)^{\mathbf{T}}$
　　 $\mathbf{n = m}$
　　 $\mathbf{for\ i = 1,2,3}\mathbf{\ldots}\mathbf{m}$
　　　　 $\mathbf{{solve\ }}{\widehat{\mathbf{v}}}_{\mathbf{i}}\mathbf{{\ from\ K}}{\widehat{\mathbf{v}}}_{\mathbf{i}}\mathbf{=}\mathbf{v}_{\mathbf{i}}$
　　　　 $\mathbf{\omega = A}{\widehat{\mathbf{v}}}_{\mathbf{i}}$
　　　　 $\mathbf{for\ k = 1,2,3}\mathbf{\ldots}\mathbf{i}$
　　　　　　 $\mathbf{h}_{\mathbf{k,i}}\mathbf{=}\left\langle \mathbf{\omega,}\mathbf{v}_{\mathbf{k}} \right\rangle$
　　　　　　 $\mathbf{\omega = \omega -}\mathbf{h}_{\mathbf{k,i}}\mathbf{v}_{\mathbf{k}}$
　　　　 $\mathbf{{end}}$
　　　　 $\mathbf{h}_{\mathbf{i + 1,i}}\mathbf{=}\left\| \mathbf{\omega} \right\|$
　　　　 $\mathbf{v}_{\mathbf{i + 1}}\mathbf{= \omega/}\left\| \mathbf{\omega} \right\|$
　　　　 $\mathbf{for\ k = 1,2,3}\mathbf{\ldots}\mathbf{i - 1}$
　　　　　　 $\begin{pmatrix} \mathbf{h}_{\mathbf{k,i}} \\ \mathbf{h}_{\mathbf{k + 1,i}} \\ \end{pmatrix}\mathbf{=}\begin{pmatrix} \mathbf{c}_{\mathbf{i}} & \mathbf{- s}_{\mathbf{i}} \\ \mathbf{s}_{\mathbf{i}} & \mathbf{c}_{\mathbf{i}} \\ \end{pmatrix}\begin{pmatrix} \mathbf{h}_{\mathbf{k,i}} \\ \mathbf{h}_{\mathbf{k + 1,i}} \\ \end{pmatrix}$
　　　　 $\mathbf{{end}}$
　　　　 $\mathbf{c}_{\mathbf{i}}\mathbf{=}\frac{\mathbf{1}}{\sqrt{\mathbf{1 +}\left( \frac{\mathbf{h}_{\mathbf{i + 1,i}}}{\mathbf{h}_{\mathbf{i,i}}} \right)^{\mathbf{2}}}}$
　　　　 $\mathbf{s}_{\mathbf{i}}\mathbf{= -}\frac{\mathbf{h}_{\mathbf{i + 1,i}}}{\mathbf{h}_{\mathbf{i,i}}}\frac{\mathbf{1}}{\sqrt{\mathbf{1 +}\left( \frac{\mathbf{h}_{\mathbf{i + 1,i}}}{\mathbf{h}_{\mathbf{i,i}}} \right)^{\mathbf{2}}}}$
　　　　 $\begin{pmatrix} \mathbf{e}_{\mathbf{i}} \\ \mathbf{e}_{\mathbf{i + 1}} \\ \end{pmatrix}\mathbf{=}\begin{pmatrix} \mathbf{c}_{\mathbf{i}} & \mathbf{- s}_{\mathbf{i}} \\ \mathbf{s}_{\mathbf{i}} & \mathbf{c}_{\mathbf{i}} \\ \end{pmatrix}\begin{pmatrix} \mathbf{e}_{\mathbf{i}} \\ \mathbf{e}_{\mathbf{i + 1}} \\ \end{pmatrix}$
　　　　 $\mathbf{h}_{\mathbf{i,i}}\mathbf{=}\mathbf{c}_{\mathbf{i}}\mathbf{h}_{\mathbf{i,i}}\mathbf{- \ }\mathbf{s}_{\mathbf{i}}\mathbf{h}_{\mathbf{i + 1,i}}$
　　　　 $\mathbf{h}_{\mathbf{i + 1,i}}\mathbf{= 0}$
　　　　 $\mathbf{{if\ }}\left\| \mathbf{e}_{\mathbf{i + 1}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ }}\mathbf{{then}}$
　　　　　　 $\mathbf{n = i}$
　　　　　　 $\mathbf{{exit}}$
　　　　 $\mathbf{{endif}}$
　　 $\mathbf{{end}}$
　　 $\mathbf{y}_{\mathbf{n}}\mathbf{=}\mathbf{H}_{\mathbf{n}}^{\mathbf{- 1}}\mathbf{e}_{\mathbf{n}}$
　　 $\mathbf{{solve\ }}\widehat{\mathbf{x}}\mathbf{{\ from\ K}}\widehat{\mathbf{x}}\mathbf{=}\sum_{\mathbf{k = 1}}^{\mathbf{n}}{\mathbf{y}_{\mathbf{k}}\mathbf{v}_{\mathbf{k}}}$
　　 $\mathbf{x}_{\mathbf{n}}\mathbf{=}\mathbf{x}_{\mathbf{0}}\mathbf{+}\widehat{\mathbf{x}}$
　　 $\mathbf{x}_{\mathbf{0}}\mathbf{=}\mathbf{x}_{\mathbf{n}}$
$\mathbf{{end}}$

1.4 前処理付通信削減型一般化最小残差法

　通信削減型一般化最小残差法(CA-GMRES(s,t))は非対称行列向けのクリロフ部分空間法である. GMRES(m)のs回反復に相当する計算を1反復で行う. t回の反復で収束しない場合はt回の反復で得られた近似解を初期解として反復を再開する. m = t $\times$ sがGMRES(m)のリスタート周期に相当する. 数学的にはCA-GMRES(s,t)とGMRES(m)の収束性は同等であり,通信削減型のQR分解を適用することでGMRES(m)よりも集団通信の回数を削減する. ただし,一度にs本の基底ベクトルを生成するため,sが過大な場合には,丸め誤差によって基底ベクトルの直交性が崩れることでGMRESよりも収束性が悪くなる.PARCELでは基底ベクトルの直交性改善のために単基底に加えてNewton基底が整備されている.

アルゴリズム

ここで, $\mathbf{e}$ は単位ベクトル, ${\widetilde{\mathbf{\rho}}}_{\mathbf{k}}$ は $\mathbf{R}_{\mathbf{k}}$ のs行s列要素, $\mathbf{E}$ は反復の過程で得られるヘッセンベルグ行列から求めた固有値である.

$\mathbf{B}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{= \lbrack}\mathbf{e}_{\mathbf{2}}\mathbf{,}\mathbf{e}_{\mathbf{3}}\mathbf{,\ldots,}\mathbf{e}_{\mathbf{s + 1}}\mathbf{\rbrack}$
$\mathbf{for\ j = 0,1,2,3\ldots}$
　　 $\mathbf{r = b - A}\mathbf{x}_{\mathbf{0}}$
　　 $\mathbf{v}_{\mathbf{1}}\mathbf{= r\ /\ }\left\| \mathbf{r} \right\|$
　　 $\mathbf{\zeta =}\left( \left\| \mathbf{r} \right\|\mathbf{,0,\ldots,0} \right)^{\mathbf{T}}$
　　 $\mathbf{for\ k = 0,1\ldots,t - 1}$
　　　　 $\mathbf{Fix\ basis\ conversion\ matrix\ \lbrack}\mathbf{B}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{,E\rbrack}$
　　　　 $\mathbf{Comupute\ \ basic\ vector\ \ \lbrack\ s,}{\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{,}\mathbf{B}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{\ \rbrack}$
　　　　 $\mathbf{if(k.eq.0)}$
　　　　　　 $\mathbf{{QR\ decomposition\ }}\mathbf{V}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{=}\mathbf{Q}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{R}_{\mathbf{0}}^{\mathbf{\sim}}$
　　　　　　 $\mathfrak{Q}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{=}\mathbf{Q}_{\mathbf{0}}^{\mathbf{\sim}}$
　　　　　　 $\mathfrak{H}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{=}\mathbf{R}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{B}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{R}_{\mathbf{0}}^{\mathbf{- 1}}$
　　　　　　 $\mathcal{H}_{\mathbf{0}}\mathbf{=}\mathfrak{H}_{\mathbf{0}}^{\mathbf{\sim}}$
　　　　　　 $\mathbf{for\ o = 1,2\ldots,s}$
　　　　　　 $\mathbf{Givens\ rotation\ \lbrack o,}\mathcal{H}_{\mathbf{0}}\mathbf{,\zeta\rbrack}$
　　　　　　 $\mathbf{{if\ }}\left\| \mathbf{\zeta}_{\mathbf{o + 1}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ then}}$
　　　　　　　　 $\mathbf{update\ \ solution\ \ vector\lbrack s,k,o,}{\acute{\mathbf{V}}}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{,}{\acute{\mathbf{Q}}}_{\mathbf{0}}^{\mathbf{\sim}}\mathbf{,}\mathbf{R}_{\mathbf{0}}\mathbf{,}\mathcal{H}_{\mathbf{0}}\mathbf{,\zeta,}\mathbf{x}_{\mathbf{0}}\mathbf{\ \rbrack}$
　　　　　　　　 $\mathbf{{quit}}$
　　　　　　 $\mathbf{{endif}}$
　　　　 $\mathbf{{else}}$
　　　　　　 ${\acute{\mathfrak{R}}}_{\mathbf{k - 1,k}}^{\mathbf{\sim}}\mathbf{=}\left( \mathfrak{Q}_{\mathbf{k - 1}}^{\mathbf{\sim}} \right)^{\mathbf{H}}{\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}$
　　　　　　 ${\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{=}{\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{-}\mathfrak{Q}_{\mathbf{k - 1}}^{\mathbf{\sim}}{\acute{\mathfrak{R}}}_{\mathbf{k - 1,k}}^{\mathbf{\sim}}$
　　　　　　 $\mathbf{{QR\ decomposition\ }}{\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{=}{\acute{\mathbf{Q}}}_{\mathbf{k}}^{\mathbf{\sim}}{\acute{\mathbf{R}}}_{\mathbf{k}}^{\mathbf{\sim}}$
　　　　　　 $\mathbf{R}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{=}\begin{pmatrix} \mathbf{R}_{\mathbf{k}} & \mathbf{z}_{\mathbf{k}} \\ \mathbf{0}_{\mathbf{1,k}} & \mathbf{\rho} \\ \end{pmatrix}$
　　　　　　 $\mathfrak{H}_{\mathbf{k - 1,k}}^{\mathbf{\sim}}\mathbf{= -}\mathfrak{H}_{\mathbf{k - 1}}\mathfrak{R}_{\mathbf{k - 1,k}}\mathbf{R}_{\mathbf{k}}^{\mathbf{- 1}}\mathbf{+}\mathfrak{R}_{\mathbf{k - 1,k}}^{\mathbf{\sim}}\mathbf{B}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{R}_{\mathbf{k}}^{\mathbf{- 1}}$
　　　　　　 $\mathbf{H}_{\mathbf{k}}\mathbf{=}\mathbf{R}_{\mathbf{k}}\mathbf{B}_{\mathbf{k}}\mathbf{R}_{\mathbf{k}}^{\mathbf{- 1}}\mathbf{+}{\widetilde{\mathbf{\rho}}}_{\mathbf{k}}^{\mathbf{- 1}}\mathbf{b}_{\mathbf{k}}\mathbf{z}_{\mathbf{k}}\mathbf{e}_{\mathbf{s}}^{\mathbf{T}}\mathbf{-}\mathbf{h}_{\mathbf{k - 1}}\mathbf{e}_{\mathbf{1}}\mathbf{e}_{\mathbf{s(k - 1)}}^{\mathbf{T}}\mathfrak{R}_{\mathbf{k - 1,k}}\mathbf{R}_{\mathbf{k}}^{\mathbf{- 1}}$
　　　　　　 $\mathbf{h}_{\mathbf{k}}\mathbf{=}{\widetilde{\mathbf{\rho}}}_{\mathbf{k}}^{\mathbf{- 1}}\mathbf{\rho}_{\mathbf{k}}\mathbf{b}_{\mathbf{k}}$
　　　　　　 $\mathfrak{H}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{=}\begin{pmatrix} \mathfrak{H}_{\mathbf{k - 1}} & \mathfrak{H}_{\mathbf{k - 1,k}}^{\mathbf{\sim}} \\ \begin{matrix} \mathbf{h}_{\mathbf{k - 1}}\mathbf{e}_{\mathbf{1}}\mathbf{e}_{\mathbf{s(k - 1)}}^{\mathbf{T}} \\ \mathbf{0}_{\mathbf{1,s(k - 1)}} \\ \end{matrix} & \begin{matrix} \mathbf{H}_{\mathbf{k}} \\ \mathbf{h}_{\mathbf{k}}\mathbf{e}_{\mathbf{s}}^{\mathbf{T}} \\ \end{matrix} \\ \end{pmatrix}$
　　　　　　 $\mathcal{H}_{\mathbf{k}}\mathbf{=}\begin{pmatrix} \mathfrak{H}_{\mathbf{k - 1,k}}^{\mathbf{\sim}} \\ \mathbf{H}_{\mathbf{k}} \\ \mathbf{h}_{\mathbf{k}}\mathbf{e}_{\mathbf{s}}^{\mathbf{T}} \\ \end{pmatrix}$
　　　　　　 $\mathbf{for\ o = 1 + sk,\ldots,s(k + 1)}$
　　　　　　　　 $\mathbf{Givens\ rotation\ \lbrack o,}\mathcal{H}_{\mathbf{k}}\mathbf{,\zeta\rbrack}$
　　　　　　　　 $\mathbf{{if\ }}\left\| \mathbf{\zeta}_{\mathbf{o + 1}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ then}}$
　　　　　　　　　　 $\mathbf{update\ \ solution\ \ vector\lbrack s,k,o,}{\acute{\mathbf{V}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{,}\mathfrak{Q}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{,}{\acute{\mathbf{R}}}_{\mathbf{k}}^{\mathbf{\sim}}\mathbf{,}\mathcal{H}_{\mathbf{k}}\mathbf{,\zeta,}\mathbf{x}_{\mathbf{0}}\mathbf{\ \rbrack}$
　　　　　　　　　　 $\mathbf{{quit}}$
　　　　　　　　 $\mathbf{{endif}}$
　　　　　　 $\mathbf{{end}}$
　　　　 $\mathbf{{endif}}$
　　 $\mathbf{{end}}$
　　 $\mathbf{update\ \ solution\ \ vector\lbrack s,t - 1,st,}{\acute{\mathbf{V}}}_{\mathbf{t - 1}}^{\mathbf{\sim}}\mathbf{,}\mathfrak{Q}_{\mathbf{t - 1}}^{\mathbf{\sim}}\mathbf{,}{\acute{\mathbf{R}}}_{\mathbf{t - 1}}^{\mathbf{\sim}}\mathbf{,}\mathcal{H}_{\mathbf{t - 1}}\mathbf{,\zeta,}\mathbf{x}_{\mathbf{0}}\mathbf{\ \rbrack}$
$\mathbf{{end}}$

Fix basis conversion matrix $\mathbf{\lbrack s,B,E\rbrack}$

$\mathbf{{if\ compute\ Newton\ Basis}}$
　　 $\mathbf{i = 0}$
　　 $\mathbf{{while}}\left( \mathbf{i \leq s - 1} \right)$
　　　　 $\mathbf{{if}}\left( \mathbf{i.eq.s - 1} \right)\mathbf{{then}}$
　　　　　　 $\mathbf{B}_{\mathbf{i,i}}\mathbf{= Re\lbrack}\mathbf{E}_{\mathbf{i}}\mathbf{\rbrack}$
　　　　 $\mathbf{{else}}$
　　　　　　 $\mathbf{{if}}\left( \mathbf{{Im}}\left\lbrack \mathbf{E}_{\mathbf{i}} \right\rbrack\mathbf{.eq.0} \right)\mathbf{{then}}$
　　　　　　　　 $\mathbf{B}_{\mathbf{i,i}}\mathbf{= Re\lbrack}\mathbf{E}_{\mathbf{i}}\mathbf{\rbrack}$
　　　　　　 $\mathbf{{else}}$
　　　　　　　　 $\mathbf{B}_{\mathbf{i,i}}\mathbf{= Re\lbrack}\mathbf{E}_{\mathbf{i}}\mathbf{\rbrack}$
　　　　　　　　 $\mathbf{B}_{\mathbf{i + 1,i + 1}}\mathbf{= Re\lbrack}\mathbf{E}_{\mathbf{i}}\mathbf{\rbrack}$
　　　　　　　　 $\mathbf{B}_{\mathbf{i,i + 1}}\mathbf{= -}\left( \mathbf{Im\lbrack}\mathbf{E}_{\mathbf{i}}\mathbf{\rbrack} \right)^{\mathbf{2}}$
　　　　　　　　 $\mathbf{i = i + 1}$
　　　　　　 $\mathbf{{endif}}$
　　　　 $\mathbf{{endif}}$
　　　　 $\mathbf{i = i + 1}$
　　 $\mathbf{{end\ \ }}$
$\mathbf{{end\ \ }}$

Comupute basis vector $\mathbf{\lbrack\ s,v\ ,B\rbrack}$

$\mathbf{B}$ は $\mathbf{b}_{\mathbf{k,i}}$ を要素に持つ行列.

$\mathbf{for\ k = 1,2,3\ldots s}$
　　 $\mathbf{{solve\ }}{\widehat{\mathbf{v}}}_{\mathbf{k - 1}}\mathbf{{\ from\ K}}{\widehat{\mathbf{v}}}_{\mathbf{k - 1}}\mathbf{=}\mathbf{v}_{\mathbf{k - 1}}$
　　 $\mathbf{if(k.ne.1)then}$
　　　　 $\mathbf{\alpha =}\mathbf{b}_{\mathbf{k - 1,k - 1}}$
　　　　 $\mathbf{\beta =}\mathbf{b}_{\mathbf{k - 2,k - 1}}$
　　　　 $\mathbf{v}_{\mathbf{k}}\mathbf{= A}{\widehat{\mathbf{v}}}_{\mathbf{k - 1}}\mathbf{- \alpha}\mathbf{v}_{\mathbf{k - 1}}\mathbf{+ \beta}\mathbf{v}_{\mathbf{k - 2}}$
　　 $\mathbf{{else}}$
　　　　 $\mathbf{\alpha =}\mathbf{b}_{\mathbf{k - 1,k - 1}}$
　　　　 $\mathbf{v}_{\mathbf{k}}\mathbf{= A}{\widehat{\mathbf{v}}}_{\mathbf{k - 1}}\mathbf{- \alpha}\mathbf{v}_{\mathbf{k - 1}}$
　　 $\mathbf{{endif}}$
$\mathbf{{en}}\mathbf{d}$

Givens rotation $\mathbf{\lbrack i,}\mathcal{H,}\mathbf{\zeta\rbrack}$

　 $\mathcal{H}$ は $\mathcal{h}_{\mathbf{k,i}}$ を要素に持つ行列.

$\mathbf{for\ k = 1,2,3\ldots i - 1}$
　　 $\begin{pmatrix} \mathcal{h}_{\mathbf{k,i}} \\ \mathcal{h}_{\mathbf{k + 1,i}} \\ \end{pmatrix}\mathbf{=}\begin{pmatrix} \mathbf{c}_{\mathbf{i}} & \mathbf{- s}_{\mathbf{i}} \\ \mathbf{s}_{\mathbf{i}} & \mathbf{c}_{\mathbf{i}} \\ \end{pmatrix}\begin{pmatrix} \mathcal{h}_{\mathbf{k,i}} \\ \mathcal{h}_{\mathbf{k + 1,i}} \\ \end{pmatrix}$
$\mathbf{\text{end}}$
$\mathbf{c}_{\mathbf{i}}\mathbf{=}\frac{\mathbf{1}}{\sqrt{\mathbf{1 +}\left( \frac{\mathcal{h}_{\mathbf{i + 1,i}}}{\mathcal{h}_{\mathbf{i,i}}} \right)^{\mathbf{2}}}}$
$\mathbf{s}_{\mathbf{i}}\mathbf{= -}\frac{\mathcal{h}_{\mathbf{i + 1,i}}}{\mathcal{h}_{\mathbf{i,i}}}\frac{\mathbf{1}}{\sqrt{\mathbf{1 +}\left( \frac{\mathcal{h}_{\mathbf{i + 1,i}}}{\mathcal{h}_{\mathbf{i,i}}} \right)^{\mathbf{2}}}}$
$\begin{pmatrix} \mathbf{\zeta}_{\mathbf{i}} \\ \mathbf{\zeta}_{\mathbf{i + 1}} \\ \end{pmatrix}\mathbf{=}\begin{pmatrix} \mathbf{c}_{\mathbf{i}} & \mathbf{- s}_{\mathbf{i}} \\ \mathbf{s}_{\mathbf{i}} & \mathbf{c}_{\mathbf{i}} \\ \end{pmatrix}\begin{pmatrix} \mathbf{\zeta}_{\mathbf{i}} \\ \mathbf{\zeta}_{\mathbf{i + 1}} \\ \end{pmatrix}$
$\mathcal{h}_{\mathbf{i,i}}\mathbf{=}\mathbf{c}_{\mathbf{i}}\mathcal{h}_{\mathbf{i,i}}\mathbf{- \ }\mathbf{s}_{\mathbf{i}}\mathcal{h}_{\mathbf{i + 1,i}}$
$\mathcal{h}_{\mathbf{i + 1,i}}\mathbf{= 0}$

Update solution vector $\mathbf{\lbrack s,k,n,V,Q,R,}\mathcal{H,}\mathbf{\zeta,}\mathbf{x}_{\mathbf{0}}\mathbf{\ \rbrack}$

$\mathbf{y =}\mathcal{H}^{\mathbf{- 1}}\mathbf{\zeta}$
$\mathbf{{solve\ }}\widehat{\mathbf{x}}\mathbf{{\ from\ K}}\widehat{\mathbf{x}}\mathbf{=}\sum_{\mathbf{k = 0}}^{\mathbf{s}\mathbf{m}\mathbf{- 1}}\mathbf{Q}_{\mathbf{k}}\mathbf{y}_{\mathbf{k}}\mathbf{+}\sum_{\mathbf{l =}\mathbf{{sm}}}^{\mathbf{n - 1}}\mathbf{V}_{\mathbf{l}\mathbf{- sm}}\sum_{\mathbf{k =}\mathbf{{sm}}}^{\mathbf{n - 1}}{\mathbf{R}_{\mathbf{l - sm}\mathbf{,}\mathbf{k}\mathbf{- sm}}^{\mathbf{- 1}}\mathbf{y}_{\mathbf{k}}}$
$\mathbf{x}_{\mathbf{0}}\mathbf{=}\mathbf{x}_{\mathbf{0}}\mathbf{+}\widehat{\mathbf{x}}$

1.5 前処理付チェビシェフ基底共役勾配法法

　チェビシェフ基底共役勾配法(CBCG)は対称行列向けのクリロフ部分空間法である.CG法のk反復に相当する計算を1反復で行うことで集団通信の回数を削減する.チェビシェフ基底を用いて基底ベクトルを生成するため行列の最大・最小固有値を必要とする.PARCELでは固有値計算法としてべき乗法と通信削減型アーノルディ法が整備されている.

アルゴリズム

$\mathbf{{Compute\ }}\mathbf{r}_{\mathbf{0}}\mathbf{= b - A}\mathbf{x}_{\mathbf{0}}\mathbf{{\ for\ some\ initial\ gue}}\mathbf{{ss\ }}\mathbf{x}_{\mathbf{- 1}}\mathbf{=}\mathbf{x}_{\mathbf{0}}$
$\mathbf{Compute\ Chebyshev\ basis\ \lbrack}\mathbf{S}_{\mathbf{0}}\mathbf{,}{\mathbf{A}\mathbf{S}}_{\mathbf{0}}\mathbf{,}\mathbf{r}_{\mathbf{0}}\mathbf{,}\mathbf{\lambda}_{\mathbf{\max}}\mathbf{,}\mathbf{\lambda}_{\mathbf{\min}}\mathbf{\rbrack}$
$\mathbf{Q}_{\mathbf{0}}\mathbf{=}\mathbf{S}_{\mathbf{0}}$
$\mathbf{for\ i = 0,1,2,3\ldots}$
$\mathbf{{Compute\ }}\mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{A}\mathbf{Q}_{\mathbf{i}}\mathbf{\ ,\ }\mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{r}_{\mathbf{{ik}}}$
　　 $\mathbf{\alpha}_{\mathbf{i}}\mathbf{= \ }\left( \mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{A}\mathbf{Q}_{\mathbf{i}} \right)^{\mathbf{- 1}}\left( \mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{r}_{\mathbf{{ik}}} \right)$
　　 $\mathbf{x}_{\left( \mathbf{i + 1} \right)\mathbf{k}}\mathbf{=}\mathbf{x}_{\mathbf{{ik}}}\mathbf{+}\mathbf{Q}_{\mathbf{i}}\mathbf{\alpha}_{\mathbf{i}}$
　　 $\mathbf{r}_{\left( \mathbf{i + 1} \right)\mathbf{k}}\mathbf{=}\mathbf{r}_{\mathbf{{ik}}}\mathbf{- A}\mathbf{Q}_{\mathbf{i}}\mathbf{\alpha}_{\mathbf{i}}$
　　 $\mathbf{{if\ }}\left\| \mathbf{r}_{\left( \mathbf{i + 1} \right)\mathbf{k}} \right\|\mathbf{\ /\ }\left\| \mathbf{b} \right\|\mathbf{{\ small\ enough\ }}\mathbf{{then}}$
　　 $\mathbf{Compute\ Chebyshev\ basis\ \lbrack}\mathbf{S}_{\mathbf{i + 1}}\mathbf{,}{\mathbf{A}\mathbf{S}}_{\mathbf{i + 1}}\mathbf{,}\mathbf{r}_{\left( \mathbf{i + 1} \right)\mathbf{k}}\mathbf{,}\mathbf{\lambda}_{\mathbf{\max}}\mathbf{,}\mathbf{\lambda}_{\mathbf{\min}}\mathbf{\rbrack}$
　　 $\mathbf{{Compute\ }}\mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{A}\mathbf{S}_{\mathbf{i + 1}}$
　　 $\mathbf{B}_{\mathbf{i}}\mathbf{=}\left( \mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{A}\mathbf{Q}_{\mathbf{i}} \right)^{\mathbf{- 1}}\left( \mathbf{Q}_{\mathbf{i}}^{\mathbf{T}}\mathbf{A}\mathbf{S}_{\mathbf{i + 1}} \right)\mathbf{\ }$
　　 $\mathbf{Q}_{\mathbf{i + 1}}\mathbf{=}\mathbf{S}_{\mathbf{i + 1}}\mathbf{-}\mathbf{Q}_{\mathbf{i}}\mathbf{B}_{\mathbf{i}}$
　　 $\mathbf{A}\mathbf{Q}_{\mathbf{i + 1}}\mathbf{=}\mathbf{{AS}}_{\mathbf{i + 1}}\mathbf{-}\mathbf{{AQ}}_{\mathbf{i}}\mathbf{B}_{\mathbf{i}}$
$\mathbf{{end}}$

Compute Chebyshev basis $\mathbf{\lbrack S,AS,r,}\mathbf{\lambda}_{\mathbf{\max}}\mathbf{,}\mathbf{\lambda}_{\mathbf{\min}}\mathbf{\rbrack}$

$\mathbf{\lambda}_{\mathbf{\max}}$ , $\mathbf{\lambda}_{\mathbf{\min}}$ は $\mathbf{AK}^{-1}$ の最大及び最小固有値.

$\mathbf{\eta = 2\ /\ (}\mathbf{\lambda}_{\mathbf{\max}}\mathbf{-}\mathbf{\lambda}_{\mathbf{\min}}\mathbf{)}$
$\mathbf{\zeta =}\left( \mathbf{\lambda}_{\mathbf{\max}}\mathbf{+}\mathbf{\lambda}_{\mathbf{\min}} \right)\mathbf{\ /\ (}\mathbf{\lambda}_{\mathbf{\max}}\mathbf{-}\mathbf{\lambda}_{\mathbf{\min}}\mathbf{)}$
$\mathbf{s}_{\mathbf{0}}\mathbf{=}\mathbf{r}_{\mathbf{0}}\mathbf{\ }$
$\mathbf{{solve\ }}{\widetilde{\mathbf{s}}}_{\mathbf{0}}\mathbf{{\ from\ K}}{\widetilde{\mathbf{s}}}_{\mathbf{0}}\mathbf{= \ }\mathbf{s}_{\mathbf{0}}$
$\mathbf{s}_{\mathbf{1}}\mathbf{= \eta A}{\widetilde{\mathbf{s}}}_{\mathbf{0}}\mathbf{- \zeta}\mathbf{s}_{\mathbf{0}}$
$\mathbf{{solve\ }}{\widetilde{\mathbf{s}}}_{\mathbf{1}}\mathbf{{\ from\ K}}{\widetilde{\mathbf{s}}}_{\mathbf{1}}\mathbf{= \ }\mathbf{s}_{\mathbf{1}}$
$\mathbf{for\ j = 2,3,\ldots,k}$
　　 $\mathbf{s}_{\mathbf{j}}\mathbf{= 2\eta A}{\widetilde{\mathbf{s}}}_{\mathbf{j}}\mathbf{- 2\zeta}\mathbf{s}_{\mathbf{j - 1}}\mathbf{-}\mathbf{s}_{\mathbf{j - 2}}$
　　 $\mathbf{{solve\ }}{\widetilde{\mathbf{s}}}_{\mathbf{j}}\mathbf{{\ from\ K}}{\widetilde{\mathbf{s}}}_{\mathbf{j}}\mathbf{= \ }\mathbf{s}_{\mathbf{j}}$
$\mathbf{{end}}$
$\mathbf{S = (}{\widetilde{\mathbf{s}}}_{\mathbf{0}}\mathbf{,}{\widetilde{\mathbf{s}}}_{\mathbf{1}}\mathbf{,\ldots,}{\widetilde{\mathbf{s}}}_{\mathbf{k - 1}}\mathbf{)}$
$\mathbf{AS = (A}{\widetilde{\mathbf{s}}}_{\mathbf{0}}\mathbf{,}{\mathbf{A}\widetilde{\mathbf{s}}}_{\mathbf{1}}\mathbf{,\ldots,}{\mathbf{A}\widetilde{\mathbf{s}}}_{\mathbf{k - 1}}\mathbf{)}$

2 前処理

　一般に反復解法では, $K \approx A$ となるように前処理行列を選ぶと,収束に必要な反復回数が減少する. アルゴリズムに見られる「 ${{solve\ }}\widehat{{p}}{{\ from\ K}}\widehat{{p}}{= \ }{p}$ 」型の計算は「 ${A}\widehat{p}{= \ }{p}$ を $\widehat{p}$ について近似的に解く」ことに相当する. この近似の精度を上げれば反復回数が減少するが,逆にこの部分の計算のオーバーヘッドが増加する. 並列計算でない場合には,この近似計算に不完全LU 分解を用いることが多いが,並列計算の場合には,前処理計算の並列処理手法が必要となる. 本ライブラリルーチンでは並列前処理法として点ヤコビ法,ブロックヤコビ法,加法的シュワルツ法を採用している.

2.1 ポイントヤコビ前処理

　前処理行列Kとして係数行列Aの対角成分のみを用いる.不完全LU分解など他の前処理法と比べると効果は小さいが, 点ヤコビ法は並列に処理され,プロセッサ間通信も不要である.

2.2 フィルイン無し不完全LU分解(ILU(0))

　正方行列 $A$ を下三角行列 $L$ と上三角行列 $U$ の積の形に分解することをLU分解と呼ぶ. LU分解は元の行列が疎行列であっても,分解後の行列の零要素位置に値が入る.これはフィルインと呼ばれる. フィルインが発生することでLU分解後の行列が密行列になるためメモリ使用量が増大する問題がある. PARCELではフィルインを考慮しない不完全LU分解(ILU(0))を前処理として採用することでメモリ使用量の増大を防いでいる.

2.3 修正不完全LU分解(D-ILU)

　係数行列 $A$ をその対角行列 $D$ ,下三角行列 $L$ ,上三角行列 $U$ を用いて $A = L_{A} + D_{A} + U_{A}$ と分解する.この $L_{A}$ , $U_{A}$ および対角行列 $D$ ( $D \neq D_{A}$ )を用いて,前処理行列 $K$ を $K = \left( D + L_{A} \right)D^{- 1}\left( D + U_{A} \right)$ の形に決定する.ここでは,対角行列 $D$ の決定方法として,次の2とおりの条件のどちらを選択する.

条件1 対角成分が一致 $A_{{ii}} = K_{{ii}}\ \ (i = 1,\ldots,n)$
条件2 行内の要素和が一致 $\sum_{j}^{}A_{{ij}} = \sum_{j}^{}K_{{ij}}\ \ (i = 1,\ldots,n)$

対角行列 $D$ の具体的な計算方法は

条件1 対角成分が一致 $D_{{ii}} = A_{{ii}} - \sum_{j < i}^{}{A_{{ij}}D_{jj}^{-1}A_{{ji}}}\ \ (i = 1,\ldots,n)$
条件2 行内の要素和が一致 $D_{{ii}} = A_{{ii}} - \sum_{j < i}^{}{\sum_{k > j}^{}{A_{{ij}}D_{{jj}}^{-1}A_{jk}}}\ \ (i = 1,\ldots,n)$

となる.

2.4 ブロックヤコビ前処理

　前処理行列K として係数行列A のブロック対角成分をとり,ブロック内で不完全LU 分解を用いる. 各ブロックの境界を係数行列の各PE への分割と一致させることにより,通信が不要となり,完全に並列に処理できる.

2.5 加法的シュワルツ前処理

　前処理行列K として重なりのあるブロック対角行列を用いる.ブロック内で不完全LU 分解を用いる. 通信は必要となるが,計算は並列に行なわれる. PARCELでは加法的シュワルツ前処理の手法としてBASIC,RESTRICT,INTERPOLATE,NONEを選択できる.

図1 加法的シュワルツ前処理

BASIC

　 $r$ を重なりのある領域まで拡張させた $Ks=r$ を解き,重なりのある領域の $s$ を加算した結果を採用する.

図2 BASIC

RESTRICT

　 $r$ を重なりのある領域まで拡張させた $Ks=r$ を解き,重なりのある領域の $s$ を考慮しない結果を採用する.

図3 RESTRICT

INTERPOLATE

　 $r$ を重なりのある領域まで拡張させないで $Ks=r$ を解き,重なりのある領域の $s$ を加算した結果を採用する.

図4 INTERPOLATE

NONE

　 $r$ を重なりのある領域まで拡張させないで $Ks=r$ を解き,重なりのある領域の $s$ を考慮しない結果を採用する.

図5 NONE

3 データ構造

　一般に疎行列反復解法のプログラムでは,メモリ節約のため,非零要素についての情報(値,行位置,列位置) のみを格納するデータ構造を採用する.ここでは,本ライブラリルーチンで用いている疎行列格納法について説明する.

3.1 Compressed Row 形式

　Compressed Row 形式(圧縮行形式)は,非ゼロ要素を行方向に圧縮した後,列方向にデータを並べて格納する方法である. 非ゼロ要素の列位置・値ともに全体を1 次元配列に格納する.そのため.1次元配列中での各行の開始位置を記録したポインタテーブルを用いる. 並列処理の場合には列方向に行列を分割して格納する. 列方向のポインターの並びは昇順を想定している.

行列構造

$A = \left( \begin{array}{ccc} a & b & c & 0\\ 0 & d & 0 & 0\\ e & 0 & f & g\\ 0 & h & i & j \end{array} \right)$

1プロセスの場合

ランク0プロセス

行列の非ゼロ要素　　::　 $crsA=\{a,b,c,d,e,f,g,h,i,j\}$

ポインタテーブル　　::　 $crsRow\_ptr=\{1,4,5,8,11\}$

非ゼロ要素の列番号　::　 $crsCol=\{1,2,3,2,1,3,4,2,3,4\}$

2プロセスの場合

ランク0プロセス

行列の非ゼロ要素　　::　 $crsA=\{a,b,c,d\}$

ポインタテーブル　　::　 $crsRow\_ptr=\{1,4,5\}$

非ゼロ要素の列番号　::　 $crsCol=\{1,2,3,2\}$

ランク1プロセス

行列の非ゼロ要素　　::　 $crsA=\{e,f,g,h,i,j\}$

ポインタテーブル　　::　 $crsRow\_ptr=\{1,4,7\}$

非ゼロ要素の列番号　::　 $crsCol=\{1,3,4,2,3,4\}$

3.2 Diagonal形式

　Diagonal 形式(圧縮対角形式)は,対角行単位に格納する方法である.対角行の値と対角からのオフセットを1次元配列に格納する. 並列処理の場合には列方向に行列を分割して格納する. 対角からのオフセットの並びは昇順を想定している.

行列構造

$A = \left( \begin{array}{ccc} a & b & c & 0\\ 0 & d & 0 & 0\\ e & 0 & f & g\\ 0 & h & i & j \end{array} \right)$

1プロセスの場合

ランク0プロセス

対角要素　　　　::　 $diaA=\{0,0,e,h,0,0,0,i,a,d,f,j,b,0,g,0,c,0,0,0\}$

オフセット　　　::　 $offset=\{-2,-1,0,1,2\}$

対角要素の本数　::　 $nnd=5$

2プロセスの場合

ランク0プロセス

対角要素　　　　::　 $diaA=\{a,d,b,0,c,0\}$

オフセット　　　::　 $offset=\{0,1,2\}$

対角要素の本数　::　 $nnd=3$

ランク1プロセス

対角要素　　　　::　 $diaA=\{e,h,0,i,f,j,g,0\}$

オフセット　　　::　 $offset=\{-2,-1,0,1\}$

対角要素の本数　::　 $nnd=4$

4 PARCELの構成

　PARCELの導入方法について説明する.

4.1 ディレクトリ構成

　展開したアーカイブの内容を図6に示す.

図6 PARCELディレクトリ構成

4.2 コンパイル方法

　PARCELのコンパイルにはCコンパイラ及びプリプロセッサ対応のFORTRANコンパイラ. MPI,LAPACK,OpenMPライブラリを必要とする. gfortranでコンパイルする場合はコンパイルオプションに-cppを追加することでプリプロセッサが適用される. コンパイルオプションはarch/make_configを編集することで変更する. make_configの記述例を図7に示す. コンパイル方法は展開したアーカイブのトップディレクトリでmakeコマンドを実行する. 再コンパイルする場合はmake cleanを実行後にmakeコマンドを実行する. 各ディレクトリのexampleファイルに実行ファイルが生成されていればコンパイル成功である. 20億次元以上の大規模問題では64ビット整数が必要となる. 例えば,本パッケージに格納されている大規模テストexample5のコンパイルにはFDEFINEの指定が必要である。

オプション名	説明
CC	Cコンパイラコマンド名
FC	FORTRANコンパイラコマンド名
CFLAGS	Cコンパイラコンパイルオプション
FFLAGS	FORTRANコンパイラコンパイルオプション
FP_MODE	演算順序変更を伴う最適化を抑制するオプション(4倍精度ライブラリのみに適用される)
INCLUDEDIR	インクルードディレクトリ
LD_MPI	MPIライブラリ
LD_LAPACK	LAPACKライブラリ
FDEFINE	-DPARCEL_INT8を指定することで64ビット整数型に対応.

図7 make_configの記述例

4.3 使用方法

　srcディレクトリに生成される*.aファイルをリンクすることで PARCELのサブルーチンを使用することが可能となる.

5 PARCELサブルーチン（直接インターフェース）

　PARCELに整備されているサブルーチンの直接呼び出しインターフェースについて説明する.

5.1 parcel_dcg

呼び出し方法

call parcel_dcg( icomm, vecx,vecb, n,gn,nnz,istart, crsA,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret )

機能

　共役勾配法(CG法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)

5.2 parcel_dcg_dia

呼び出し方法

call parcel_dcg_dia( icomm, vecx,vecb, n,gn,istart, diaA,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret )

機能

　共役勾配法(CG法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)

5.3 parcel_ddcg

呼び出し方法

call parcel_ddcg( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,nnz,istart, crsA_hi,crsA_lo,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　共役勾配法(CG法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA_hi(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(上位ビット)
crsA_lo(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(下位ビット)
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.4 parcel_ddcg_dia

呼び出し方法

call parcel_ddcg_dia( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,istart, diaA_hi,diaA_lo,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　共役勾配法(CG法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA_hi(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(上位ビット)
diaA_lo(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(下位ビット)
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.5 parcel_dbicgstab

呼び出し方法

call parcel_dbicgstab( icomm, vecx,vecb, n,gn,nnz,istart, crsA,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret )

機能

　安定化双共役勾配法(Bi-CGSTAB法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

*加法シュワルツを使用する際はILU分解の手法をD-ILUから選択する必要がある。＊

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)

5.6 parcel_dbicgstab_dia

呼び出し方法

call parcel_dbicgstab_dia( icomm, vecx,vecb, n,gn,istart, diaA,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret )

機能

　安定化双共役勾配法(Bi-CGSTAB法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)

5.7 parcel_ddbicgstab

呼び出し方法

call parcel_ddbicgstab( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,nnz,istart, crsA_hi,crsA_lo,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　安定化双共役勾配法(Bi-CGSTAB法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA_hi(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(上位ビット)
crsA_lo(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(下位ビット)
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.8 parcel_ddbicgstab_dia

呼び出し方法

call parcel_ddbicgstab_dia( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,istart, diaA_hi,diaA_lo,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　安定化双共役勾配法(Bi-CGSTAB法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA_hi(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(上位ビット)
diaA_lo(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(下位ビット)
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.9 parcel_dgmres

呼び出し方法

call parcel_dgmres( icomm, vecx,vecb, n,gn,nnz,istart, crsA,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, GMRES_m,GMRES_GSflag )

機能

　一般化最小残差法(GMRES(m)法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
GMRES_m	integer	in	リスタートするまでの反復回数
GMRES_GSflag	integer	in	直交化フラグ(1:MGS,2:CGS)

5.10 parcel_dgmres_dia

呼び出し方法

call parcel_dgmres_dia( icomm, vecx,vecb, n,gn,istart, diaA,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, GMRES_m,GMRES_GSflag )

機能

　一般化最小残差法(GMRES(m)法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
GMRES_m	integer	in	リスタートするまでの反復回数
GMRES_GSflag	integer	in	直交化フラグ(1:MGS,2:CGS)

5.11 parcel_ddgmres

呼び出し方法

call parcel_ddgmres( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,nnz,istart, crsA_hi,crsA_lo,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, GMRES_m,GMRES_GSflag, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　一般化最小残差法(GMRES(m)法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA_hi(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(上位ビット)
crsA_lo(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素(下位ビット)
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
GMRES_m	integer	in	リスタートするまでの反復回数
GMRES_GSflag	integer	in	直交化フラグ(1:MGS,2:CGS)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.12 parcel_ddgmres_dia

呼び出し方法

call parcel_ddgmres_dia( icomm, vecx_hi,vecx_lo, vecb_hi,vecb_lo, n,gn,istart, diaA_hi,diaA_lo,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, PRECISION_A, PRECISION_b, PRECISION_x, PRECISION_PRECONDITION )

機能

　一般化最小残差法(GMRES(m)法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx_hi(n)	double precision	in/out	in:反復の初期値(上位ビット),out:解ベクトル(上位ビット)
vecx_lo(n)	double precision	in/out	in:反復の初期値(下位ビット),out:解ベクトル(下位ビット)
vecb_hi(n)	double precision	in	右辺ベクトル(上位ビット)
vecb_lo(n)	double precision	in	右辺ベクトル(下位ビット)
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA_hi(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(上位ビット)
diaA_lo(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素(下位ビット)
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
GMRES_m	integer	in	リスタートするまでの反復回数
GMRES_GSflag	integer	in	直交化フラグ(1:MGS,2:CGS)
PRECISION_A	integer	in	行列の非零要素の精度(1:倍精度,2:4倍精度)
PRECISION_b	integer	in	右辺ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_x	integer	in	反復の初期値,解ベクトルの精度(1:倍精度,2:4倍精度)
PRECISION_PRECONDITION	integer	in	前処理行列の精度(1:倍精度,2:4倍精度)

5.13 parcel_dcbcg

呼び出し方法

call parcel_dcbcg( icomm, vecx,vecb, n,gn,nnz,istart, crsA,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, CBCG_kstep,CBCG_Eigenflag,power_method_itrmax, CAARNOLDI_sstep,CAARNOLDI_tstep, CAARNOLDI_basis,CAARNOLDI_QRflag )

機能

　チェビシェフ基底共役勾配法(CBCG法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
CBCG_kstep	integer	in	CBCG法の省通信ステップ
CBCG_Eigenflag	integer	in	固有値計算フラグ(1:べき乗法,2:CA-ARNOLDI)
power_method_itrmax	integer	in	べき乗法の反復回数
CAARNOLDI_sstep	integer	in	CA-ARNOLDI法の省通信ステップ数
CAARNOLDI_tstep	integer	in	CA-ARNOLDI法のリスタートステップ数
CAARNOLDI_basis	integer	in	CA-ARNOLDI法の基底生成フラグ(0:単基底,1:ニュートン基底)
CAARNOLDI_QRflag	integer	in	CA-ARNOLDI法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

5.14 parcel_dcbcg_dia

呼び出し方法

call parcel_dcbcg_dia( icomm, vecx,vecb, n,gn,istart, diaA,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, CBCG_kstep,CBCG_Eigenflag,power_method_itrmax, CAARNOLDI_sstep,CAARNOLDI_tstep, CAARNOLDI_basis,CAARNOLDI_QRflag )

機能

　チェビシェフ基底共役勾配法(CBCG法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
CBCG_kstep	integer	in	CBCG法の省通信ステップ
CBCG_Eigenflag	integer	in	固有値計算フラグ(1:べき乗法,2:CA-ARNOLDI)
power_method_itrmax	integer	in	べき乗法の最大反復回数
CAARNOLDI_sstep	integer	in	CA-ARNOLDI法の省通信ステップ
CAARNOLDI_tstep	integer	in	CA-ARNOLDI法のリスタートステップ
CAARNOLDI_basis	integer	in	CA-ARNOLDI法の基底生成フラグ(0:単基底,1:ニュートン基底)
CAARNOLDI_QRflag	integer	in	CA-ARNOLDI法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

5.15 parcel_dcagmres

呼び出し方法

call parcel_dcagmres( icomm, vecx,vecb, n,gn,nnz,istart, crsA,crsRow_ptr,crsCol, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, CAGMRES_sstep, CAGMRES_tstep, CAGMRES_basis, CAGMRES_QRflag )

機能

　通信削減型一般化最小残差法(CA-GMRES(s,t)法)により,連立一次方程式Ax=bを解く.非零要素の値をCompressed Row形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
CAGMRES_sstep	integer	in	CA-GMRES法の省通信ステップ数
CAGMRES_tstep	integer	in	CA-GMRES法のリスタートステップ数
CAGMRES_basis	integer	in	CA-GMRES法の基底生成フラグ(0:単基底,1:ニュートン基底)
CAGMRES_QRflag	integer	in	CA-GMRES法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

5.16 parcel_dcagmres_dia

呼び出し方法

call parcel_dcagmres_dia( icomm, vecx,vecb, n,gn,istart, diaA,offset,nnd, ipreflag,ILU_method,addL,iflagAS, itrmax,rtolmax, reshistory, iovlflag,iret, CAGMRES_sstep, CAGMRES_tstep, CAGMRES_basis, CAGMRES_QRflag )

機能

　通信削減型一般化最小残差法(CA-GMRES(s,t)法)により,連立一次方程式Ax=bを解く.非零要素の値をDiagonal形式で格納.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in/out	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
iflagAS	integer	in	加法シュワルツ指定フラグ(1:BASIC,2:RESTRICT,3:INTERPOLATE,4:NONE)
itrmax	integer	in/out	in:最大反復回数,out:反復回数
rtolmax	double precision	in	収束判定条件(相対残差ノルム)
reshistory(itrmax)	double precision	out	残差履歴
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)
iret	integer	out	エラーコード(0:正常終了)
CAGMRES_sstep	integer	in	CA-GMRES法の省通信ステップ
CAGMRES_tstep	integer	in	CA-GMRES法のリスタートステップ
CAGMRES_basis	integer	in	CA-GMRES法の基底生成フラグ(0:単基底,1:ニュートン基底)
CAGMRES_QRflag	integer	in	CA-GMRES法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

6 PARCELサブルーチン（間接インターフェース）

　PARCELに整備されているサブルーチンの間接呼び出しインターフェースについて説明する.

6.1 PARCEL_KSP_Default_Setting

呼び出し方法

call PARCEL_KSP_Default_Setting(method)

機能

　PARCEL構造体に初期設定を適用.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体

6.2 set_KSP_CRS

呼び出し方法

call set_KSP_CRS(icomm,vecx,vecb,n,gn,nnz,istart,crsA,crsRow_ptr,crsCol,itrmax,ipreflag,ILU_method,addL,method)

機能

　Compressed Row形式の行列を設定.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
nnz	integer4 / integer8	in	各プロセスが担当する係数行列の非零要素数
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
crsA(nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
crsRow_ptr(n+1)	integer4 / integer8	in	Compressed Row 形式のポインタテーブル
crsCol(nnz)	integer4 / integer8	in	Compressed Row 形式に格納された分割行列の非零要素の列番号
itrmax	integer	in	in:最大反復回数,out:反復回数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
method	type(KSP)	in/out	PARCEL 構造体

6.3 set_KSP_DIA

呼び出し方法

call set_KSP_DIA(icomm,vecx,vecb,n,gn,istart,diaA,offset,nnd,itrmax,ipreflag,ILU_method,addL,method)

機能

　Diagonal形式の行列を設定.

引数名(次元)	型	入力/出力	説明
icomm	integer	in	MPIコミュニケータ
vecx(n)	double precision	in	in:反復の初期値,out:解ベクトル
vecb(n)	double precision	in	右辺ベクトル
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
gn	integer4 / integer8	in	全体のベクトルの大きさ
istart	integer4 / integer8	in	各プロセスが担当する行列の開始行
diaA(n*nnd)	double precision	in	Diagonal形式に格納された行列の非零要素
offset(nnd)	integer4 / integer8	in	Diagonal形式に格納された行列の対角からのオフセット
nnd	integer4 / integer8	in	Diagonal形式に格納された行列の対角要素の本数
itrmax	integer	in	in:最大反復回数,out:反復回数
ipreflag	integer	in	前処理指定フラグ(0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(0:ILU(0),1:D-ILU(対角成分が一致),2:D-ILU(行内の要素和が一致),加法シュワルツは1,2のみ利用可能)
addL	integer	in	加法シュワルツの重なり幅
method	type(KSP)	in/out	PARCEL 構造体

6.4 set_vecx_KSP

呼び出し方法

　call set_vecx_KSP(n,x,method)

機能

　反復の初期値を設定.

引数名(次元)	型	入力/出力	説明
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
x(n)	double precision	in	反復の初期値
method	type(KSP)	in/out	PARCEL 構造体

6.5 set_vecb_KSP

呼び出し方法

　call set_vecb_KSP(n,b,method)

機能

　右辺ベクトルbを設定.

引数名(次元)	型	入力/出力	説明
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
b(n)	double precision	in	右辺ベクトル
method	type(KSP)	in/out	PARCEL 構造体

6.6 get_vecx_KSP

呼び出し方法

　call get_vecx_KSP(n,x,method)

機能

　解ベクトルを取得.

引数名(次元)	型	入力/出力	説明
n	integer4 / integer8	in	各プロセスが担当するベクトルの大きさ
x(n)	double precision	out	解ベクトル
method	type(KSP)	in	PARCEL 構造体

6.7 get_reshistory_KSP

呼び出し方法

call get_reshistory_KSP(niter,reshistory, method)

機能

　収束履歴を取得する.

引数名(次元)	型	入力/出力	説明
niter	integer	out	収束までの反復回数
reshistory(method%itrmax)	double precision	out	収束履歴
method	type(KSP)	in	PARCEL 構造体

6.8 reset_CRS_Mat

呼び出し方法

call reset_CRS_Mat(itrmax,ipreflag,ILU_method,addL,crsA,method)

機能

　行列の非零要素位置を変えずにCompressed Row形式の行列値,前処理方法,最大反復回数を変更する.

引数名(次元)	型	入力/出力	説明
itrmax	integer	in	最大反復回数(-1:設定済みの値を引き継ぐ)
ipreflag	integer	in	前処理指定フラグ(-1:設定済みの値を引き継ぐ,0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(-1:設定済みの値を引き継ぐ,1:対角成分が一致,2:行内の要素和が一致)
addL	integer	in	加法シュワルツの重なり幅(-1:設定済みの値を引き継ぐ)
crsA(method%nnz)	double precision	in	Compressed Row 形式に格納された行列の非零要素
method	type(KSP)	in/out	PARCEL 構造体

6.9 reset_DIA_Mat

呼び出し方法

call reset_DIA_Mat(itrmax,ipreflag,ILU_method,addL,diaMat,method)

機能

　行列の非零要素位置を変えずにDiagonal形式の行列値,前処理方法,最大反復回数を変更する.

引数名(次元)	型	入力/出力	説明
itrmax	integer	in	最大反復回数(-1:設定済みの値を引き継ぐ)
ipreflag	integer	in	前処理指定フラグ(-1:設定済みの値を引き継ぐ,0:無し,1:ポイントヤコビ,2:ブロックヤコビ,3:加法シュワルツ)
ILU_method	integer	in	不完全LU分解指定フラグ(-1:設定済みの値を引き継ぐ,1:対角成分が一致,2:行内の要素和が一致)
addL	integer	in	加法シュワルツの重なり幅(-1:設定済みの値を引き継ぐ)
diaMat(method%n*method%nnd)	double precision	in	Compressed Row 形式に格納された行列の非零要素
method	type(KSP)	in/out	PARCEL 構造体

6.10 set_KSP_solver

呼び出し方法

call set_KSP_solver(method,solver)

機能

　クリロフ部分空間法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
solver	integer	in	クリロフ部分空間法フラグ(1:CG法,2:Bi-CGSTAB法,3:GMRES法,4:CAGMRES法,5:CBCG法)

6.11 set_KSP_abstolmax(method,abstolmax)

呼び出し方法

call set_KSP_abstolmax(method,abstolmax)

機能

　クリロフ部分空間法の絶対残差ノルムによる収束判定条件を設定する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
abstolmax	double precision	in	収束判定条件(絶対残差ノルム)

6.12 set_KSP_rtolmax

呼び出し方法

call set_KSP_rtolmax(method,rtolmax)

機能

　クリロフ部分空間法の相対残差ノルムによる収束判定条件を設定する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
rtolmax	double precision	in	収束判定条件(相対残差ノルム)

6.13 set_KSP_iovlflag

呼び出し方法

call set_KSP_iovlflag(method,iovlflag)

機能

　疎行列ベクトル積の通隠蔽手法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
iovlflag	integer	in	通信隠蔽フラグ(0:無し,1:全プロセス,2:各プロセス)

6.14 set_KSP_GMRES_m(method,GMRES_m)

呼び出し方法

call set_KSP_GMRES_m(method,GMRES_m)

機能

　GMRES(m)のリスタート数mを選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
GMRES_m	integer	in	リスタートするまでの反復回数

6.15 set_KSP_GMRES_GSflag

呼び出し方法

call set_KSP_GMRES_GSflag(method,GMRES_GSflag)

機能

　GMRES(m)の直行化手法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
GMRES_GSflag	integer	in	直交化フラグ(1:MGS,2:CGS)

6.16 set_KSP_CAGMRES_sstep

呼び出し方法

call set_KSP_CAGMRES_sstep(method,CAGMRES_sstep)

機能

　CA-GMRES法の省通信ステップ数(s)を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAGMRES_sstep	integer	in	CA-GMRES法の省通信ステップ数

6.17 set_KSP_CAGMRES_tstep

呼び出し方法

call set_KSP_CAGMRES_tstep(method,CAGMRES_tstep)

機能

　CA-GMRES法のリスタートステップ数(t)を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAGMRES_tstep	integer	in	CA-GMRES法のリスタートステップ数

6.18 set_KSP_CAGMRES_basis

呼び出し方法

call set_KSP_CAGMRES_basis(method,CAGMRES_basis)

機能

　CA-GMRES法の基底生成方法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAGMRES_basis	integer	in	CA-GMRES法の基底生成フラグ(0:単基底,1:ニュートン基底)

6.19 set_KSP_CAGMRES_QRflag

呼び出し方法

call set_KSP_CAGMRES_QRflag(method,CAGMRES_QRflag)

機能

　CA-GMRES法のQR分解方法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAGMRES_QRflag	integer	in	CA-GMRES法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

6.20 set_KSP_CBCG_kstep

呼び出し方法

call set_KSP_CBCG_kstep(method,CBCG_kstep)

機能

　CBCG法の省通信ステップ数kを選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CBCG_kstep	integer	in	CBCG法の省通信ステップ

6.21 set_KSP_CBCG_Eigenflag

呼び出し方法

call set_KSP_CBCG_Eigenflag(method,CBCG_Eigenflag)

機能

　CBCG法の固有値計算方法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CBCG_Eigenflag	integer	in	固有値計算フラグ(1:べき乗法,2:CA-ARNOLDI)

6.22 set_KSP_CAARNOLDI_sstep

呼び出し方法

call set_KSP_CAARNOLDI_sstep(method,CAARNOLDI_sstep)

機能

　CA-ARNOLDI法の省通信ステップ数(s)を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAARNOLDI_sstep	integer	in	CA-ARNOLDI法の省通信ステップ数

6.23 set_KSP_CAARNOLDI_tstep

呼び出し方法

call set_KSP_CAARNOLDI_tstep(method,CAARNOLDI_tstep)

機能

　CA-ARNOLDI法のリスタートステップ(t)数を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAARNOLDI_tstep	integer	in	CA-ARNOLDI法のリスタートステップ

6.24 set_KSP_CAARNOLDI_basis

呼び出し方法

call set_KSP_CAARNOLDI_basis(method,CAARNOLDI_basis)

機能

　CA-ARNOLDI法の基底生成方法を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAARNOLDI_basis	integer	in	CA-ARNOLDI法の基底生成フラグ(0:単基底,1:ニュートン基底)

6.25 set_KSP_CAARNOLDI_QRflag

呼び出し方法

call set_KSP_CAARNOLDI_QRflag(method,CAARNOLDI_QRflag)

機能

　CA-ARNOLDI法のQR分解を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
CAARNOLDI_QRflag	integer	in	CA-ARNOLDI法のQR分解フラグ(1:MGS,2:CGS,3:TSQR,4:CholeskyQR,5:CholeskyQR2)

6.26 set_KSP_power_method_itrmax

呼び出し方法

call set_KSP_power_method_itrmax(method,power_method_itrmax)

機能

　べき乗法の反復回数を選択する.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	out	PARCEL 構造体
power_method_itrmax	integer	in	べき乗法の反復回数

6.27 START_KSP_SOLVER

呼び出し方法

call START_KSP_SOLVER(method)

機能

　連立一次方程式Ax=bの求解.

引数名(次元)	型	入力/出力	説明
method	type(KSP)	in/out	PARCEL 構造体

7 サブルーチン使用方法

　PARCELのサブルーチン使用方法についてCG法のFORTRANサンプルコードを例にして説明する. Cプログラムにおける利用法の詳細についてはアーカイブのSPARCE/example_Cに格納されているCサンプルコードを参照のこと. Cの場合はFORTRAN用のMPIコミュニケータを用意すればFORTRANと同様の方法でPARCELを利用可能である. CサンプルコードではMPIライブラリの関数MPI_Comm_c2fを用いてCのMPIコミュニケータをFORTRAN用に変換している. 間接呼び出しインターフェースのCサンプルコードでは,FORTRAN側でPARCEL構造体を確保してからC側でそれを制御して利用している.

7.1 Compressed Row形式

　Compressed Row形式のサンプルコードを図8および図9に示す. make_matrix_CRSはPARCELの行列分割に対応したCompressed Row形式の行列を生成する任意のサブルーチンとする. 図8 は直接呼び出しインターフェースを用いた例,図9は間接呼び出しインターフェースを利用した例を示す. 図9ではkrylov,krylov_kernelのモジュールを利用するためSPARSE/srcをコンパイル時にインクルードする必要がある. 非零要素の位置を変更せずに値のみを変更する場合, 図8のコードでは再度parcel_dcgを呼ぶ必要があるため通信相手のリスト作成等の初期化コストが必要となる. 図9のコードではreset_CRS_Matを利用することで非零要素位置の変更がない場合は初期化コストは不要となる. 同様に右辺ベクトル及び反復の初期値を変更する場合も図8ではparcel_dcgを呼ぶため初期化のコストが必要となるが, 図9のコードではset_vecb_KSP,set_vecx_KSPを利用することで初期化コストは不要となる.

Compressed Row形式サンプルコード1

  program main
    use mpi
    implicit none
 
    integer n,gn,nnz,istart
    real*8,allocatable  :: crsA(:)
    integer,allocatable :: crsRow_ptr(:),crsCol(:)
    real*8,allocatable  :: vecx(:)
    real*8,allocatable  :: vecb(:)
    integer itrmax
    real*8  rtolmax
    real*8, allocatable :: reshistory(:)
    integer ipreflag
    integer ILU_method
    integer iflagAS
    integer addL
    integer iovlflag
    integer iret
    integer ierr
 
    call MPI_Init(ierr)
 
    call make_matrix_CRS(n,gn,nnz,istart,crsA,crsRow_ptr,crsCol)
 
    allocate(vecx(n))
    allocate(vecb(n))
    allocate(reshistory(itrmax))
    ipreflag=0
    ILU_method=1
    addL=0
    iflagAS=1
    itrmax=100
    rtolmax=1.0d-8
    iovlflag=0
 
    vecb=1.0d0
    vecx=1.0d0
    call parcel_dcg( &
         MPI_COMM_WORLD, &
         vecx,vecb, &
         n,gn,nnz,istart, &
         crsA,crsRow_ptr,crsCol, &
         ipreflag,ILU_method,addL,iflagAS, &
         itrmax,rtolmax, &
         reshistory, &
         iovlflag,iret &
         )
    call MPI_Finalize(ierr)
 
    deallocate(vecx)
    deallocate(vecb)
 
    deallocate(reshistory)
 
  end program main

図8 Compressed Row形式サンプルコード（直接呼び出しインターフェース）

Compressed Row形式サンプルコード2

  program main
    use mpi
    use krylov
    use krylov_kernel
    implicit none
 
    integer n,gn,nnz,istart
    real*8,allocatable  :: crsA(:)
    integer,allocatable :: crsRow_ptr(:),crsCol(:)
    real*8,allocatable  :: vecx(:)
    real*8,allocatable  :: vecb(:)
    integer itrmax
    real*8  rtolmax
    real*8, allocatable :: reshistory(:)
    integer ipreflag
    integer ILU_method
    integer iflagAS
    integer addL
    integer iovlflag
    integer iret
    integer ierr
    type(KSP) :: method
 
    call MPI_Init(ierr)
 
    call make_matrix_CRS(n,gn,nnz,istart,crsA,crsRow_ptr,crsCol)
 
    allocate(vecx(n))
    allocate(vecb(n))
    allocate(reshistory(itrmax))
 
    ipreflag=0
    ILU_method=1
    addL=0
    iflagAS=1
    itrmax=100
    rtolmax=1.0d-8
    iovlflag=0
    vecb=1.0d0
    vecx=1.0d0
 
    call PARCEL_KSP_Default_Setting(method)
    call set_KSP_CRS(&
         MPI_COMM_WORLD, &
         vecx,vecb, &
         n,gn,nnz,istart, &
         crsA,crsRow_ptr,crsCol, &
         itrmax,ipreflag,ILU_method,addL,&
         method)
    call set_KSP_solver(method,1)
    call START_KSP_SOLVER(method)
    call get_vecx_KSP(n,vecx,method)
    call free_KSP(method)
 
    call MPI_Finalize(ierr)
 
    deallocate(vecx)
    deallocate(vecb)
 
    deallocate(reshistory)
 
  end program main

図9 Compressed Row形式サンプルコード（間接呼び出しインターフェース）

7.2 Diagonal形式

　Diagonal形式のサンプルコードを図10に示す. make_matrix_DIAはPARCELのブロック分割に対応したDiagonal形式の行列を生成する任意のサブルーチンとする. 図10は直接呼び出しインターフェースを用いた例, 図11は間接呼び出しインターフェースを利用した例を示す. 図11の形式ではkrylov,krylov_kernelのモジュールを利用するためSPARSE/srcをコンパイル時にインクルードする必要がある. 非零要素の位置を変更せずに値のみを変更する場合, 図10のコードでは再度parcel_dcg_diaを呼ぶ必要があるため通信相手のリスト作成等の初期化コストが必要となる. 図11のコードではreset_DIA_Matを利用することで非零要素位置の変更がない場合は初期化コストは不要となる. 同様に右辺ベクトル及び反復の初期値を変更する場合も図10ではparcel_dcg_diaを呼ぶため初期化のコストが必要となるが, 図11のコードではset_vecb_KSP,set_vecx_KSPを利用することで初期化コストは不要となる.

Diagonal形式サンプルコード1

  program main
    use mpi
    implicit none
 
    integer n,gn,nnd,istart
    real*8,allocatable  :: diaA(:)
    integer,allocatable :: offset(:)
    real*8,allocatable  :: vecx(:)
    real*8,allocatable  :: vecb(:)
    integer itrmax
    real*8  rtolmax
    real*8, allocatable :: reshistory(:)
    integer ipreflag
    integer ILU_method
    integer iflagAS
    integer addL
    integer iovlflag
    integer iret
    integer ierr
 
    call MPI_Init(ierr)
 
    call make_matrix_DIA(n,gn,nnd,istart,diaA,offset)
 
    allocate(vecx(n))
    allocate(vecb(n))
    allocate(reshistory(itrmax))
 
    ipreflag=0
    ILU_method=1
    addL=0
    iflagAS=1
    itrmax=100
    rtolmax=1.0d-8
    iovlflag=0
    vecb=1.0d0
    vecx=1.0d0
 
    call parcel_dcg_dia(&
         MPI_COMM_WORLD, &
         vecx,vecb,&
         n,gn,istart,&
         diaA,offset,nnd,&
         ipreflag,ILU_method,addL,iflagAS,&
         itrmax,rtolmax,&
         reshistory,&
         iovlflag,iret&
         )
 
    call MPI_Finalize(ierr)
 
    deallocate(reshistory)
 
  end program main

図10 Diagonal形式サンプルコード（直接呼び出しインターフェース）

Diagonal形式サンプルコード2

  program main
    use mpi
    use krylov
    use krylov_kernel
    implicit none
 
    integer n,gn,nnd,istart
    real*8,allocatable  :: diaA(:)
    integer,allocatable :: offset(:)
    real*8,allocatable  :: vecx(:)
    real*8,allocatable  :: vecb(:)
    integer itrmax
    real*8  rtolmax
    real*8, allocatable :: reshistory(:)
    integer ipreflag
    integer ILU_method
    integer iflagAS
    integer addL
    integer iovlflag
    integer iret
    integer ierr
 
    call MPI_Init(ierr)
 
    call make_matrix_DIA(n,gn,nnd,istart,diaA,offset)
 
    allocate(vecx(n))
    allocate(vecb(n))
    allocate(reshistory(itrmax))
 
    ipreflag=0
    ILU_method=1
    addL=0
    iflagAS=1
    itrmax=100
    rtolmax=1.0d-8
    iovlflag=0
    vecb=1.0d0
    vecx=1.0d0
 
    call PARCEL_KSP_Default_Setting(method)
    call set_KSP_DIA(&
         MPI_COMM_WORLD, &
         vecx,vecb, &
         n,gn,istart, &
         diaA,offset,nnd,&
         itrmax,ipreflag,ILU_method,addL,&
         method)
    call set_KSP_solver(method,1)
    call START_KSP_SOLVER(method)
    call get_vecx_KSP(n,vecx,method)
    call free_KSP(method)
 
    call MPI_Finalize(ierr)
 
    deallocate(vecx)
    deallocate(vecb)
 
    deallocate(reshistory)
 
  end program main

図11 Diagonal形式サンプルコード（間接呼び出しインターフェース）