Question 1

逐次割合は実際には何を表しますか？

Accepted Answer

逐次割合 p には、並列化できないプログラムのすべての部分が含まれます。順次の初期化と終了処理、ディスクからのデータ読み込み、並列段階間の同期バリア、プロセス間通信のオーバーヘッド、そしてステップ N が終わるまでステップ N+1 を始められないようなデータ依存のある箇所です。5〜10% のような小さな逐次割合でも、到達可能な最大加速比を大きく制限します。

Question 2

Amdahlの法則と Gustafson の法則の違いは何ですか？

Accepted Answer

Amdahlの法則は、問題サイズが固定されていることを前提にします。つまり、同じ問題をより速く解きたい場合です。Gustafson の法則は、追加のプロセッサを使って同じ時間でより大きな問題を解くことを前提にします。Amdahlの法則は固定ワークロードに対する悲観的な上限を示し、Gustafson の法則は問題サイズが大きくなると並列効率が高く保たれることを示します。どちらもそれぞれの文脈では正しいです。

Question 3

実際に加速比が 1/p を超えることはありますか？

Accepted Answer

スーパーリニア加速——つまり加速比が n を超える現象——は、キャッシュ効果によって時折観測されます。問題を複数のプロセッサに分割すると、それぞれのプロセッサのデータが専用キャッシュに収まり、遅い主記憶アクセスを回避できるためです。ただし、漸近的な意味ではスーパーリニア加速は Amdahl の上限 1/p を超えられず、理論モデルで捉えきれないハードウェア要因で説明されます。

Question 4

並列効率とは何で、なぜ重要ですか？

Accepted Answer

並列効率 E = S(n)/n × 100% は、各プロセッサ能力のうちどれだけが生産的に使われているかを示します。効率 100% は、追加されたプロセッサがすべて比例的に加速に寄与する理想状態です。50% 未満の効率は、調整コストと逐次ボトルネックが追加容量の半分以上を食っていることを意味し、プロセッサ追加の投資価値が低いことを示します。

Question 5

プログラムの逐次割合をどう減らせますか？

Accepted Answer

一般的な方法には、ロックフリーなデータ構造で同期バリアを減らす、ステップ間のデータ依存をなくすようアルゴリズムを再設計する、順次初期化を並列計算とパイプライン化する、非同期 I/O でデータ読み込みと処理を重ねる、そして推測ではなくプロファイリングで真のボトルネックを見つける、などがあります。逐次割合を半分にできれば、到達可能な最大加速比は 2 倍になります。

Question 6

Amdahlの法則は GPU 計算にも適用できますか？

Accepted Answer

はい。GPU には何千ものシェーダコアがありますが、kernel 起動、CPU と GPU メモリ間のデータ転送、順次のセットアップコードには大きな逐次オーバーヘッドがあります。データ転送とセットアップが総時間の 20% を占める GPU プログラムは、GPU の計算性能がどれだけ高くても CPU 比で 5× を超える加速は得られません。CPU-GPU 間のデータ転送を減らし、kernel の占有率を高めることが、GPU における逐次割合削減に相当します。

パラメータ	加速比	備考
p=0.05, n=8, T=1000 s	5.93×	逐次割合が低い（5%）。S(8) = 1/(0.05+0.95/8) = 1/0.1688 = 5.93×。最大加速比 = 1/0.05 = 20×。8 プロセッサではほぼ線形にスケールします。
p=0.2, n=16, T=3600 s	4×	逐次割合 20%。S(16) = 1/(0.2+0.8/16) = 1/0.25 = 4×。並列実行時間 = 900 s。最大加速比は 5× に制限されます。
p=0.5, n=8, T=1000 s	1.6×	逐次割合が高い（50%）。8 個のプロセッサがあっても加速比は 1.6× に過ぎません。プロセッサ数に関係なく最大加速比は 2× です。
p=0.1, n=32, T=7200 s	7.8×	逐次割合 10%、32 プロセッサ。S(32) = 1/(0.1+0.9/32) ≈ 7.8×。最大加速比 = 10×。16 前後を超えると、さらにプロセッサを増やしても効果は小さくなります。

Amdahlの法則並列加速と効率計算

Amdahlの法則について

Amdahlの法則の例

Amdahlの法則計算機の使い方

Amdahlの法則 FAQ