Question 1

串行比例在实际中表示什么？

Accepted Answer

串行比例 p 包括程序中所有无法并行化的部分：顺序初始化和收尾、从磁盘加载数据、并行阶段之间的同步屏障、进程间通信开销，以及那些必须等前一步完成后下一步才能开始的数据依赖区段。即使是 5–10% 这样很小的串行比例，也会显著限制可达到的最大加速比。

Question 2

Amdahl定律和 Gustafson 定律有什么区别？

Accepted Answer

Amdahl定律假设问题规模固定——你希望通过增加处理器更快地解决同一个问题。Gustafson 定律则假设你用更多处理器在相同时间内解决更大的问题。Amdahl定律为固定工作负载给出偏悲观的加速上限；Gustafson 定律说明当问题规模扩大时，并行效率仍能保持较高。两种观点在各自场景下都成立。

Question 3

实际中加速比会超过 1/p 吗？

Accepted Answer

超线性加速——即加速比超过 n——有时会因缓存效应而出现：当问题被拆分到多个处理器上时，每个处理器上的数据可以放进各自的私有缓存，从而避免缓慢的主内存访问。不过，从渐近意义上说，超线性加速不可能超过 Amdahl 上限 1/p；它始终可以由理论模型未捕捉到的硬件效应来解释。

Question 4

什么是并行效率，它为什么重要？

Accepted Answer

并行效率 E = S(n)/n × 100% 表示每个处理器容量中有多少比例被有效利用。100% 的效率意味着每增加一个处理器，加速比都能按比例提升——这是理论理想。低于 50% 的效率表明，协调开销和串行瓶颈正在消耗掉超过一半的新增算力，因此继续增加处理器并不是划算的投资。

Question 5

如何降低程序的串行比例？

Accepted Answer

常见方法包括：使用无锁数据结构减少同步屏障、重新设计算法以消除步骤之间的数据依赖、将顺序初始化与并行计算流水化、使用异步 I/O 将数据加载与处理重叠，以及通过性能分析找到真实瓶颈而不是凭猜测优化。即使把串行比例减半，也能把最大可达加速比翻倍。

Question 6

Amdahl定律适用于 GPU 计算吗？

Accepted Answer

适用。GPU 有成千上万的着色核心，但 kernel 启动、CPU 与 GPU 内存之间的数据传输，以及顺序初始化代码都会带来明显的串行开销。一个数据传输和初始化占总时间 20% 的 GPU 程序，无论 GPU 计算性能多强，相对 CPU 都不可能超过 5× 加速。减少 CPU-GPU 数据传输并提高 kernel 占用率，就是降低串行比例在 GPU 场景下的对应做法。

参数	加速比	说明
p=0.05, n=8, T=1000 s	5.93×	串行比例低（5%）。S(8) = 1/(0.05+0.95/8) = 1/0.1688 = 5.93×。最大加速比 = 1/0.05 = 20×。在 8 个处理器上接近线性扩展。
p=0.2, n=16, T=3600 s	4×	串行比例 20%。S(16) = 1/(0.2+0.8/16) = 1/0.25 = 4×。并行执行时间 = 900 s。最大加速比受限于 5×。
p=0.5, n=8, T=1000 s	1.6×	串行比例高（50%）。即使有 8 个处理器，加速比也只有 1.6×。无论处理器数量多少，最大加速比都只有 2×。
p=0.1, n=32, T=7200 s	7.8×	串行比例 10%，32 个处理器。S(32) = 1/(0.1+0.9/32) ≈ 7.8×。最大加速比 = 10×。超过约 16 个处理器后，继续增加的收益很小。

Amdahl定律并行加速与效率计算器

关于Amdahl定律

Amdahl定律示例

如何使用 Amdahl定律计算器

Amdahl定律常见问题