总结:编译原理--第十一章 并行性和局部性优化

第十一章  并行性和局部性优化

本章介绍一个编译器如何增强处理数组的计算密集型程序中的并行性和局部性,以便提高目标程序在多处理器系统上的运行速度。

  • 数组的并行性和局部性。对于并行性和基于局部性的优化而言,最重要的机会来自于访问数组的循环。
  • 仿射访问。几乎所有的并行化及数据局部性优化的理论和技术都假设对数组的访问是仿射的:这些数组下标的表达式是循环下标的线性函数。
  • 迭代空间:一个具有 d 个循环的循环嵌套结构定义了一个 d 维的迭代空间。
  • Fourier-Motzkin 消除算法。对迭代空间的关键操作之一是把定义该空间的各个循环重新排列。
  • 数据依赖和数组访问。在为了并行性和局部性优化的目的而处理循环时,我们需要解决的一个中心问题是确定两个数组访问之间是否具有数据依赖关系。
  • 矩阵的秩和数据复用。用来描述一个数组访问的矩阵可以给出多个关于该数组访问的重要信息。
  • 数据依赖关系和丢番图方程。如果我们仅仅知道对同一数组的两个访问触及该数组的同一区域,我们并不能判定它们是否真的访问了某个公共元素。
  • 解丢番图线性方程。关键技术是计算各个变量的系数的最大公约数。
  • 空间分划约束。为了并行化一个循环嵌套结构的执行过程,我们需要把这个循环的迭代映射到一个处理器空间。
  • 基本代码转换。用来并行化具有仿射数组访问的程序的转换是七个基本转换的组合,它们是:循环融合、循环裂变、重新索引、比例变换、反置、交换和倾斜。
  • 并行运算的同步。有时,如果我们在一个程序的步骤之间插入同步运算,就可以获得更多的并行性。
  • 流水线化。这个并行化技术允许处理器共享数据,方法是把某些数据从一个处理器同步传递到处理器空间中的相邻的处理器。这个方法可以提高每个处理器所访问数据的局部性。
  • 时间分划约束。为了找到流水线化的机会,我们要求出时间分划约束的解。
  • 求解时间分划约束。Farkas 引理提供了一个有力的求解技术。
  • 分块。这个技术把一个循环嵌套结构中的每个循环都分割成为两个循环。
  • 条状挖掘。和分块技术类似,这个技术只把一个循环嵌套结构中的一部分循环分解开,每个循环分成两个循环。这么做的好处是一个多维数组被一条一条地访问,从而得到最好的高速缓存利用率。

希望我的总结可以帮助大家,感谢阅读我的博客!

猜你喜欢

转载自blog.csdn.net/weixin_42558631/article/details/81272819