分支预测技术对性能影响研究

2021-04-20徐永新

电子技术与软件工程 2021年1期

徐永新

（华为技术有限公司江苏省南京市 210012）

为了提升处理性能，现代CPU 采用多级流水线机制，经典的五级流水线分成取指，译码，执行，访存，写回等几个阶段。流水线机制可以有效提升指令的并行度，但是存在一些流水线冲突的场景，造成流水线效率的降低。这样的流水线冲突包括结构冲突，控制冲突和数据冲突。

流水线的控制冲突也称为分支冲突。程序执行过程中有许多分支跳转的情况，流水线遇到分支跳转时，并不知道后面要真正执行的指令在哪里，因为分支跳转的目标地址还没有被计算出来。这个时候流水线就需要采用某种策略，来预测后面将要执行的分支。如果预测对了，那么流水线的效率将能维持在较好的水平。反之，预测错了，则错误的流水线处理结果都会被丢弃，重新从正确的目标地址取出指令重新执行，这将严重影响流水线的执行效率。

1 分支预测技术

1.1 静态分支预测器

静态分支预测是一种实现简单的方法，比如预测永远不发生跳转，取指单元总是按顺序取指，直到发现错误才丢弃不正确的中间状态，重新取指。

静态分支预测特点是实现简单，但是预测的精度不高，在早期的CPU 设计中会使用这种方式。

1.2 动态分支预测器

现代处理器使用较多的是动态分支预测器，该类预测器能够记录分支的历史跳转信息，来预测将要执行的分支跳转行为。如果由于程序执行的行为发生改变，预测器也会根据执行情况自动调整，从而拥有较好的预测准确度和自适应性。

动态分支预测使用分支历史表BHT 来记录最近一次或者几次的执行情况。两位饱和计数器是最常用的方向预测器。当计数值为11 时，分支转移则计数器值保持不变，当计数值为00 时，分支不转移则计数器保持不变，其他情况分支转移则计数器加1，分支不转移则计数器减1。根据饱和计数器来预测当前跳转行为，并根据实际分支转移情况更新饱和计数器的值。

将分支跳转的指令地址和跳转的目标地址都记录下来的缓冲区叫做分支目标缓冲器BTB。程序计数器PC 值和BTB 中的分支指令地址进行比较，如果相等则表明当前是分支指令，如果同时预测会发生分支跳转，则可以把BTB 中的目标地址作为下一条取指地址。

基于BHT 和BTB 的结构，衍生出一些改进的分支预测器，比如Gshare 预测器，Agree 预测器，Bi-Mode 预测器等等。

1.3 基于神经网络的预测器

分支预测本质上是机器学习问题，神经网络是一种比较有效的机器学习方法。神经网络的输入层是当前分支的地址所对应的分支历史寄存器状态，每个分支历史状态有相应的历史权重，根据神经网络算法得出输出层的值，用来表示当前是跳转还是不跳转。如果预测成功对应的权重会增加，预测失败则权重减少。基于神经网络的预测器可以边训练边预测。

基于神经网络的预测器的特点是经过充分的训练之后预测准确度比较高，但是训练的过程耗时较长，并且由于需要做矩阵运算，其算法存在一定的时延问题。