AVX 2.0:支持256bit整数,两倍FMA峰值性能
TSX指令是新增功能,Haswell架构上已知的指令集变化还有就是AVX 2.0了,这是AVX指令集的更新版,后者从2011年初发布的Sandy Bridge架构上首次开始应用,之后的Sandy Bridge-E、现在的Ivy Bridge架构都有使用。
AVX指令路线图显示Haswell开始支持AVX2指令集
AVX(Advanced Vector Extensions,高级矢量扩展)指令集的详细介绍之前有过文章,Haswell架构上的AVX 2.0主要是升级更新,新增了几项指令更新,Intel在其官网也做了介绍。
AVX原先主要是256bit浮点指令集,AVX 2.0中整数数据也扩展到256bit SIMD阵列,而整数指令在图像及视频处理器中使用较多。
新增的3操作数通用位处理指令(3-operand general-purpose Bit manipulation instructions)主要用在数据压缩、Hash、大规模数据运算以及各种通用计算中。
此外,AVX 2.0指令还支持寻址Gather/Scatter指令、矢量位移(Vector-Vector Shifts)、任意到任意排列(Any-to-Any permutes)、浮点乘积累(Floating Point Multiply Accumulate,FMA)指令等。
AVX 2.0支持的FMA指令依然是3操作数,但是Intel表示新版FMA3指令极大地提升了峰值速度,并且改进数学算法以提供更高的精度,适用于高性能计算、专业图形处理以及脸部追踪等应用。
AVX 2.0指令集不仅应用在Haswell架构上,2014年14nm工艺升级版的Broadwell架构处理器也会使用AVX 2.0,这与目前AVX指令贯穿SNB、IVB两代架构的做法一脉相承。
本文地址:http://www.45fan.com/dnjc/8535.html