既然有了GPU，那还有没有做CPU多核并行的必要？

2023-11-29数码

这个还真的没有太好的建议，既然你已经被分到［图形计算］领域中的话，GPU并行计算绝对是你接下来关注和研究的重点，毕竟GPGPU在图形计算领域中的优势对比CPU还是挺大的，这个时候你就得把CPU并行计算稍微放一放了。

但是这个「稍微放一放」并不是让你彻底抛弃CPU并行计算，而是要把GPU并行计算当成研究的重点，CPU并行计算只能当成课题之外的一个兴趣分支（偶尔关注一下CPU并行计算领域中的前沿信息即可）。

当然这并不意味着CPU并行计算就没有它的价值了，因为基于GPGPU并行计算的设备也少不了中央处理器（CPU），所以现在工程师们正在努力开发一种［CPU+GPGPU］的计算体系，CPU并行计算或许会重新成为大家关注的重点也是说不准的事儿。

因此，即便是专注于GPU并行计算，但同时也不应忘了CPU并行计算也是颇具研究价值的，雨露均沾嘛，多了解一点未必是坏事。

在GPU并行计算与英伟达CUDA并行编程愈发成熟且强劲的今天，我们的眼光始终离不开具备高算力的显卡。

由此也造就了英伟达T系列、P系列、A系列、特斯拉系列以及后续一系列图形计算显卡与AI加速显卡的成功。

反观CPU并行计算在过去5到10年的时间里貌似逐渐淡出了人们的视线，而实际上和CPU并行计算有关的东西很多都还没来得及开发到极致，原因是大家都等不起啊。

图形计算的异军突起使得以CPU并行开发为主的科学计算研究一下子变得黯然失色。毕竟图形计算的发展势头太过于迅猛，不管是个人还是企业都会在下一轮的投票中选择投资前景更好的项目。更重要的是CPU并行计算要想做到如GPU并行计算那般的便捷与易普及还需要跨越很多短时间内无法解决的难题。

首先，在具体应用上绝大多数个人用户根本就不需要那么强大的科学计算能力，普通消费级的酷睿i5、酷睿i7、酷睿i9以及一些入门级别的至强E5服务器即可完美覆盖个人用户对科学计算能力的需求。

一千块到几千块不等的价格就可以解决的问题，我们没有必要非得付出上万元甚至是十几万元的代价去解决它。

其次，要想获得强大的CPU并行计算能力必须建立在你拥有一个非常庞大的CPU集群体系之上，即便是它再怎么mini也有一个衣柜那么大，体积如此之大的主机听起来就感觉它不会获得更多人的青睐，尤其是个人用户，谁会愿意在自己家里放那么大一个机柜？

最后，同时也是最重要的，GPU在图形计算与AI加速计算等领域中的实用价值确实要高于CPU，当我们在确认了某样工具能显著提升生产力效率与投资收益后，我们很难抵挡得住这样的诱惑。

既然提到了CPU并行计算嘛，那我们不妨再讲一些和CPU并行计算相关的东西。

英特尔在CPU并行计算领域中已经取得了一些成就，最著名的当属英特尔旗下的 Xeon Phi协同处理器。

这种协同处理器最终的产品外观和独立显卡非常相似，单个Xeon Phi协同处理器就长这样（如下图所示）：

英特尔Xeon Phi协同处理器是一种典型的众核处理器，Xeon Phi协同处理器发展了两代，第一代是X100系列，第二代是X200系列，目前的状态是已经停产了很长一段时间了，因为有了更好的替代产品了，所以那些早期的协同处理器自然会退居幕后。

在Xeon Phi协同处理器系列中「出镜率」最高的型号是Xeon Phi 7120A，英特尔给它配备了61个核心，每一个核心最多可以支持4个线程，基础频率1.24GHZ，最大频率1.33GHZ，这种处理器可以支持一机多卡（即多个协同处理器扎堆在一个主机里，类似于显卡的交火技术），它被大量应用于企业级服务器甚至是超级计算机之中。

之所以要弄出这种协同处理器的主要原因是英特尔想用众核处理器的方式去和GPU做对抗。

Xeon Phi协同处理器最大的特色并不是它的核心多，也不是它的线程多，而是它能很好的兼容那些对接GPU并行编程的主流软件，并且它的可移植性也比较强，这里的移植指的不是CPU的移植性，而是代码的可移植性（部分基于GPU并行编程的代码可以最大限度的移植到Xeon Phi协同处理器的平台上，不需要做太多的修改）。

那么这么好的东西为什么现在仍然看不到它的大量普及呢？

终极原因还是那一个，GPU并行计算的发展速度太快了，GPU并行计算更新一代在图形计算领域中取得的进步抵得上CPU并行计算更新好几代了，慢慢的往下发展它俩的身位只会越拉越远。