茉莉花新闻网

中華青年思想與行動的聚合地

英特尔业绩大幅滑坡,预计连续两个季度亏损,分析师称其新领域创新不足,哪些信息值得关注?

木头龙的回答

最近几年CPU行业的创新,不是我吹,还就是Intel最积极。

CPU,尤其是今天的x86 CPU,从78年8086上市起算45年了,哪怕从2008年第一代酷睿i*上市起算也都15年了,和其他行业相比,半导体行业的迭代是非常快速,即便现在也差不多是两年就更新一次架构,经历这么长的时间,这么多代架构迭代,到哪找那么多效果显著的创新?

事实上,纵观CPU的发展历史,任何应用都能获益的性能提升只有一条路:提高频率。但因为工艺和功耗限制,这条路哪怕还没被堵死,也不是那么容易继续走下去的。

其它提升性能的方案说白了都是投机,只能让一部分应用获益。问题在于这个“一部分”到底占多大一部分,获益能有多高。

  • SuperScalar:超流水线,指令级并行,让CPU一个时钟可以执行多条相同或不同的指令。但对于指令执行顺序有严格限制的应用无效。总的来说效果非常好,大量应用都可以从中获益,但随着指令并行度的提高,边际效应越发明显。
  • Out Of Order:OOO,乱序执行,配合超流水线技术,提高指令执行的并行度。生效限制与效果同超流水线。
  • 分支预测:在计算出分支条件结果前预先加载某个分支的指令,流水线无需闲置等待。对于非分支应用无效,有一定的预测失败几率,预测失败需要清空流水线重新载入正确分支的指令。总的来说效果很好,几乎所有应用都可以从中获益。
  • 组合指令:多条简单指令的组合,单个时钟完成更多的计算。但只对使用了这类指令的应用有效,例如浮点单元,对于不涉及浮点数据计算的应用毫无效果。对于能用上的应用,性能提升幅度很大,具体效果要看具体的指令组合常用程度以及用简单指令实现的复杂程度,一般来说用简单指令实现越复杂,提升幅度越大但也用到的机会也越少。
  • Single Instruction Multi-Data:SIMD,单指令多数据。一条指令完成多组数据的相同计算。仅仅对多组数据都要进行相同运算的应用有效,其它应用无法获益。其实总的来说效果一般,不过因为主流的计算机显示设备都是使用三原色像素,对一个像素的三种颜色进行相同计算非常常见,所以图形界面、多媒体应用中效果很好。
  • 多级缓存:降低内存访问延迟,提高内存访问带宽。存在缓存命中率问题,缓存未命中时无效。效果很好,几乎所有应用都能从中获益。
  • 多核心与超线程:可以有效提升多线程应用性能,对单线程应用无效。

把时间放长一点,最近这10年来,CPU行业比较值得关注的架构也就四款:

AMD Zen/Zen2:Chiplet封装

Zen是使用chiplet封装,一款小芯片用于多款产品+小芯片良率高成本低,一下把主流桌面的核心数量从4核提升到8核。Zen2则是把chiplet封装再进一步,使用独立的IOD搭配不同数量的CCD,主流桌面核心数量再次翻倍到16核。后续的Zen3、Zen4虽然都有值得称道之处,但从架构来说都是小幅优化版,性能提升主要来自于制程工艺改进、缓解功耗、内存带宽瓶颈等。不是说没创新,只不过都只能算微创新。

Apple M1:惊人的能效

严格来说苹果的M1从CPU来说,创新性其实挺一般的。因为和M1同架构的A14,相比前代的A13,性能提升也就20%——对CPU来说挺高了,但考虑到频率也从A13的2.65 GHz提高到3 GHz,来自架构的性能提升并不算让人满意。

但M1还是很值得一说的就是,第一次有厂商把用于手机、平板的SoC拿到桌面/笔记本平台,并且和之前的x86使用相同的操作系统,可以相对公平的进行对比。而且这次的对比结果真的让整个业界都大吃一惊。M1以3.2GHz的“低”频率,整机满载功耗30W出头的低功耗击败了多款4~6核心,频率4~5GHz,满载功耗近百瓦的x86 CPU。

这给CPU行业指出了冲击高频率外的另一条提升性能的道路,但其它CPU厂商很难模仿这条路。苹果A系列如此高效主要来自三方面:不惜成本用大量晶体管堆出来的超宽架构;牺牲了扩展性的片上封装内存;从CPU、操作系统、编译器、开发工具的全链路优化。对于其它需要考虑廉价设备市场接受能力、高端产品需要节省晶体管堆大量核心、面向更广泛应用场景无法牺牲扩展性、以及不具备全链路优化能力的CPU厂商来说,此路完全不通。

Intel Alder Lake:混合架构

在面向应用场景数量最多的桌面平台引入混合架构,用更小的晶体管数量、功耗代价来提升多线程性能——和苹果M1反向而行。总的来说效果还是很不错,大部分需要多线程性能的应用都能从中获益。至于不少玩家吐槽的线程调度问题,随着混合架构的普及、操作系统和应用程序优化相信会有所改善,但某些应用的确难以优化的,只能考虑其它产品了——例如Intel价格高昂的服务器平台,或者竞争对手AMD的产品。

Intel Sapphire Rapids:极有针对性的专用加速单元

Intel在服务器平台没有使用桌面平台的混合架构。首先是用了类似AMD Zen的chiplet封装降低成本,不过因为封装技术的不同效果要比AMD效果更好,但既然AMD已经先用上了,这个其实不值一提。

SPR值得一提的两点:针对数据中心应用加入的多种加速单元,有效降低数据中心日益普及的虚拟化、数据传输、加解密、压缩解压缩等常见操作带来的性能损耗,提高单节点的负载能力。

部分SKU(至强可扩展第四代MAX系列)片上封装HBM2E内存,可以作为独立的内存使用也可以与普通内存一同使用,一同使用时还可以分FLAT和Cache两种模式。对于内存带宽瓶颈严重的应用有着非常明显的提升。

Intel的业绩问题

至于Intel去年的业绩不行,第一是市场疲软,但凡从事IT行业相关工作的,去年下半年都感受到寒冬来临了。单就全球PC出货量,22Q4比21Q4就下降了近30%。

即便抛开行业严寒不提,首先是PC市场已经非常成熟,无论硬件还是软件,除了每年几乎数量固定的新增用户、已有用户升级换新外几乎没有新增市场;就近几年来说有几点对PC销量影响比较大的:

  • 视频内容兴起:抖音、B站、各种直播带货等视频应用,需要性能更强的PC,促进了PC销售,尤其是高性能PC的销售。
  • 移动互联网普及:一般用户有了智能手机、平板电脑等更为方便的信息处理设备,对PC的需求降低,尤其是一些主要用PC获取信息而非创作、提供信息输出的用户。
  • 疫情,对PC市场最大的推动是远程办公、网课这类应用,很多用户需要另行购买PC,同时企业也要搭建相关的服务端,一定程度上促进了数据中心端产品的销售。
  • 显卡市场的不正常:前两年的显卡挖矿,去年的矿难,NV 40系显卡的定价偏离过往规律,都使得桌面相对利润丰厚的游戏PC销售困难。

除了整体PC市场外,还有基于M1的Mac对PC市场的争夺——并且争夺的是利润丰厚的视频创作设备、高端轻薄本;AMD自从Zen3开始表现出与Intel产品接近的性能;某些阶段,或者某些应用场景下甚至明显超越,也从Intel手中蚕食了不少市场;利润更为丰厚的数据中心市场,GPU计算更强、能效更高,最常见的单、双路系统中AMD可以提供数量更多的核心,都对Intel的产品销售造成一定的。

至于Intel这两年产品上的创新,桌面的混合架构一方面需要操作系统、应用优化,而对应的Windows 11一直被诟病;另一方面则是去年桌面的主流产品并没有使用混合架构(12代i5非K后缀型号及以下)或者能效核心规模偏保守(12代i7、i5带K后缀只有一组4个能效核心),混合架构的优势未能完全体现。

更重要的是,混合架构提升的是多线程性能,往往只有需要处理大量数据的应用才能发挥出多线程性能的优势;而PC用户有这么海量数据处理需求的,本来就不多,这几年的视频内容创作算一个,但相当一部分需求还被显卡蚕食掉。

而数据中心市场没啥好说的,之前的ICL-SP有点乏善可陈,甚至缺席了4/8路市场,SPR的发布会是今年的事情,真要大批量出货估计要等第二季度甚至更晚了。另一方面SPR的多个加速单元,都需要应用的优化配合才能发挥,众所周知这是个老大难问题——哪怕应用开发商、开源社区及时跟进了,但最终用户什么时候能部署这些新版的软件应用发挥新硬件优势,天知道。光是技术验证、联调、BUG解决,花个一年半年都算快了。对IT要求不高,稍微躺一点的企业,三年五年还没更新也不奇怪……

x86之外……

至于说CPU之外的方向,我只能说x86 CPU的成功,的确限制了Intel在其它方向的探索和创新。例如移动计算、GPU、AI等都落后于其它半导体厂商,其中很重要的一个原因就是放弃了x86兼容性的安腾失败以后,Intel啥都想用x86去解决。非常看重低功耗的移动计算,想用大幅精简的ATOM去解决,然后被ARM打脸;需要堆大量核心看重能耗比的海量数据计算,想用Many-Core方案去解决,然后被各家GPU厂商打脸……

同类信息

查看全部

茉莉花论坛作为一个开放社区,允许您发表任何符合社区规定的文章和评论。

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram