首页
搜索 搜索
当前位置:行业市场 > 正文

至强处理器Bug导致暂停发货|全球观天下

2023-06-30 06:56:41 中关村在线

英特尔已经证实,由于一个新发现的错误,它已经暂停了部分第四代至强蓝宝石激流处理器的发货。我们收到了英特尔暂停出货的消息,并对此事进行了跟踪,我们从SemiAnalysis的首席分析师Dylan Patel那里了解到关于这个问题的一些细节,他说自6月中旬以来某些SKU的出货已经暂停了。我们还就此事与英特尔进行了跟踪,该公司向Tom"s Hardware发表了以下声明:

"我们意识到第四代英特尔至强中等核心数处理器(SPR-MCC)的一个子集的问题,在某些条件下可能会中断系统运行,我们正在积极进行调查。在运行市面上的软件时没有观察到这个问题,其他第四代英特尔至强处理器SKU(即XCC和HBM)也没有出现这个问题。出于谨慎考虑,我们确实暂时暂停了一些SPR MCC的发货,同时我们对预期的固件缓解措施有信心,预计不久将发布剩余的发货量。"- 英特尔发言人对Tom"s Hardware说。

在回答一个后续问题时,英特尔还告诉我们,它预计固件缓解不会对性能产生影响。


【资料图】

英特尔拖延已久的蓝宝石激流处理器是使用两种类型的底层设计制造的:XCC封装,采用四个计算瓦片(裸片)来创建一个芯片,以及MCC封装,使用一个单片裸片。如上面的幻灯片所示,MCC设计用于32核以下的芯片,这是英特尔大批量销售的来源,而XCC变体则用于36至60核之间的光环芯片。

"英特尔面临着另一茬与蓝宝石激流MCC有关的设计问题,这是蓝宝石激流的最高容量版本。自6月中旬以来,2插槽和4插槽的SKU由于时间问题而暂停了出货,"Patel说。

英特尔没有证实这个问题仅限于双插槽和四插槽的SKU,而是将这个问题归类为仅限于SKU的 "子集",也没有说明何时开始暂停出货的。英特尔也没有证实帕特尔的说法,即该问题与时间有关,也没有对该问题的性质进行任何澄清。

计时问题可能包括任何数量的可能性,从UPI互连到指令计时问题,所以该错误的真正性质目前仍不明确。我们确实知道,英特尔可以通过一个固件修复来纠正这个问题,该固件目前显然仍在验证中,所以这个问题不需要重新设计或新的修订/步进来解决。此外,由于新的固件是一个充分的修复,英特尔可能不需要更换任何已经在使用的处理器--尽管这可能对其客户构成一个令人头痛的验证。

英特尔已经赢得了大量的批评,不仅是因为其在蓝宝石急速赛车pk10计划的工艺节点技术上的失误,而且还因为其设计和验证方法的问题,导致了进一步的延迟和许多新的步骤(一种典型的小型重新设计,需要一个新版本的芯片来纠正一个问题)。英特尔的蓝宝石激流(Sapphire Rapids)一直受到传言的困扰,它的设计/验证失误导致一些配置需要12次步进(一个不自然的大数字--大多数芯片最多只有三次步进)。自然,这导致了严重的生产延迟和错过了发布日期。

此后,该公司表示,它计划对其设计、模拟和验证流程采取不同的方法,以纠正这些问题。英特尔表示,这些调整将在下一代翡翠急流至强处理器中全面启动。

英特尔说,这个新的蓝宝石急流的错误不是在 "运行商业上可用的软件 "时遇到的(也许这是一个超滤器的定制应用),而且显然不是在验证时发现的。这种类型的情况并不是完全没有听说过;几乎所有复杂的芯片都有已知和未知的勘误和错误,通过固件、驱动程序和软件解决,可以减少或消除这些问题,而且它们以这种方式发货--这就是现代半导体设计和生产的本质。

例如,英特尔的Skylake一代处理器发货时有53个已知的勘误表,六个月后,英特尔又列出了40个勘误表。另一个例子是,最近发现AMD的EPYC Rome芯片在运行1044天后崩溃。有些错误根本就没有被修复,因为它们被认为不够关键,无法修复,或者它们是通过固件和软件的组合来修复。最关键的错误有时需要一个新的步骤来纠正,这是最糟糕的情况。对英特尔来说,幸运的是,这里似乎不是这种情况。

然而,虽然bug并不罕见,但这些类型的bug导致出货停止的情况并不常见。