在发烧友圈子里每隔几年就会出现一个反复被提起的问题电脑芯片真的会因为使用时间而变慢吗?

听起来很简单,但答案比单纯的“是”或“否”要有趣得多。你的旧CPU或GPU并不会因为在系统里用了五年就某天突然变慢10%。在大多数正常情况下,如果一台老电脑感觉变慢,罪魁祸首更可能是积尘、干涸或被抽走的散热界面材料(TIM)、后台应用、操作系统臃肿、安全补丁、更新更高要求的游戏,或者仅仅是用户对硬件的期望提升。

但这并不意味着硅老化是编造的故事。事实上,电脑芯片在物理层面确实会老化。晶体管、互连线、绝缘层以及电源供电路径都在电气和热应力下工作。随着时间推移,这些应力会慢慢侵蚀最初让芯片可靠运行的电压和频率余量。

多年来我亲眼在GPU上看到过这种情况。我的许多显卡最初的超频是稳定的,然而在相同的频率、电压和相似温度下运行一段时间后会变得不稳定。显卡并没有以传统意义上的“慢”下来,而是原本提供超频空间的余量在缩小。这就是大多数发烧友所说的硅老化的真实故事芯片不像老旧发动机那样“疲惫”,而是失去了曾经让激进调校成为可能的安全余量。

芯片通常不会变慢,而是失去稳定性余量

现代CPU与GPU并不是固定频率的部件。它们会根据功率、电压、电流、温度、工作负载行为、BIOS(基本输入输出系统)/UEFI(统一可扩展固件接口)规则以及用户自定义设置不断调整频率。例如,Intel的Turbo Boost行为受功率、电流、热限制、活跃核心数量和最高频率规则的约束。换句话说,提升频率本身在老化介入之前已经是有条件的。这意味着“芯片老化”和“芯片变慢”之间有很大区别。

一颗新CPU可能在特定电压范围内通过验证,能够达到5.5 GHz并拥有足够的可靠性余量。几年后,同一颗CPU仍然可以在出厂设置下完美运行,因为Intel、AMD或NVIDIA并没有把它的稳定性余量压到零。但如果用户在手动超频、降压,或是让芯片在极高电压/温度下运行,那么这被削减的余量就会变得更加重要。

老化实际上会移动芯片的稳定性曲线。曾经在给定电压下可行的频率,可能最终需要稍高的电压;或者在电压保持不变的情况下,芯片可能需要稍低的时钟频率才能保持稳定。

到底是什么在芯片内部老化?

在物理层面,硅老化并不是单一现象。它是一系列磨损机制的集合,芯片设计师和工程师在设计和验证芯片时必须考虑这些机制

PC发烧友需要了解的主要机制包括负偏置温度不稳定性(NBTI)热载流子注入(HCI)时变介质击穿(TDDB)以及电迁移。一篇2025年的《集成电路可靠性》综述将NBTI、HCI、TDDB、电迁移以及其他老化引起的变化列为随着频率和电压继续提升而对芯片构成的主要可靠性威胁。

负偏置温度不稳定性(NBTI)是其中的“大头”。通俗来说,电压和温度应力会逐渐改变晶体管的行为。阈值电压会漂移,意味着晶体管可能需要稍微不同的电气条件才能像以前那样可靠地切换。NBTI被广泛认为是MOSFET(金属氧化物半导体场效应晶体管)可靠性问题的关键,表现为阈值电压升高和晶体管驱动能力下降。

热载流子注入(HCI)是另一种老化机制。在高电场下,能量较高的载流子——通常是电子——会随时间损伤晶体管的部分结构。可以把它想象成晶体管被多年高应力操作“粗暴”对待的结果。

时变介质击穿(TDDB)主要涉及绝缘层的磨损。这通常不会表现为“温和的”5%性能下降。它是一种长期可靠性机制,最终可能导致失效。

电迁移本质上是芯片内部金属互连在应力下的老化。CPU与GPU包含微小的金属互连,负责在晶体管之间传递电流,随着时间推移,高电流密度和热量会把金属原子推离原位。这样会产生空洞,增加电阻或断开连接,或形成突起导致相邻结构短路。用发烧友的话说,老化的不仅是晶体管——芯片内部的微观布线也会磨损。

为何芯片老化更常表现为崩溃,而不是性能下降

硅老化被误解的原因在于人们期待它像机械磨损一样表现。老旧的汽车可能失去动力、燃油消耗增加或感觉迟钝。而CPU或GPU则不同。

电脑芯片的设计目标是正确工作。要么芯片在规定时间内完成工作,要么就不行。要么位是正确的,要么就错误。要么在给定电压/频率/负载下保持稳定,要么就抛出错误、导致应用(甚至整个操作系统)崩溃、重置驱动或产生可视化伪影。这就是为什么老化的芯片常常看起来正常,直到它突然不正常。

游戏基准测试可能运行良好,但着色器编译可能崩溃。GPU可能通过轻度压力测试,却在某款特定游戏中出现黑屏或伪影。CPU降压在数月内保持稳定,却突然抛出WHEA(Windows硬件错误架构)错误。内存超频可能通过一次测试,却在长时间游戏时失效。这因为不同工作负载对芯片电路的应力方式并不相同。

这也是为什么超频爱好者往往比普通用户更早注意到老化。超频缩小了稳定芯片与不稳定芯片之间的余量。如果一块原厂GPU仍有大量余量,轻微老化可能不易察觉;但如果该GPU已经运行在接近极限的状态,少量老化就足以暴露不稳定。

Intel Raptor Lake硅老化走进主流消费者视野的案例

最近最具代表性的案例是Intel第13代(Raptor Lake)和第14代(Raptor Lake Refresh)桌面CPU的不稳定风波。

数月来,用户在高端Raptor Lake与Raptor Lake Refresh CPU上报告崩溃。问题主要出现在使用Epic的Unreal Engine 5的游戏中,尤其是在使用RAD Game Tools专有的Oodle库进行高强度着色器/管线状态对象(PSO)编译/解压时。最终,Intel将问题归因于升高的工作电压以及所谓的Vmin Shift不稳定性。2024年10月的Intel更新报告称,公司已确认过高电压和过早老化是根本原因之一,并发布了BIOS/UEFI与微码补丁,以防止CPU硅本身进一步受损。

这正是让发烧友更易理解硅老化的案例。Vmin指在给定条件下保持稳定运行所需的最低电压。如果该最低电压上移,芯片就需要比以前更高的电压才能在相同频率下保持稳定。如果系统仍按旧的假设供电,就会出现明显的不稳定。

关键并不是所有Raptor Lake CPU都注定要报废,也不是所有现代CPU都会危险老化。更具体的教训是如果电压行为出现异常,并且芯片长时间暴露在高电压和高温下,硅老化就会从一个看不见的工程问题转变为明显的消费级问题。

同样需要记住,软件和固件的补丁无法奇迹般逆转物理硅的退化。关于Intel修复的报道表明,更新可以帮助防止未来的损伤,但已经退化的CPU通常只能更换,而不是靠BIOS/微码奇迹般恢复

超频用明天的安全余量换取今天的性能

超频之所以有趣,是因为它把隐藏的余量转化为额外性能,代价是更高的热量/功耗以及潜在的不稳定性。这也是超频成为最容易暴露硅老化的方式之一的原因。

原厂芯片经过验证,能够在定义好的工作包络内运行,该包络考虑了电压、电流和热量,并包含可靠性假设。当你提升电压、解锁功率限制、提高负载线校准、运行更高的持续温度,或把时钟频率推超规格时,你就在逼近安全边界。

这并不意味着每一次超频都是鲁莽的。温和的GPU核心频率偏移、谨慎的降压或合理的日常CPU超频都可以是完全可接受的。但高电压则不同。电压对长期退化的影响尤为显著,因为它直接提升了芯片内部的电场应力。再加上热量和时间,就形成了加速硅老化的经典配方。

这就是为什么“通过了一项压力测试”并不等同于“在五年后仍然稳定”。一个在众多基准和压力测试中表现稳定的超频,可能几乎没有长期余量。今天能跑通并不代表以后还能跑通。

一种有用的思考方式是原厂设置在问芯片能否多年可靠运行;超频在问你现在能站在“悬崖边”多近。有时,经过数月或数年的高温、高电压和重负载后,这条悬崖边会向内收缩。

拆穿常见误区

第一个误区是老CPU与GPU会每年自动变慢。实际上,它们通常不会。一颗使用五年的CPU在相同频率、相同功率限制、相同电压、相同散热和相同软件环境下,不会因为时间流逝而出现线性性能下降。

第二个误区是硅老化是假的——事实并非如此。芯片架构师和工程师必须考虑老化,因为前文提到的NBTI、HCI、TDDB和电迁移是真实存在的可靠性机制。

第三个误区是任何基准分数下降都证明芯片退化,这通常并不成立。现代芯片的频率提升行为对温度、电压、功率/电流限制、BIOS/UEFI设置、后台任务、系统驱动甚至环境温度都极其敏感。基准分数下降往往是更平凡的因素导致的,而非硅老化。

第四个误区是降压危险。合理的降压可以降低电压、热量和功耗,实际上有助于延长芯片寿命。风险不在于降压本身,而在于降压幅度过大导致不稳定。

第五个误区是超频退化总是安慰剂效应。事实并非如此。如果芯片曾在某电压、温度下保持特定超频,而在相同条件下后来无法维持,那么失去的稳定余量是一个真实的解释。

如何让电脑芯片更长久健康?

想让消费级芯片(CPU或GPU)更长久健康,需要遵循一套常识、合理且基于科学的规则。

首先,不要使用超过需求的电压保持温度在可控范围避免盲目相信主板的激进出厂设置,尤其是高端CPU。在厂商发现实际的芯片稳定性或寿命相关问题时,及时更新BIOS与微码定期重新测试旧的超频配置,而不是假设2022年的超频档案可以永久保持稳定。

对于GPU,先检查常规项目是否有灰尘、散热界面材料是否老化、显存芯片的散热垫、GPU核心/显存温度、电源稳定性以及驱动行为。对于CPU,检查BIOS/UEFI设置、温度、电压/频率曲线、功率/电流限制、系统内存稳定性、降压以及散热方案,在排除硅本身受损前不要轻易下结论。

如果在排除散热、内存、 PSU、BIOS/UEFI与软件变量后,CPU或GPU在原厂设置下仍出现不稳定,此时可以考虑保修或更换。原厂不稳定不应成为用户“调校”去规避的负担。

结语

这是每位PC发烧友心中的老问题电脑芯片会因使用时间而变慢吗?

对大多数人来说,简短的答案是否定的。与智能手机电池不同,CPU或GPU并不会每年随意掉2%性能。如果你的游戏机器感觉迟钝,不要怪硅老化;应检查散热膏是否干涸、软件是否臃肿或游戏本身是否更吃硬件。

但硅退化是真实存在的。多年高电压、热量和重负载会慢慢蚕食芯片的稳定性余量——这是一层出厂时为保证在特定电压、温度、 电流和功率参数下能够稳定运行的安全网。在原厂设置下,这层缓冲非常充裕,除非你打算让芯片使用十年甚至更久,否则大概率不会注意到不稳定。

然而,如果你长期进行激进的超频、使用高主板自动电压或散热不佳,那么这层安全网会快速缩小。当余量消失时,硬件并不会温和地慢几帧,而是直接“发脾气”。曾经稳定的GPU超频或CPU降压会突然导致应用和游戏崩溃、抛出WHEA错误、驱动重置、解压失败以及负载下的蓝屏/黑屏。老旧硬件并不会优雅地减速,它只是“失去耐心”,对你的调校变得极不宽容。