茉莉花新闻网

中華青年思想與行動的聚合地

电脑长久不关机会缩短电脑寿命吗?

v2 86ea4b8b7df16d9c219613abc03b1ee5 l
老狼,UEFI固件、服务器、嵌入式产品(公众号:UEFIblog)
查看知乎原文

谢邀。答案是当然会缩短寿命。注意我们这里不是讨论一直不开机会不会影响寿命,也不是一直不开机和一直不关机哪个更影响寿命,不能偷换概念。我们要说的是长久不关机对寿命的影响。

硬件领域业内都知道芯片会 Wear out,这应该是个普遍共识了。芯片用一段时间平均失效率就会上升,这是由芯片的物理特性决定的,是不可否认的客观现实。注意这里是平均,不是特指,说「我的电脑用了十年天天开,也没事。」,没有任何意义。所谓的电脑长久不关机的普通用户,其实只是不关机的时间比较长。个别完全不关机的用户电脑数年没有问题,也不代表别人不会出问题。只有统计了大量样本的数据才具有普遍性,才会适用于大多数用户。

那么哪里才有不关机的大量样本呢?那么这个 Wear out 速度快慢和什么有关呢?其实很简单,所有云服务厂商的服务器从来不会主动关机,他们动辄数万数十万的服务器为我们提供了足够的样本空间。尽管他们的服务器和一般的电脑有所不同,但实际上稳定性要远高于普通电脑,他们的结果也会好于「电脑」,可以为我们对电脑的预期寿命提供一个上限。

云服务器的非计划关机与故障率

据 ITIC 统计,2017 几个大的服务器提供商非计划关机天梯图如下:

v2 877a82f69255c400896ea8363494e3a8 720w

这些非计划关机是为什么呢?是不是停机检修啊?那是计划内关机(Planned Downtime)。非计划关机都是硬件出了问题而停机。请注意这些厂商的服务器质量相对是比较好的,而 BAT 等云计算厂商、脸书 FB 等 OCP 厂商他们的机器质量更差,更容易出问题(想想为什么质量差,但却没有动辄丢失数据?)。

根据我的经验,上万台服务器的云运营中心,每天都会有数十台乃至百台机器都会因为硬件原因停机等待更换配件。那么到底是哪些硬件坏了需要更换呢?是什么让这些硬件坏了呢?

内存

硬盘(HD/SSD)我就不提了,也许大家认为内存这个东西很皮实,不会坏。其实云服务器中内存的出错是十分频繁的。出错起来也千奇百怪,开始可能是偶尔的随机错误,经过 ECC 等校正后,就再也不会复现;而有时是某个 Bit 总是出错,进而慢慢的整个 row、column 或者相邻的 cell 开始出错,从可以纠正的错误变成不可修正的错误,导致服务器必须停机。这也是为什么内存有这么多 RAS 功能的原因。

是不是服务器内存被频繁访问,读写多了才出错。我台式机不太读写,就不会出错呢?实际上,内存的寿命和老化有关,而和读写次数无关。

内存 DRAM 的每个单元可以看作一个晶体管和一个电容的组合:

v2 3d8dfe7847dcbc41ff6667abb5a5e4b5 720w

电容负责存储,充过电时是 1,没充过电是 0,这就是内存是如何存储数据的。晶体管是个开关,用于选中该电容。正是因为内存每个单元如此简单,才能如此大规模组织起来,形成低价而密度很高的内存颗粒。

电容的问题是会慢慢放电(fading),所以要过一段时间就充电。JEDEC 规定每过 64ms 就要 refresh 一次,也就是充电一次,这个由内存控制器来完成。Refresh 的过程和读写没有本质区别,我们来看 1 天啥也不干,要读写多少次

1000/ 64 * 60 * 60 * 24=1350000 次

就是说每天内存的每个单元本身就要读写 135 万次!事实上,读写对内存来说本质上没有多大损耗,次数没有上限。这和闪存在擦除时电子在包围浮动栅的二氧化硅上进进出出,造成的老化完全不同。

和 CPU 一样,晶体管老化 Aging 是不可避免的:

v2 0fc98e1df472fdc7565cfc8181c4880f 720w

总的来说温度不高,5 年应该没有问题;过后会慢慢出现可修正错误,这时候就应该换内存了。需要指出的是这里的内存是 RDIMM,比台式机使用的 UDIMM 稳定的多。

CPU

CPU 会用坏吗?当然会。Intel 的 3 年质保并不是说说算了:

v2 391dc5c2ee1208979f4ce908cd7df555 720w

交到用户手上或者服务器厂商手上的 CPU 已经在浴缸曲线(Bathtub)模型的底部,也就是稳定期了。多多使用,过了底部就会进入耗损失效期(Wear-out),Wear out 的后果是出错而不是降频,而很多种出错都会被 CPU 的错误检测发现并报告或者纠正。如果发现出错,就是 CPU 开始进入失效期,以后错误会越来越多。

结论

高端大气上档次的服务器用多了也会坏,遑论我们便宜的电脑了。这让我想起有些人总是问服务器的 RDIMM 某宝上为什么这么便宜?某宝的至强 E5 为什么白菜价?因为是洋垃圾,快坏了。某些厂商会预防性更换硬件,某些厂商可纠正错误达到一个阈值后更换(尽管还可以用),这些硬件的可靠性十分堪忧。这也对所谓「电脑用不坏」的论调给予了事实上的否定。

当然一些希望 2 年左右就更新电脑的朋友不必担心,可以一直使用。如果希望多用几年,你没事就关机吧。不为了寿命,也为绿色地球和你的钱包考虑一下吧。

同类信息

查看全部

茉莉花论坛作为一个开放社区,允许您发表任何符合社区规定的文章和评论。

茉莉花新闻网

        中国茉莉花革命网始创于2011年2月20日,受阿拉伯之春的感召,大家共同组织、发起了中国茉莉花革命。后由数名义工无偿坚持至今,并发展成为广受翻墙网民欢迎的新闻聚合网站并提供论坛服务。

新闻汇总

邮件订阅

输入您的邮件地址:

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram