图拉丁吧 关注:7,592,944贴子:128,297,784

固态硬盘连写1500TB:最神奇的莫名完蛋了!

只看楼主收藏回复

TechReport进行的固态硬盘持续写入试验在不久前跨过了1.5PB的大关,换用大家更熟悉的计量单位就是1500TB。都说闪存很脆弱,但是消费级产品能够坚持到PB级别,相信绝大多数人都没有想到吧。
  当然了,毕竟是消费级产品,毕竟不是专为超大数据量持久写入而设计的,参与测试的六块固态硬盘陆陆续续出现了各种问题。1PB就干掉了其中的三块,现在又牺牲了一个,而且是最没想到的一个。


来自Android客户端1楼2014-10-04 19:19回复
    参测固态硬盘:
      - 海盗船Neutron GTX 240GB
      - Intel SSD 335 240GB (已死)
      - 金士顿HyperX 3K 240GB(可压缩)
      - 金士顿HyperX 3K 240GB(不可压缩数据) (已死)
      - 三星840 250GB (已死)
      - 三星840 Pro 256GB


    来自Android客户端2楼2014-10-04 19:20
    回复
      其中海盗船之前一直表现稳健,没有任何错误,没有任何性能下滑,事实上性能反而在持续缓慢上升,实在难以理解。
        但同样难以理解的,是它的突然死亡。
        写入约1.1PB之时,Neutron GTX出现了三个重分配区块,按说不多,S.M.A.R.T.警告却很快就出现了,说原始读取错误率超过了阈值。
        即便如此,仍然看似风平浪静地坚持到了1.2PB,但检测发现重分配区块数量暴涨,已经超过了3400个。
        然后就完蛋了。准备进入下一个阶段的时候,系统无法启动,而之前几块固态硬盘就是这么死的。热插拔也无效,能检测到硬盘,但是访问的时候磁盘管理器失去响应。
        这根本不科学啊。固态硬盘挂掉之前,理应有一段缓冲期,尤其是应该进入一段只读状态,方便用户转移、保存数据,但是Neutron GTX突然就彻底无法访问了。
        Neutron GTX S.M.A.R.T.属性里的参数还是很丰富的,但都比较奇怪。重分配扇区指标就有俩,一个从0开始,一个从256倒数,其中后者到死都没有归零。
        剩余寿命也在一直稳定递减,但到最后也还有很多。
        刚才说的原始读取错误率最后显示为零,但并不完全准确。1108TB之后它就已经到了最低值,也就是错误最初开始出现的时候。
        Neutron GTX的死因仍待进一步调查,海盗船也未提供扇区尺寸、冗余替换比例等指标。


      来自Android客户端3楼2014-10-04 19:22
      收起回复
          【最后两位勇士】
          三星840 Pro、金士顿HyperX 3K(可压缩数据)都突破了1.5PB,还都完成了另外一次不加电存留测试。1.5PB写入后,二者都载入200GB测试文件,然后断电拔开,闲置一个星期,再次加电启动,MD5 Hash测试顺利通过,说明数据都完好无损。
          Anvil Storage Utilities工具对720MB小文件进行的Hash检测同样没有任何错误。
          840 Pro的出错速度在降低,但也有了3400多个重分配扇区(跟海盗船死前的差不多),每个1.5MB那就是损失了大约5GB。
          损耗均衡指数早在500TB前后的时候就彻底归零了,到现在又写入了1PB,但用掉的冗余空间比例还是不到40%,仍然有很大的余地。
          三星SSD Magician工具显示健康度仍然是良好(good),不过别忘了,840死前也是给的这个评级呢,看来很不靠谱。
          HyperX 3K使用的SandForce主控支持压缩写入技术DuraWrite,这是第二块坚持至今的一大功臣。
          主控写入1.5PB,而得益于压缩,实际写入闪存的之后大约1.07PB,也就是节省了三分之一。另一块写入不可压缩数据的,因为写入放大的存在,实际写入一直略高于主控写入。
          如果压缩是维持其生存的唯一原因,那么在1.1PB左右就应该支撑不住了,不可压缩版就是这时候挂掉的,内置的健康指数也在那时候报警了。
          但是,1.5PB写入完成后,这货仍然只有区区12个重分配扇区!不知道是不是这块盘的体质特别好,这种差异在半导体产品上是极为正常的,不过至少两块盘是同时抵达的,测试方法也完全相同。
          再细挖S.M.A.R.T.数据,又发现了一些有趣的地方。
          900-1000TB之间出现了2个不可恢复错误,恰恰就是头两个重分配扇区出现的时候,不知道是否巧合。无论如何,不可恢复错误是很致命的,它们会损坏数据、崩溃程序,甚至搞死整个系统。
          编程与擦写错误分别有2个、3个,但它们都不致命,能够将其中的数据转移到其他完好区块上。性能可能会略有影响,但关系不大。


        来自Android客户端4楼2014-10-04 19:23
        收起回复
            【下一个目标:2PB!】
            虽然只剩下了两位,但是TechReport表示试验仍将继续进行下去,而获得的那么多宝贵经验是以前从来没有过的。
            最关键的是,现代消费级固态硬盘的可靠性远远超出了一般想象,应付典型的日常使用实在是绰绰有余。全部六个试验品都毫无问题地写入了几百TB数据,后期虽然有各种各样的小毛病,但继续使用仍然影响不大。
            另一方面,固态硬盘在到达预期寿命之后,问题和失效现象各有不同。大多数都能预先给出警告,甚至包括海盗船Neutron GTX,但也有说死就死的,因此在使用了很久之后,备份很重要。
            840 Pro作为三星的旗舰产品,表现着实不俗(当年夸
            它完美还真不亏),而且至今看起来很健康,还能继续坚持下去。
            金士顿HyperX 3K虽然凭借数据压缩坚持至今,但也出现了一些致命错误,下一步很可能会倒下。
            因此,840 Pro已经成了事实上的赢家。
            截至目前,这两块盘都已经写入了1.6PB,而不把它们弄死,这个试验就不会结束!
            2PB见……如果你们能坚持到的话……


          来自Android客户端6楼2014-10-04 19:24
          收起回复
            QQ钱


            IP属地:北京来自iPad7楼2014-10-04 19:25
            回复


              IP属地:新疆来自Android客户端8楼2014-10-04 19:26
              回复
                怎么没有闪迪


                9楼2014-10-04 19:29
                收起回复
                  应该多弄几个品牌来玩


                  IP属地:广东来自Android客户端10楼2014-10-04 19:31
                  回复
                    看来渣士顿用渣跑分换来了长寿命,大家要另眼相看啊


                    IP属地:北京12楼2014-10-04 19:36
                    收起回复
                      没有闪迪至尊超极速,镁光MX550,不幸福


                      IP属地:江苏13楼2014-10-04 19:43
                      收起回复
                        百万G啊,一天百G也能用几十年


                        来自手机贴吧14楼2014-10-04 19:48
                        收起回复
                          火钳  ————来自爆米花1s客户端。


                          IP属地:湖北来自Android客户端15楼2014-10-04 20:11
                          回复
                            一般人用不到这么多啊 我用了快3年才8TB不到啊。。


                            IP属地:江苏16楼2014-10-04 20:15
                            收起回复
                              话说这有意义么,我们需要各种意外测试,来些掉电吧


                              IP属地:浙江来自Android客户端17楼2014-10-04 20:24
                              收起回复