HPE警告新错误,该错误会在40,000小时后杀死SSD驱动器

惠普企业(HPE)再次警告其客户,某些串行连接的SCSI固态驱动器在运行40,000小时后将发生故障,除非应用了关键补丁程序。

该公司于2019年11月发布了类似的公告,当时固件缺陷在运行32,768小时后产生了故障。

受影响的驱动器

当前问题影响HP服务器和存储产品(如HP ProLiant,Synergy,Apollo 4200,Synergy存储模块,D3000存储柜,StoreEasy 1000存储)中的驱动器。

HPE型号 惠普SKU HPE SKU说明 HPE备件SKU HPE固件修复日期
EK0800JVYPN 846430-B21 HPE 800GB 12G SAS WI-1 SFF SC固态硬盘 846622-001 2020年3月20日
EO1600JVYPP 846432-B21 HPE 1.6TB 12G SAS WI-1 SFF SC固态硬盘 846623-001 2020年3月20日
MK0800JVYPQ 846432-B21 HPE 800GB 12G SAS MU-1 SFF SC固态硬盘 846624-001 2020年3月20日
MO1600JVYPR 846436-B21 HPE 1.6TB 12G SAS MU-1 SFF SC固态硬盘 846625-001 2020年3月20日

该公司表示,这是它提供的受影响的SSD的完整列表。但是,此问题并非HP独有,其他制造商的驱动器中也可能存在。

如果这些产品中的SSD运行的固件版本早于HPD7,则在通电40,000小时后它们将失败。这相当于4年206天16个小时,比其中某些产品的延长保修期短大约半年。

当到达故障点时,数据和驱动器均无法恢复。在具有数据备份设置的环境中,可以防止此类灾难。

HPE从SSD制造商那里了解了固件错误,并警告说,如果同时安装SSD并使其投入使用,则它们几乎可能同时发生故障。

“如果非故障容错模式(例如,RAID 0)和故障容错RAID模式下的驱动器故障多于容错RAID模式逻辑驱动器支持的驱动器(例如,带有RAID 5的RAID 5逻辑驱动器,则需要从备份中恢复数据)两个失败的固态硬盘]”- HPE咨询

可以使用适用于VMware ESXiWindowsLinux的在线闪存组件来安装新固件。

不如上次严重

不过,有一些好消息。通过检查HPE的发货日期并考虑40,000小时的有效期限,没有受影响的SSD由于此固件错误而发生故障。

HPE估计,未打补丁的SSD最早将在2020年10月开始出现故障。这为管理员提供了大量时间来应用更正后的固件。

早在11月,社交媒体和论坛上就涌现出了有关存储驱动器故障的报道,而用户则抱怨设备间隔数分钟就崩溃了。

使用Smart Storage Administrator(SSA)实用程序可以查找受影响的驱动器的正常运行时间,该实用程序为系统上安装的每个驱动器提供开机时间。

或者,用户可以运行脚本来检查其SSD上的固件是否存在40,000个开机小时故障问题。该脚本  适用于某些HPE®SAS SSD,可用于Linux,VMware和Windows。

 

*编译:Domino

*来自:Bleeping