惠普企业(HPE)再次警告其客户,某些串行连接的SCSI固态驱动器在运行40,000小时后将发生故障,除非应用了关键补丁程序。
该公司于2019年11月发布了类似的公告,当时固件缺陷在运行32,768小时后产生了故障。
受影响的驱动器
当前问题影响HP服务器和存储产品(如HP ProLiant,Synergy,Apollo 4200,Synergy存储模块,D3000存储柜,StoreEasy 1000存储)中的驱动器。
HPE型号 | 惠普SKU | HPE SKU说明 | HPE备件SKU | HPE固件修复日期 |
EK0800JVYPN | 846430-B21 | HPE 800GB 12G SAS WI-1 SFF SC固态硬盘 | 846622-001 | 2020年3月20日 |
EO1600JVYPP | 846432-B21 | HPE 1.6TB 12G SAS WI-1 SFF SC固态硬盘 | 846623-001 | 2020年3月20日 |
MK0800JVYPQ | 846432-B21 | HPE 800GB 12G SAS MU-1 SFF SC固态硬盘 | 846624-001 | 2020年3月20日 |
MO1600JVYPR | 846436-B21 | HPE 1.6TB 12G SAS MU-1 SFF SC固态硬盘 | 846625-001 | 2020年3月20日 |
该公司表示,这是它提供的受影响的SSD的完整列表。但是,此问题并非HP独有,其他制造商的驱动器中也可能存在。
如果这些产品中的SSD运行的固件版本早于HPD7,则在通电40,000小时后它们将失败。这相当于4年206天16个小时,比其中某些产品的延长保修期短大约半年。
当到达故障点时,数据和驱动器均无法恢复。在具有数据备份设置的环境中,可以防止此类灾难。
HPE从SSD制造商那里了解了固件错误,并警告说,如果同时安装SSD并使其投入使用,则它们几乎可能同时发生故障。
“如果非故障容错模式(例如,RAID 0)和故障容错RAID模式下的驱动器故障多于容错RAID模式逻辑驱动器支持的驱动器(例如,带有RAID 5的RAID 5逻辑驱动器,则需要从备份中恢复数据)两个失败的固态硬盘]”- HPE咨询
可以使用适用于VMware ESXi,Windows和Linux的在线闪存组件来安装新固件。
不如上次严重
不过,有一些好消息。通过检查HPE的发货日期并考虑40,000小时的有效期限,没有受影响的SSD由于此固件错误而发生故障。
HPE估计,未打补丁的SSD最早将在2020年10月开始出现故障。这为管理员提供了大量时间来应用更正后的固件。
早在11月,社交媒体和论坛上就涌现出了有关存储驱动器故障的报道,而用户则抱怨设备间隔数分钟就崩溃了。
使用Smart Storage Administrator(SSA)实用程序可以查找受影响的驱动器的正常运行时间,该实用程序为系统上安装的每个驱动器提供开机时间。
或者,用户可以运行脚本来检查其SSD上的固件是否存在40,000个开机小时故障问题。该脚本 适用于某些HPE®SAS SSD,可用于Linux,VMware和Windows。
*编译:Domino
*来自:Bleeping