SSD驱动器已经存在了几年。但是可靠性问题仍然存在。

我想这是4年前发布的这个问题的后续行动,最近一次更新是在2011年。现在是2013年,发生了很大变化吗?我想我在寻找一些真实的证据,而不仅仅是直觉。也许您在DC中使用它们。您的经验是什么?

ssd驱动器的可靠性


UPDATE:

现在是2016年。我认为答案可能是肯定的(可惜的是,尽管它们每GB的成本仍然更高)。

该报告提供了一些证据: />以及有关(消费类)机械驱动器的一些有趣数据:

后劲:硬盘驱动器数据和统计信息

评论

为什么说可靠性问题仍然出现?

我妻子的笔记本电脑SSD每隔几个月就会停止工作,并且需要一个奇怪的“开机但不要尝试启动二十分钟”修复程序。那又好了新技术,新的失败方式。

恐怕仅仅是一个数据点:去年9月,我购买了MacBook Retina Pro,并在60天内出现终端SSD故障。更换单元已经很好,但我现在对此非常警惕,原因仅仅是用户更换/升级这些单元确实不是一种选择。

无论如何,您都不需要可靠的驱动器。如果它每天下午2点失败,您将可以依靠它来设置手表。您想要的是弹性驱动器。

SSD的存在时间比“几年前”更长。实际上,甚至超过40个,即使您指的是基于Flash的SSD,我们也谈20年了。

#1 楼

这将取决于您的工作量和您购买的驱动器的种类...

在我的服务器部署中,我没有遇到规格正确的SSD故障。这涉及许多不同类型的驱动器,应用程序和工作负载。

请记住,并不是所有的SSD都是相同的!

那么“正确指定”是什么意思?

如果您的问题是关于SSD在企业和服务器应用中的使用情况,自最初提出问题以来,在过去几年中发生了很大变化。以下是要考虑的几件事:确定您的用例:有消费类驱动器,企业级驱动器,甚至是坚固的工业应用固态硬盘。不要购买用于台式机的廉价磁盘并在其上运行写密集型数据库。
有许多可用的外形尺寸:PCIe卡,SATA和SAS 1.8“,2.5”,3.5“和其他变体中可以找到当今的SSD。
为服务器使用RAID:您不必依赖在服务器情况下在单个机械驱动器上。为什么要对SSD执行相同的操作?
驱动器组成:有基于DRAM的SSD,以及MLC,eMLC和SLC闪存类型,后者有一定的局限性使用寿命,但是它们是由制造商明确定义的,例如,您会看到每日写入限制,例如3年内每天5TB /天。诸如sTec ZeusRAM和DDRDrive之类的基于DRAM的驱动器不会磨损,它们非常适合高写入环境和较慢的磁盘,而MLC驱动器往往更大并且针对读取进行了优化。 SLC驱动器的使用寿命比MLC驱动器的寿命长,但是企业MLC在大多数情况下似乎都足够好。 rdware RAID控制器似乎仍未完全支持它。在大多数情况下,我使用SSD时,它将使用硬件RAID设置。这不是我在装置中担心的事情。也许我应该?
耐用性:在服务器级SSD中,过度配置很常见。有时,这可以在固件级别完成,也可以仅通过正确方式对驱动器进行分区来完成。总体上,损耗均衡算法也更好。有些驱动器甚至报告寿命和耐用性统计信息。例如,我的一些HP品牌的Sandisk企业级SSD在使用两年后显示98% life remaining
价格已经大幅下降:SSD在许多应用中都达到了正确的性价比。当确实需要性能时,现在很少将其默认为机械驱动器。
声誉已经得到巩固:英特尔是安全的,但不是高性能。 OCZ不可靠。基于Sandforce的驱动器很好。 sTec / STEC非常坚固,是许多高端阵列驱动器的OEM。 Sandisk / Pliant与此类似。 OWC拥有出色的SSD解决方案,并为低冲击服务器和工作站/笔记本电脑部署提供了卓越的保修。
功耗保护很重要:查看具有超级电容器/超级电容器的驱动器,以在发生电源事件时处理出色的写入。一些驱动器通过板载高速缓存来提高性能,或者利用它们来减少磨损。超级大容量可确保将这些写入数据刷新到稳定的存储中。
混合解决方案:硬件RAID控制器供应商提供了使用SSD扩展标准磁盘阵列的功能,以加快读取/写入或充当智能缓存。 LSI具有CacheCade及其Nytro硬件/软件产品。还存在软件和OS级解决方案来执行诸如在应用程序,数据库或虚拟机管理程序系统上提供本地缓存的操作。 ZFS之类的高级文件系统非常智能地使用了读写优化的SSD。可以将ZFS配置为使用单独的设备进行辅助缓存和意图日志,并且SSD经常以这种容量使用,甚至用于HDD池。
顶级闪存已经到来:FusionIO之类的PCIe闪存解决方案已经成熟,组织可以轻松地部署依赖于增强性能的关键应用程序。诸如RanSan和Violin Memory之类的设备和SAN解决方案也仍然存在,并且有更多的参与者进入该领域。



评论


TRIM在很少有超额配置的驱动器中确实很重要,在消费驱动器中,$ / GB至关重要。大多数企业驱动器都有足够的超额配置,因此TRIM不会产生任何影响。

–阿尔法先生
13年5月14日晚上8:32

@MisterSmith看看我上面写的。不同的SSD具有不同的特性。使用正确的工具完成工作。如果要使用Corsair或其他消费者级别的驱动器,并将其用作活动写入密集型数据库系统的SSD,或用作ZFS存储阵列的ZIL日志设备,则我会在一两个月内将其耗尽。

–ewwhite
13年5月14日13:00

优秀的职位。我的一个烦恼:RAID控制器并非总是SSD的正确选择。 RAID控制器旨在条带化数据并在多个磁盘之间添加纠错码。 SSD控制器已经在本地对数据进行条带化,并在多个NVRAM库之间添加了纠错码。另外,添加RAID控制器会引入一个额外的SPOF,即RAID控制器本身。使用单独的RAID控制器通常是正确的选择,但有时使用更好的SSD(更高级别的SATA / SAS甚至是Fusion-IO之类的PCI-E卡)也是更好的选择。

– Jesper M
13年5月14日14:11



@rickyduck,实际上在数据中心中,单个驱动器故障受RAID保护,这意味着要花一些钱来更换它,而不会造成停机。而在游戏平台中,单个驱动器的故障是数据丢失和重新安装操作系统。

–user173755
13年5月14日在19:10

@MisterSmith甚至高端台式机固态硬盘每GB的价格也比针对典型数据中心用途的固态硬盘便宜。除了某些情况下功能更强大的控制器(或仅针对吞吐量而不是突发性能而调整的小容量固件)之外,它们还使生产最佳运行时获得了最佳闪存,这是因为许多服务器工作负载的IO密集度要比台式机高驱动器,并会很快杀死消费者驱动器。

–丹在火光中摆弄
13年5月14日在21:10

#2 楼

自2009年以来,我工作的每台笔记本电脑都具有SSD或Hybrid硬盘。我的SSD经验总结:


我称之为“第一代”驱动器,主要在2009年左右出售:


第一年,大约有1/4人死于猝死综合症(SSD-有趣,大笑)。这对于最终用户来说是非常明显的,并且很烦人,但是巨大的速度差异使得这种持续的故障模式是可以容忍的。
3年后,所有驱动器都死了(突然死亡或磨损),除了两个仍然踢(实际上现在是服务器中的L2Arc驱动器)。


“第二代”驱动器在2010-11年度出售,与上一代产品不同,因为其突然死亡率综合症下降戏剧性的但是,磨损的“问题”仍在继续。



第一年后,大多数驱动器仍在工作。有几起猝死事件。一对夫妇因磨损而失败。
2-3年后,有一半以上仍在工作。第一年的故障率基本上仍在继续。


2012年出售的“第三代”驱动器仍在工作。


之后第一年仍然可以正常工作(敲木头)。
我拥有的最旧驱动器是2012年3月,所以还没有2-3年的数据。






2014年5月更新:
此后,一些“第二代”驱动器发生了故障,但是大约三分之一的原始驱动器仍在工作。上图中的所有“第三代”驱动器仍在工作(敲木头)。我从其他人那里听到过类似的故事,但是他们仍然怀有同样的警告,关于迅速死亡的消息。警惕的人会很好地备份他们的数据。

评论


我的经验与此相呼应。也就是说,我们仍然为员工提供USB硬盘驱动器,以用作时间机器备份(除了我们的标准异地备份方案),以便在灾难性故障或丢失时进行快速,细致的还原。

–EEAA
13年5月14日下午4:37

再给第三代一两年。 ;)

–安迪
13年5月14日在12:27

同样值得注意的是,与HDD相比,SSD遭受固件错误的可能性要大得多。固件既复杂又不成熟,这不是一个很好的组合。

–阿拉斯泰
13年5月14日在15:29

@安迪是正确的。从2009年开始,您说半衰期约为一年。对于2010年至2011年,我们目前还不到3岁,处于该范围的中间位置,此时您的半衰期为3年。那只能基于当前的观察。至少要到2016年,我们才真正知道2012和2013年驱动器的半衰期是否已提高到3年以上。(我们可以尝试从早期故障中推断出来,但是这些故障可能只是孤立的制造缺陷,而不是由长期的故障引起的。定期使用。)

–安德鲁·维特(Andrew Vit)
13年5月14日在17:15

自2010年以来,我一直在使用2 x Intel X25M 80Gb G1。我的工作涉及繁重的读/写过程。每隔几个月左右,我都会重置驱动器(不必这样做)以恢复性能,但是零故障。去年我添加了256Gb的Samsung 230。到目前为止没有问题!

– Antillar Maximus
13年5月16日在11:51

#3 楼

以我的经验,真正的问题是控制器快死了,而不是闪存本身。我已经安装了大约10个三星SSD(830、840 [不是专业人士]),到目前为止,它们都没有出现任何问题。完全相反的是使用Sandforce控制器的驱动器,我在使用OCZ敏捷性驱动器时遇到了几个问题,尤其是在不规则的时间间隔内冻结,在我关闭计算机电源后,驱动器停止工作。
我可以给您两个建议:


如果需要高可靠性,请选择具有MLC和更好的SLC闪存的驱动器。三星840英尺具有TLC闪存,保修期短,我认为并非没有任何原因;)
选择带有已知稳定控制器的驱动器。


评论


让我想起了当前基于LED的照明系统中即将死去的控制器。 LED的使用寿命很长,但控制器似乎没有。

–马特
13年5月16日在2:53

谁知道,但这也许是计划中的行业过时的一部分:)

–klingt.net
13年5月16日在7:52



#4 楼

www.hardware.fr是法国最大的硬件新闻网站之一,也是法国最大的在线经销商之一www.ldlc.com的合作伙伴。自2009年以来,他们每年都可以访问其返回统计信息,并每年两次发布故障率报告(主板,电源,RAM,图形卡,HDD,SSD等)。

使用6个月至1年的“早期死亡”统计数据。同样不能算直接返还给制造商的退货,但是大多数人在第一年就退货给经销商,这不应该影响品牌和型号之间的比较。品牌和型号之间的差异。规则是更大的容量>更多的盘片>更高的故障率,但没有太大的变化。

SSD故障率总体上较低,但是一些SSD型号确实很差,在此期间,臭名昭著的型号的回报率约为50%您要求的(2013)。现在似乎已经停止了购买那个臭名昭著的品牌的事情。 ..现在看来这也比2013年少了一个问题。

故障率报告在这里:20102011(1)2011(2)2012(1)2012(2)2013( 1)2013(2)2014(1)2014(2)2015(1)2015(2)2016(1)2016(2)

评论


这里是法语文章translate.googleusercontent.com/…的自动翻译版本的链接。

–SDwarfs
13年5月14日在9:37

#5 楼


一句话-是(在99%的使用中)
我们安装了大约300个Intel 320,并且在18个月后没有失败
此链接可能会有所帮助:
http:// www.vojcik.net/samsung-ssd-840-endurance-destruct-test/
http://ssdendurancetest.com/