没有合适的资源?快使用搜索试试~ 我知道了~
首页硬盘SMART检测参数详解
要说Linux用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。诸如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措施时。 硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。 对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。那么在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。 最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使用了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。 SMART的目的是监控硬盘的可靠性、预测磁盘故障和执行各种类型的磁盘自检。如今大部分的ATA/SATA、SCSI/SAS和固态硬盘都搭载内置的SMART系统。
资源详情
资源评论
资源推荐
硬盘 SMART 检测参数详解
一、SMART 概述
要说 用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。诸如 的备份和
存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,
特别是在用户从来没有提前考虑过在这些情况下的应对措施时。
硬盘的故障一般分为两种:可预测的()和不可预测的()。后者偶而会发
生,也没有办法去预防它,例如芯片突然失效,机械撞击等。但像电机轴承磨损、盘片磁介质性能下降等
都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。
对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,
然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。那么在发生故障前,至少有足够的时
间让使用者把重要资料转移到其它储存设备上。
最早期的硬盘监控技术起源于 年, 在 计算机的 代硬盘驱动器中使
用了后来被命名为 !"##(故障预警分析技术)的监控技术,它是通过在固件中
测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会
发生故障”。
不久,当时的微机制造商康柏和硬盘制造商希捷、昆腾以及康纳共同提出了名为 $ 的类似技术。
通过该技术,硬盘可以测量自身的的健康指标并将参量值传送给操作系统和用户的监控软件中,每个硬盘
生产商有权决定哪些指标需要被监控以及设定它们的安全阈值。
% 年,康柏公司将该技术方案提交到 &!'&!'(!!)委员会进行标准化,该方案得到
、希捷、昆腾、康纳和西部数据的支持, 年 月进行了 *+ 版的修正,正式更名为 ****,*
($-''."##'.,/''."),全称就是“自我检测分析与报告技术”,
成为一种自动监控硬盘驱动器完好状况和报告潜在问题的技术标准。
, 的目的是监控硬盘的可靠性、预测磁盘故障和执行各种类型的磁盘自检。如今大部分的 ,
,、 和固态硬盘都搭载内置的 , 系统。作为行业规范,, 规定了硬盘制造厂商
应遵循的标准,满足 , 标准的条件主要包括:
)在设备制造期间完成 , 需要的各项参数、属性的设定;
)在特定系统平台下,能够正常使用 ,;通过 0 检测,能够识别设备是否支持 , 并可显
示相关信息,而且能辨别有效和失效的 , 信息;
+)允许用户自由开启和关闭 , 功能;
)在用户使用过程中,能提供 , 的各项有效信息,确定设备的工作状态,并能发出相应的修正指
令或警告。在硬盘及操作系统都支持 , 技术并且开启的情况下,若硬盘状态不良,, 功能会
在开机时响起警报,, 技术能够在屏幕上显示英文警告信息:“12234,567
507,2445078694,!7454242,.”(警告:
立刻备份你的数据并更换硬盘,硬盘可能失效。)
, 功能不断从硬盘上的各个传感器收集信息,并把信息保存在硬盘的系统保留区(# )内,
这个区域一般位于硬盘 物理面的最前面几十个物理磁道,由厂商写入相关的内部管理程序。这里除了
, 信息表外还包括低级格式化程序、加密解密程序、自监控程序、自动修复程序等。用户使用的监
测软件通过名为“,#:的命令(命令代码为:/)对 , 信息进行读取,且不
允许最终用户对信息进行修改。
#&&'''# 是 #& 的的软件包程序,由 #& 和 #& 两部分工具程序组成,它们一起为
平台提供对磁盘退化和故障的高级警告。
二、smart 信息解读
ID
属性 ,通常是一个 到 %% 之间的十进制或十六进制的数字。硬盘 , 检测的 代码以两位十六
进制数表示(括号里对应的是十进制数)硬盘的各项检测参数。目前,各硬盘制造商的绝大部分 ,
代码所代表的参数含义是一致的,但厂商也可以根据需要使用不同的 代码,或者根据检测项目的多
少增减 代码。一般来说,以下这些检测项是必需的:
() ;<<4'<底层数据读取错误率
() <'<'启动停止计数
%(%) '<'<重映射扇区数
() ';<0<8'#通电时间累计,出厂后通电的总时间,一般磁盘寿命三万小时
() <"<'主轴起旋重试次数(即硬盘主轴电机启动重试次数)
() '<"<'磁盘校准重试次数
() ';<"<'磁盘通电次数
() ,&<##温度
=() 7<<4'<'奇偶校验错误率
>() 1<4'<?写错误率
!() ,'<#<1:表示磁盘自出厂总共写入的的数据,单位是 @%"
!() ,'<#<:表示磁盘自出厂总共读取的数据,单位是 @%"
ATTRIBUTE_NAME
硬盘制造商定义的属性名。,即某一检测项目的名称,是 代码的文字解释。
FLAG
属性操作标志(可以忽略)
当前值(value)
当前值是各 项在硬盘运行时根据实测原始数据(; )通过公式计算的结果, 到 %+ 之间。
%+ 意味着最好情况, 意味着最坏情况。计算公式由硬盘厂家自定。
硬盘出厂时各 项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方法为硬盘厂家
保密,不同型号的硬盘都不同,最大正常值通常为 或 或 %+,新硬盘刚开始使用时显示的当前
值可以认为是预设的最大正常值(有些 项如温度等除外)。随着使用损耗或出现错误,当前值会根据
实测数据而不断刷新并逐渐减小。因此,当前值接近临界值就意味着硬盘寿命的减少,发生故障的可能性
增大,所以当前值也是判定硬盘健康状态或推测寿命的依据之一。
最差值(Worst)
最差值是硬盘运行时各 项曾出现过的最小的 。
最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。通常,最差值与当前值是相等的,
如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。
临界值(Threshold)
在报告硬盘 !4 状态前,10, 可以允许的最小值。
临界值是硬盘厂商指定的表示某一项目可靠性的门限值,也称阈值,它通过特定公式计算而得。如果某个
参数的当前值接近了临界值,就意味着硬盘将变得不可靠,可能导致数据丢失或者硬盘故障。由于临界值
是硬盘厂商根据自己产品特性而确定的,因此用厂商提供的专用检测软件往往会跟 1';# 下检测软件
的检测结果有较大出入。
硬盘的每项 , 信息中都有一个临界值(阈值),不同硬盘的临界值是不同的,, 针对各项的
当前值、最差值和临界值的比较结果以及数据值进行分析后,提供硬盘当前的评估状态,也是我们直观判
断硬盘健康状态的重要信息。根据 , 的规定,状态一般有正常、警告、故障或错误三种状态。
, 判定这三个状态与 , 的 -$ #'",(预测错误发现位)参数的赋值密切相
关,当 -$ #'",@,并且当前值、最差值远大于临界值的情况下,为正常标志。当
-$ #'",@,并且当前值、最差值大于但接近临界值时,为警告标志;当 -
$ #'",@,并且当前值、最差值小于临界值时,为故障或错误标志*
原始值(RAW_VALUE)
制造商定义的原始值,从 974 派生。
数据值是硬盘运行时各项参数的实测值,大部分 , 工具以十进制显示数据。
数据值代表的意义随参数而定,大致可以分为三类:
)数据值并不直接反映硬盘状态,必须经过硬盘内置的计算公式换算成当前值才能得出结果;
)数据值是直接累计的,如 ''(启动停止计数)的数据是 %,即表示该硬盘从出厂到
现在累计启停了 % 次;
+)有些参数的数据是即时数,如 ,&(温度)的数据值是 ,表示硬盘的当前温度是
A。
因此,有些参数直接查看数据也能大致了解硬盘目前的工作状态。
TYPE
属性的类型(-$ 或 0.)。-$ 类型的属性可被看成一个关键属性,表示参与磁盘的整体
, 健康评估(4!4)。如果任何 -$ 类型的属性故障,那么可视为磁盘将要发生
故障。另一方面,0. 类型的属性可被看成一个非关键的属性(如正常的磁盘磨损),表示不会使磁
盘本身发生故障。
UPDATED
表示属性的更新频率。0B 代表磁盘上执行离线测试的时间。
WHEN_FAILED
如果 974 小于等于 ,848,会被设置成“!23<201:;如果 10, 小于等于 ,848 会被
设置成“</<#:;如果都不是,会被设置成“-:。在“!23<201:情况下,需要尽快备份重要 文
件,特别是属性是 -$ 类型时。“</<#:代表属性已经故障了,但在运行测试的时候没问题。
“-:代表这个属性从没故障过。
三、SMART 参数详解
一般情况下,用户只要观察当前值、最差值和临界值的关系,并注意状态提示信息即可大致了解硬盘的健
康状况。下面简单介绍各参数的含义,以红色标出的项目是寿命关键项,蓝色为固态硬盘()特有的
项目。
在基于闪存的固态硬盘中,存储单元分为两类:(.",单层单元)和 (-
,多层单元)。 成本高、容量小、但读写速度快,可靠性高,擦写次数可高达
次,比 高 倍。而 虽容量大、成本低,但其性能大幅落后于 。为了保证 的寿命,
控制芯片还要有智能磨损平衡技术算法,使每个存储单元的写入次数可以平均分摊,以达到 万小时
的平均无故障时间。因此固态硬盘有许多 , 参数是机械硬盘所没有的,如存储单元的擦写次数、备
用块统计等等,这些新增项大都由厂家自定义,有些尚无详细的解释,有些解释也未必准确,此处也只是
仅供参考。下面凡未注明厂商的固态硬盘特有的项均为 !' 主控芯片特有的,其它厂商各自单独
注明。
SMART 属性参数
01(001)底层数据读取错误率 Raw Read Error Rate
数据为 或任意值,当前值应远大于与临界值。
底层数据读取错误率是磁头从磁盘表面读取数据时出现的错误,对某些硬盘来说,大于 的数据表明磁盘
表面或者读写磁头发生问题,如介质损伤、磁头污染、磁头共振等等。不过对希捷硬盘来说,许多硬盘的
这一项会有很大的数据量,这不代表有任何问题,主要是看当前值下降的程度。
在固态硬盘中,此项的数据值包含了可校正的错误与不可校正的 4 错误(74+74)。
注:4("'$'4&#)意为独立硅元素冗余阵列,是固
态硬盘特有的一种冗余恢复技术,保证内部有类似 阵列的数据安全性。
02(002)磁盘读写通量性能 Throughput Performance
此参数表示硬盘的读写通量性能,数据值越大越好。当前值如果偏低或趋近临界值,表示硬盘存在严重的
问题,但现在的硬盘通常显示数据值为 或根本不显示此项,一般在进行了人工脱机 , 测试后才会
有数据量。
03(003)主轴起旋时间 Spin Up Time
主轴起旋时间就是主轴电机从启动至达到额定转速所用的时间,数据值直接显示时间,单位为毫秒或者秒,
因此数据值越小越好。不过对于正常硬盘来说,这一项仅仅是一个参考值,硬盘每次的启动时间都不相同,
某次启动的稍慢些也不表示就有问题。
硬盘的主轴电机从启动至达到额定转速大致需要 秒~% 秒左右,过长的启动时间说明电机驱动电路或
者轴承机构有问题。旦这一参数的数据值在某些型号的硬盘上总是为 ,这就要看当前值和最差值来判断
了。
对于固态硬盘来说,所有的数据都是保存在半导体集成电路中,没有主轴电机,所以这项没有意义,数据
固定为 ,当前值固定为 。
剩余24页未读,继续阅读
大饼卷馒头
- 粉丝: 56
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0