还别不愿意听,真的是维度不同,凭心而论,大家觉得现在一些数码博主的几分钟视频真的可以替代给专业的IT工程师专门设置的几周培训课程有用吗?在短视频横行的时代往往一句“SMR”不能买就能赚取很多流量,很多数码小白也就会抓住是不是SMR(叠层磁记录)作为是否买入一块硬盘的依据。其实这是相当以偏概全的一个想法。
今天咱们就展开写一个长文,来聊聊硬盘的参数。
我们看到一块硬盘:
在硬盘的表面标签上一般会写着硬盘的型号,例如这块Exos10的硬盘,它的型号在标签的第三行“STNM”,剩下的东西就不需要在磁盘标签上去看了。我们可以搜索这个型号的数据表。
另外有些硬盘,也带有类似于STNM的型号,这个些型号也是STNM的衍生型号,咱们在后面再一点点说。
打开搜索到的数据表,你就会看到满眼的数据。这里面要说的是——所有的数据都有用。
今天咱们就一条条地说这些数据是做什么的。
首先你会发现STNM只是这张表上众多型号中的一个,它是细节Exos企业存储盘这个大的产品线之中的一个子型号。这个产品线分三个细分市场型号组:“HyperscaleSATA”、“SATA6Gb/sStandard”和“12Gb/sSASStandard”。
这里就可以开始说,Standard标准模式,就是最普通的硬盘格式,而Hyperscale超大规模模式则是针对于大规模的OLTP在线事务处理,Hadoop数据密集型分布式存储,Ceph存储和对高性能计算应用进行了优化的磁盘。
下面正式的参数就是Capacity(容量),你看到无论是超大规模模式和标准模式都是有8T和10T两个不同的容量。容量咱们就可以不说了,就是磁盘的出厂容量是多大。
是不是Hyperscale模式的硬盘更好呢?这里我们就得看下面的一组参数了。
竖列:StandardModel(e)、HyperscaleModel(e)、StandardModel(4Kn)、SEDModel(e)、SEDModel(4Kn)、SED-FIPSModel(e)以及SED-FIPSModel(4Kn)。
这里面希捷在参数上设置得就比较坑了,这一列参数是磁盘的扇区和存储标准。得分括号外和括号内两部分来看。
首先说括号内的,就只有两种,一个是e,另一个是4Kn。这是出厂的时候的扇区格式。
最早的磁盘格式中,字节的扇区是硬盘的最小存储单元。然而,每个扇区都不能完全用于数据存储,因为一些如ECC、地址标记等用途的代码也要占用磁盘空间(大约每个扇区会有65字节)。字节扇区的数据存储的实际使用可量不会超过1-65/=87.3%。这也就是为什么你们拿到的10T的硬盘最终看起来是不到10T容量的原因了,这里面并不完全是和这样的换算导致的磁盘容量减小。
再后来厂商就提出了一个叫做AF(高级格式)的标准,用了8个字节的扇区组成了一个新的存储单元,这个存储单元8个字节的扇区共同的使用一套磁盘地址代码,于是磁盘的空间利用率就成了1-65/(8*)=98.4%。磁盘空间的利用率就大幅度地提高了,这就是上面的“e”。其实这是一个特别折中的办法。8*=4K,其实这个扇区就是一个4K扇区,只是为了兼容老旧系统被人为的再拆分开成8个字节的扇区来使用,如果是新系统可以直接支持4K扇区就不需要这个步骤了。在数码圈有句话叫“4K对齐”实际上就是规整4K扇区。不过这是个忽悠的事情——在Windows7之后只要格式化4K扇区的磁盘,系统默认是自动执行4K对齐的操作的。
如果不考虑对老旧系统的兼容性,那么磁盘直接提供原生的4K扇区也就是参数4Kn了。
括号外的参数信息,StandardModel标准模式,就是标准的磁盘数据传输模式;HyperscaleModel是超大规模模式;SEDModel这个是一个自己加密自己数据的磁盘格式,配合主板上的硬件存储的密钥把磁盘内部的数据进行加密处理。SED-FIPSModel这也是一个加密模式,SED的加密是希捷自己的技术,而SED-FIPS则是挂上了美国的《联邦信息处理标准》-2和-3等级相关要求的加密形式,对数据安全进行更进一步的保护防止数据被非授权读取和篡改。
因此你看到这几个参数形成了一个矩阵,每个节点上对应了自己的更进一步的衍生型号。
再往后就是这个系列硬盘的特有功能了
HeliumSealed-DriveDesignWithWideWeld——这是氦气盘,确切的说是氦气填充并在氦气保护下结合焊接缝隙的密封盘,内部填充氦气。氦气是一种惰性气体,可以有效地保护磁盘内部的部件不被氧化,这是惰性气体的特性。另外,世界上只有氢气比氦气更轻。在相同的压力下,更轻的气体对运动物体的阻力也就更小,这会让硬盘的能耗更低。在大规模应用的企业硬盘中氦气盘更有能耗优势。
DigitalEnvironmentalSensors——这是数字环境传感器,在硬盘上是有各种传感器的。一方面监控硬盘不同位置的温度,另外还会对电机转速的误差和硬盘本身受到的震动做出测量
再结合着固件内的算法对硬盘机械部分进行调整,以确保数据安全。
ProtectionInformation(T10DIF)——信息保护(T10),这个是一个SAS(SCSI)上专门对磁盘数据完整性进行保护的设置,采用的方法就是把前面咱们说的个字节的扇区数据进行扩展,扩展到个字节。加的这8个字节信息可以在端到端的传输过程中保持数据的一致性。只不过这个技术是在scsi上做出的命令,所以SATA是无缘接触到的。
SuperParity——超级奇偶校验,这是希捷专利技术,可以合并多个扇区的奇偶校验信息,表现出的特性就是在读取磁盘数据的时候有一定的性能提升。
PowerChoice/PowerBalanceTechnology——能源之选是希捷企业级硬盘的一个节能技术,其实这个东西对家用NAS也有相当大的节能收益,在企业高负荷环境下这个技术可以降低大约54%的磁盘能耗,在家用环境中由于大部分时间NAS的硬盘都是并不读写的,因此对节能的贡献就更大了。而能源平衡则是通过算法在IOPS和能耗之间做出调整。如果你的硬盘有大量随机读写任务,那么可以进一步通过能源平衡获得节能收益。
LowHalogen/Hot-PlugSupport——这是热插拔特性。很多的人认为只要是盘架支持热插拔,硬盘就可以热插拔。其实这这是错误的。极有可能导致硬盘的故障。
典型的热插拔硬盘的引脚不仅仅是有长短设计,在检测端发现拔出动作的时候其内部电路会在0.5秒内让磁头臂复位。这个设计你如果多插拔硬盘的时候你会发现,在按下硬盘的拔除手柄的时候往往能听到“嗒”的一声,这就是硬盘磁头极速复位的声音。
这也是为什么磁盘架都会设计一个手柄的原因,并不仅仅是让你能很快地锁紧硬盘,而且还要在拉出硬盘的时候,抬起手柄的时间给硬盘一个相对较长的复位时间。很多人就有的时候不管硬盘是不是支持热插拔,那么都会将硬盘热插拔。这也是很多数码小白很难注意到的一点。
Cache,Multisegmented(MB)——这里是缓存,特地注明了是多段缓存,高达MB。很多人一看这个硬盘缓存远远的高于64MB是不是就是叠瓦盘了呢?当然不一定了。缓存的使用往往是为了达到性能指标而采取的补救措施,这款硬盘转速只有转,相对于转或者转的硬盘是有性能瓶颈的,但又是一款突出能耗比的硬盘,因此加入更大的缓存来提高硬盘的性能。
OrganicSolderabilityPreservative——有机焊接保护剂,这是环保的考虑,避免了很多助焊剂和防腐剂之内的有毒有害物质,现在绿色环保的呼声很大。因此硬盘厂商也会把这个作为一个功能点来说说。
其实就是在焊接层面上覆盖的漆是有机的,并不像之前含有很多重金属和有毒材料。只不过这个技术目前还不成熟,没有之前有毒有害的保护剂更结实,进而会在一定程度上影响寿命。
MeanTimeBetweenFailures(MTBF,hours)——这是平均无故障时间间隔,所有的这个系列的硬盘都是万个小时。是不是看起来很高的样子。但是MTBF是美军的一个标准,通过大量的统计公式来计算出来的,万小时约等于年。这是一个属于从字面上看靠谱但从实际上没啥意义的参数。你如果真的觉得一块硬盘可以从夏朝神话时代用到现在也就有点太天真了。
ReliabilityRating
Full24×7Operation(AFR)——硬盘可靠性等级,在7X24小时运行状况下的年故障率。希捷自己都说用MTBF不靠谱,他们用AFR来标定自己的硬盘可靠性。其实这个数值依旧不太靠谱,按照希捷的说法是机箱内温度不大于40摄氏度、全年运行小时、启动关闭循环在次以内、电压稳定……这个东西和工信部油耗是一样的只有大致的参考意义,但实际结果往往更加悲观。所以说数值表上的0.35%需要放大。按照我们给客户作项目配硬盘的做法就是3年的系统生命周期内根据任务的不同配备5~15%的备用硬盘。按照实际经验来看,3年左右的时间内我们所准备的备用硬盘至少会消耗掉80%。NonrecoverableReadErrorsperBitsRead——这个我们叫做URE,也就是希捷说的每位出错概率。企业盘在这点上做得很高1/10的出错率。不过我们来计算一个数学题:
一个10块硬盘的Raid5阵列,咱们就使用这个系列的最高容量10T的硬盘。
1TB是10字节,也就是8X10位,10T也就达到了8X10位,如果是10块硬盘的阵列,就达到了8X10位。按概率来说8块硬盘组成的RAID5在出现故障恢复的过程中阵列中的数据错误会出现8次,这样从理论概率上说RAID5也是无法做到成功恢复的。
其实这个数值告诉你的是一个磁盘阵列的最大上限。
Power-OnHoursperYear(24x7)——每年开机工作时间,小时,如果按照一天24小时来计算,这个硬盘可以工作天。
eSectorSize(BytesperSector)——这是咱们提到的e扇区的尺寸。在不使用磁盘的“信息保护(T10)”功能下,磁盘的扇区都是模拟了字节大小,在使用了信息保护(T10)共功能下根据不同等级,大小有字节和字节的区别。当然了这两个不同的扇区大小仅仅适用于SAS接口的硬盘,SATA硬盘没有这个问题。
4KnSectorSize(BytesperSector)——4K原生扇区的大小,字节,这里你会发现表格中HyperscaleModel模式硬盘是画了“-”的,这也是刚才咱们在说的Hyperscale模式更多的支持密集缩放存储因此在4Kn的支持上是没有的。而SAS接口则还是有相应的信息保护用途的额外字节需要扩展出来。
LimitedWarranty(years)——保修时间,都是5年。硬件保修这件事其实对于个人用户有点用,但对于企业用户很少选择保修。毕竟来回折腾换硬盘的时间导致的系统停机的费用比硬盘贵多了,大多是采用备件的形式来进行替换。而且“保修”修回来的硬盘正式的项目也真不敢继续用。也正因为,各种企业硬盘的保修时间都给你设置得很长。面子上好看,但没有人去修理。
SpindleSpeed(RPM)——转速,转,硬盘的转速是一个很重要的因素!但是这件事对于企业用户来说有时候并不注重。转速关系到了硬盘的平均寻道时间,这是一个硬盘接收到了读写指令后的平均响应时间,分两个阶段,第一是磁头移动到相关的磁盘上相应的柱面上,第二则是需要读取的数据扇区转动到磁头下面。我们可以知道转动得越快的磁盘第二阶段越省时间。
在需要高速的读写速度的应用场景下,例如一个web服务器,我们之前会选择转的硬盘或者直接用SSD、NVMe,用这种硬盘主要是存事务文件,快一点慢一点真无所谓。
例如这个系列的硬盘平均寻道时间是4.16毫秒,转的硬盘平均寻道时间是2毫秒左右的确是快一倍。连续读取速度也可以达到兆/秒以上,都不是转硬盘能比的。所以咱们也就不提SSD和NVMe了,脱离了应用场景谈性能就是耍流氓。
InterfaceAccessSpeed(Gb/s)——接口速率,这是一个很微妙的东西!SATA6G接口应该的速率是6G,SAS12G的接口应该是12G,这些硬盘都会向下兼容,支持3G、1.5G接口,SAS也兼容6G和3G,但这个东西看看就好,这是电器标准,接口速度并不决定和改善硬盘的速度。
Max.SustainedTransferRateOD(MB/s,MiB/s)——最大连续传输速度,这也是一个特别坑人的数据参数。这是单块硬盘理论上能达到的最快数据传输速度,数据表上只有MB/s。即便是SAS硬盘的速度也就是MB/s远远达不到接口速率。
首先说为什么达不到接口速率还把接口速率做这么大,因为这是为兼容后继的高速设备来准备的,不过SATA几乎是没啥指望,SAS则有可能通过菊链的方式跑满接口速率。这里就是接阵列卡了。回头有机会给大家讲讲怎么玩阵列,展开也是好大一篇文章。
RandomRead/Write4KQD16WCD(IOPS)——这是随机读写4K数据串的指标,用IOPS来表示,也就是每秒完成了多少个IO。他是硬盘最重要的性能指标,没有之一!
他是一个完全的综合指标,越大越证明在实际使用的过程中硬盘的响应速度越快。
AverageLatency(ms)——平均寻道时间,也叫做平均响应时间。刚刚在转速的时候说过了,不再说了。
InterfacePorts——接口数量,这个大家会很奇怪,其实大部分sas硬盘都是支持双端口设计的,可以让SAS硬盘直接接入到两个HBA卡中,这样就可以做故障迁移了,当一个HBA卡出故障的时候可以切换到另外一个HBA卡上。而单端口的SATA硬盘是不具备这个功能的。只不过这个选项对普通个人用户的意义并不大。
RotationalVibration
Hz(rad/s2)——抗旋转震动性,这是一个硬盘固有的指标,越大越好,直接表示了硬盘运行的稳定性。IdleA(W)Average——闲置功耗这是指硬盘加电完毕后不做读写的时候的功耗,如果你有一个NAS,在不读区NAS的日常时间内硬盘的耗电量,这个数值越低越好,但是太低的会影响硬盘的响应速度,在间隔一段时间后读取数据的时候有空可能有顿挫感。
MaxOperatingPower,RandomWrite(WCD)4K/4QRR50%/RW50%——最大操作耗电量——这是通过随机读写4K的数据块测出的平均耗电量,可以当作你的硬盘的最大耗电量指标来看待。
PowerSupplyRequirements——电源需求,就是接什么电,不过目前大部分硬盘都是12V+5V鲜有其他。
Temperature,Operating(°C)——运行温度,这是一个相当重要的指标,决定了你的硬盘故障率和寿命。一般的来说企业级硬盘的运行温度需要限制在60摄氏度以内。超过了这个温度硬盘将受到严重影响。同时这是使用硬盘的时候日常监控的一个重要观察指标。如果硬盘数量太多观察不过来,我们一般会直接降低机房温度。这样从根源上解决问题。
Vibration,Nonoperating:10HztoHz(Grms)——震动,GRMS是“总均方根加速度”,是指一个位置震动强度的单位。2.27这个数值差不多就是田间的拖拉机的震动,一般家里还真的是达不到。
Shock,Operating2ms(Read/Write)(Gs)——在工作的时候可以承受的冲击力,2毫秒内加速度是40G,这个加速度一般家里也不容易实现,基本上我们可以参考汽车安全气囊的标准,汽车安全气囊的启动也是2ms/40G的撞击加速度。
Shock,Nonoperating,1ms/2ms(Gs)——未工作的撞击加速度,Gs是多大的强度可以参考上面了。
然后最后就是长宽高重量等数据了,基本上一个相同尺寸的硬盘长宽都是基本相同的,厚度和里面的盘数量有关系。盘越多也就越厚。
这些是企业硬盘可以查询到的参数,如果是民用硬盘,厂商就会有意无意的忽略掉一些参数。例如这块盘:
你能看到的参数就少了很多了,而且你会看到年使用时间小时和企业盘的小时差别很大,而且例如写入数据了55T/年也是在我们看来很有喜感的一个数值。但说实话,对于普通用户还是够用的。
当然了站着说话不腰疼的前提是,我们所用的硬盘无论是什么鸟样,都不用自己花钱,所以也没想过硬盘寿命、性能等等一系列的问题。习惯性地使用两三年硬盘甭等出问题就换掉。这就相当于公款吃喝的感觉了,浪费掉一部分的可能性是存在的。
但过分的压榨性能的事情没必要做,大家自费在饭馆吃饭,也不见得非得把盘子都舔干净了吧?这事情不体面吧?