Board logo

标题: [其他] SOS紧急求救, 你们平时用来看硬盘健康度的软件叫啥? [打印本页]

作者: lvcha    时间: 2013-5-8 14:43     标题: SOS紧急求救, 你们平时用来看硬盘健康度的软件叫啥?

单位的ftp服务器不稳定了。
症状是,有时下载文件会解压不开,但有时又好了。
不一定是那个文件,不一定是什么时间。。同一个文件,下来解压不开,再下就好了,再下有又出错。
神了。。

领导叫我解决。

我写了个脚本测试了下, 发现是下载出错的时候,ftp服务器的文件本身也是出错的,但是过会儿又正确了。
而且文件的修改时间啥的都没变化。
nm神了!

我现在怀疑是硬盘坏了。
想检查一下硬盘。
应该不是磁道问题,因为不定哪个文件出错。

有啥软件?
进一步问,linux有啥软件能做这事情? 那个服务器是linux的。 当然实在不行我能拆下来查。
作者: 寂静狼    时间: 2013-5-8 14:56

hdtune

linux下不知

[ 本帖最后由 寂静狼 于 2013-5-8 15:00 编辑 ]
作者: Zico2003    时间: 2013-5-8 15:35

一般都是MHDD的吧

用hdtune的,这个得硬盘坏成啥样子啊
作者: 一只纯猪头    时间: 2013-5-8 16:02

如果是RAID那么这些软件都没用
进RAID控制卡的界面查看才是王道
作者: lvcha    时间: 2013-5-8 16:27

引用:
原帖由 一只纯猪头 于 2013-5-8 16:02 发表
如果是RAID那么这些软件都没用
进RAID控制卡的界面查看才是王道
刚看了,不是raid。
一个pc装个linux,用个硬盘盒装了4块硬盘。
没有软raid和硬raid
作者: lvcha    时间: 2013-5-8 16:29

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   115   099   006    Pre-fail  Always       -       99256047
  3 Spin_Up_Time            0x0003   095   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       26
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       37
  7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       560626773
  9 Power_On_Hours          0x0032   072   072   000    Old_age   Always       -       25292
10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       13
183 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
184 Unknown_Attribute       0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   065   050   045    Old_age   Always       -       35 (Lifetime Min/Max 20/41)
194 Temperature_Celsius     0x0022   035   050   000    Old_age   Always       -       35 (0 20 0 0)
195 Hardware_ECC_Recovered  0x001a   034   013   000    Old_age   Always       -       99256047
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       13748190339816
241 Unknown_Attribute       0x0000   100   253   000    Old_age   Offline      -       2792780022
242 Unknown_Attribute       0x0000   100   253   000    Old_age   Offline      -       3064478293
作者: James50    时间: 2013-5-8 16:29

Linux 下面用 smartctl
作者: lvcha    时间: 2013-5-8 17:07

引用:
原帖由 lvcha 于 2013-5-8 16:29 发表
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE ...
这是不是要挂了的意思?
作者: ccf1st    时间: 2013-5-9 07:40

你最好弄个中文版的hdtune,截个图,这根本看不清
作者: lvcha    时间: 2013-5-9 08:14

posted by wap, platform: GALAXY NOTE II

楼上这是linux的smartctl查的。
单位的机器能少动就少动。
你好好干活没人理你。稍微有点风吹草动一群事后诸葛亮蹦出来喷死你
作者: Kuzuryuusen    时间: 2013-5-9 08:35

posted by wap

这种时候啥都别动先抢救文件……文件都抢救好了再搞别的。

我觉得开始应该用fsck, badblocks等等自带工具检查吧?
作者: 多乐士    时间: 2013-5-9 08:57

5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       37

37个坏道

LS说的没错,数据先存好,然后慢慢弄。
作者: lvcha    时间: 2013-5-9 09:28

没啥关键数据。
现在就是我的确定问题。
比如我打报告说原因硬盘坏了, 那领导批买块新硬盘。
要是换了新硬盘还这样。。我就得吃瘪了。
作者: 20150000    时间: 2013-5-9 10:15

那就说整台都有问题换整台的呗 那样保证没问题
作者: lvcha    时间: 2013-5-9 10:30

引用:
原帖由 20150000 于 2013-5-9 10:15 发表
那就说整台都有问题换整台的呗 那样保证没问题
我领导又不是傻子
作者: dizhang    时间: 2013-5-9 11:01

有坏道了…………当然也有可能只是逻辑坏道,这个很麻烦
作者: wtq    时间: 2013-5-9 11:12

posted by wap, platform: GALAXY S III

硬盘不稳定是物理的,不能因为能修复就叫他逻辑坏道,并且已经有扇区是确定不能修复自动重映射了。一个字换。
作者: dizhang    时间: 2013-5-9 12:14

引用:
原帖由 wtq 于 2013-5-9 11:12 AM 发表
posted by wap, platform: GALAXY S III

硬盘不稳定是物理的,不能因为能修复就叫他逻辑坏道,并且已经有扇区是确定不能修复自动重映射了。一个字换。
逻辑坏道确实是有的,我11年主力硬盘出现了一个坏道,重新格式化(慢速的那种),用到现在没啥问题。




欢迎光临 TGFC Lifestyle (http://bbs.tgfcer.com/) Powered by Discuz! 6.0.0