Anmelden mit
Registrieren | Anmelden
Ihre Frage

SMART Fehler - Austausch Grund? (gelöst)

Stichwörter:
  • Desktop
Letzte Antwort: in Festplatten, optische Laufwerke und Controller
Teilen
27. August 2009 20:34:11

Hallo Leute,

mein Nas ist aus allen Nähten geplatzt also habe ich mit V2 angefangen. Damit V3 nicht gleich zum Folgeprojekt wird, habe ich beschlossen zwei Wechselrahmen für jeweils 4x2.5" Platten reinzustecken.

Blöderweise hatte der eine davon einen mechanisch/elektrisch auf jedenfall defekten Slot.

Ich habe also gesucht wie so ein Blöder, bis ich auf den Slot gekommen bin.
Fazit der Geschichte ich habe jetzt 2 Festplatten die mir SMART Fehler auslisten.
Bei der einen passt alles außer dem Fehlerlog:
SMART Error Log Version: 1
ATA Error Count: 30 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 30 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 29 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 28 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 27 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.592 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE

Error 26 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.592 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 857 -
# 2 Short offline Completed without error 00% 724 -
# 3 Short offline Completed without error 00% 699 -
# 4 Extended offline Completed without error 00% 680 -
# 5 Short offline Completed without error 00% 675 -
# 6 Short offline Completed without error 00% 651 -
# 7 Short offline Completed without error 00% 627 -
# 8 Short offline Completed without error 00% 603 -
# 9 Short offline Completed without error 00% 562 -
#10 Short offline Completed without error 00% 135 -
#11 Short offline Completed without error 00% 16 -
#12 Offline Completed without error 00% 40960 -
#13 Offline Completed without error 00% 0 -


Bei der anderen bekomme ich den Extended offline nicht durch
SMART Error Log Version: 1
ATA Error Count: 30 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 30 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 29 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 28 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.593 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.593 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.593 IDENTIFY DEVICE

Error 27 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.592 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE

Error 26 occurred at disk power-on lifetime: 7 hours (0 days + 7 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 8f 00 00 00 e0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE
ef 03 42 00 00 00 a0 08 00:00:09.592 SET FEATURES [Set transfer mode]
27 00 00 00 00 00 e0 08 00:00:09.592 READ NATIVE MAX ADDRESS EXT
ec 00 00 00 00 00 a0 08 00:00:09.592 IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 857 -
# 2 Short offline Completed without error 00% 724 -
# 3 Short offline Completed without error 00% 699 -
# 4 Extended offline Completed without error 00% 680 -
# 5 Short offline Completed without error 00% 675 -
# 6 Short offline Completed without error 00% 651 -
# 7 Short offline Completed without error 00% 627 -
# 8 Short offline Completed without error 00% 603 -
# 9 Short offline Completed without error 00% 562 -
#10 Short offline Completed without error 00% 135 -
#11 Short offline Completed without error 00% 16 -
#12 Offline Completed without error 00% 40960 -
#13 Offline Completed without error 00% 0 -


Wenn ich das Samsung Diagnose Tool drüber laufen lasse ist alles IO.

Müsste ein Händler die SMART Fehler als Austauschgrund akzeptieren oder muss ich damit leben. Was meint Ihr ? Die erste Festplatte habe ich schon mal mit "passt alles" zurückbekommen, da war ich aber auch noch auf der Suche nach dem Übeltäter.

Und ja, ich weiß, direkt mal beim Händler Nachfragen, werde ich, ich wollte vorher nur noch mal ein paar andere Meinungen dazu lesen.

So long....

Mehr über : smart fehler austausch grund geloest

28. August 2009 00:16:32

Richtige SMART-Fehler, die irgendwie bedenklich sind, meldet das Tool vom Hersteller bzw sorgt dafür, daß gleich beim Booten Fehlermeldungen geschmissen werden.
Fremde Tools wissen einfach nicht, was die Hersteller in den SMART-Einträgen speichern. Es gibt viele "obsolete" oder "reversed" Bereiche, die fehlerhafter Weise als SMART-Error ausgelesen werden.

Sobald das Tool vom Hersteller einen SMART-Fehler findet, solltest Du die Platten sofort austauschen, was dann auch kein Problem ist.


Ich habe mal bei einem SMART-Überwachungstool gesehen, wie ein angeblicher "Fehlercounter" meiner Festplatten scheinbar ständig hochzählte. Dann sprang er pötzlich auf einen viel geringeren Wert und danach sprang der Wert scheinbar Zufällig, während ich zugesehen habe.

Wie gesagt: Die Festplattenhersteller benutzen bei weitem nicht alle verfügbaren Register und wenn, dann nicht so, wie es vielleicht irgendwann mal gedacht war (und inzwischen nicht mehr der Fall ist).
Nicht-Herstellerspezifische Tools und SMART ist keine sehr gute Kombination.

Ich sehe da auch keinen Grund etwas auszutauschen, vor allem, da Du weißt, daß diese Einträge durch einen defekten Stecker verursacht wurden.
28. August 2009 08:59:55

Ich habe grade gesehen, dass ich beim zweiten Auszug mist gebaut habe, richtig wäre:

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA
_of_first_error
# 1 Extended offline Interrupted (host reset) 10% 885 -
# 2 Short offline Completed without error 00% 762 -
# 3 Short offline Completed without error 00% 738 -
# 4 Extended offline Completed: read failure 10% 717 646554708
# 5 Short offline Completed without error 00% 714 -
# 6 Short offline Completed without error 00% 690 -
# 7 Short offline Completed without error 00% 666 -
# 8 Short offline Completed without error 00% 642 -
# 9 Short offline Completed without error 00% 600 -
#10 Short offline Completed without error 00% 174 -
#11 Extended offline Completed: read failure 40% 64 646560435
#12 Short offline Completed: read failure 90% 63 646560435
#13 Short offline Completed: read failure 90% 63 646560435
#14 Offline Completed without error 00% 40960 -


Die Fehler der ersten Platte sind auch nmE. nicht wirklicht relevant.
Das mit dem Abbruch der Extended offline tests der anderen Platte finde ich aber schon bedenklich.
Zumal die anderen 4 Platten des selben Models im selben System das Problem nicht haben.

Die Abfragen sowie die Überwachung erfolgt nicht mit irgend einem Tool, hier werkeln die Smartmontools. Wenn die das nicht korrekt machen haben 98% der sich im Betrieb befindenden NAS-Systeme ein Problem.
Ähnliche Ressourcen
Fragen Sie die Community
28. August 2009 13:40:19

Smartmon weiß nicht was der Hersteller wie und wo speichert.
Was meinst Du denn wohl, warum die Hersteller selbst oftmals nur 7 Werte auslesen und anzeigen lassen?
Sicherlich nicht, weil sie es nicht besser programmieren können, sondern ehr aus dem Grund, daß dort entweder irrelevante Werte oder gar "anders verwendete" Werte stehen.
Wenn der Test vom Hersteller sagt, daß die Platte OK ist, dann wirst Du höchstwahrscheinlich keinen Austausch erhalten. Versuchen kannst Du es ja trotzdem, indem Du mal beim Hersteller anfragst, aber ich glaube eher nicht, daß das klappt. Deren Tool sagt, daß die Platte OK ist (wobei SMART ein zweischneidiges Schwert ist: SMART-Status OK heißt noch lange nicht, daß die Festplatte in Ordnung ist; auftretende SMART-Fehler sind aber ein gutes Zeichen dafür, daß man die Platte austauschen sollte.)
29. August 2009 10:49:09

For the record

Das zweite Problem wird von den Kollegen bei den SMARTMontools beschrieben. Es ist ein sich "selbst heilendes Problem".

Kurz zusammengefasst handelt es sich um einen defekten Sektor, bzw. eine Inkonsistenz zwischen der effektiven Daten und der ECC Checksumme.
Da die Platten sowas aber beim nächsten Schreibzugriff selber korrigieren verschwindet der Fehler auch wieder. Damit habe ich das Problem mit dem durchführen des vollständigen Oberflächentests behoben.
Der danach ausgeführte Selbsttest war nun auch wieder zufrieden.

Die genaue Ursache und auch eine mögliche Lösung dazu steht hier beschrieben :
My ATA drive is failing its self-tests, but its SMART health status is 'PASS'. What's going on?