Knowledgebase
SMART Werte und deren Bedeutung, Festplatten Oberflächentest, HDD S.M.A.R.T. Errors Filesystemcheck Festplatte prüfen
Posted by Mathias Fuerlinger on 09 February 2016 09:20 PM

Die folgende Liste zeigt die wichtigsten HDD S.M.A.R.T. Werte und ihre Bedeutung:

  • Seek Error Rate: Zählt die nicht korrigierbaren Fehler bei den Lesevorgängen. Die ist ein Hinweis auf ein mögliches Problem beim Positionieren des Lese/Schreibkopfes.
  • Raw Read Error Rate: Nicht korrigierbare Fehler beim Lesevorgang. Möglicher Hinweis auf ein Problem der Plattenoberfläche(n).
  • Scan Error Rate: Nicht korrigierbare Fehler beim Überprüfen der Festplattenoberfläche. Der RAW-Wert <> Null verzehnfacht die Ausfallwahrscheinlichkeit.
  • Througput Performance: Allgemeiner Wert für den Datendurchsatz. Ein niedriger Wert deuten auf ein Problem hin.
  • Spin Up Time: Mittlere Startzeit des Plattenmotors. Ein schlechter Werte könnte auf Lagerprobleme vom Motor oder den Platten hinweisen.
  • Reallocated Sector Count: Zählt wieviele Reservesektoren die Festplatte bereits verwendet hat. Der RAW-Wert ungleich Null verfünffacht die Ausfallwahrscheinlichkeit.
  • Drive Temperature: Die aktuelle (leider meist sehr ungenaue) Temperatur des Laufwerks. Zusätzlich wird der Maximal- und Minimalwert abgespeichert. Die Ausfallswahrscheinlichkeit steigt ab einer Temperatur von 55° Celsius an. Einige Laufwerke zeigen teilweise Temperaturen unter der Umgebungstemperatur an. Eine externe Temperaturmessung ist zu bevorzugen.
  • UltraDMA CRC Error Rate: Anzahl der CRC Prüfsummenfehler bei der Datenübertragung. Kann auch auf defekte Kabel, einem Treiberkonflikt oder auf Übertaktungsprobleme hinweisen.
  • Seek Time Performance: Allgemeiner Wert, der die Leistung der Leseköpfe angibt. Niedrige Werte können Anzeichen eines mechanischen Problems sein.
  • Spin Retry Count: Der Zähler welcher protokolliert wie oft der Motor anlaufen musste, damit die Platte ihre betriebstypische Umdrehungszahl erreicht.
  • Recalibration Retries: Die Anzahl der Neukallibrationen des Schreib/Lesekopfes. Hinweis auf eine mechanische Fehlfunktion.
  • Reallocation Events Count: Protokolliert jeden Versuch Sektoren zu verschieben.
  • Current Pending Sector Count: Gibt die Anzahl der instabilen Sektoren an, die auf eine Verschiebung warten.
  • Uncorrectable Sector Count: Die Anzahl der fehlerhaften Sektoren, die nicht automatisch repariert werden konnte.
  • Write Error Rate: Die Anzahl der Schreibfehler die aufgetreten sind.
  • Disk Shift: Gibt an, ob sich eine Unwucht der Platten gebildet hat.
  • Soft Read Error Rate: Die Anzahl der Daten, die vom Betriebssystem fehlerhaft eingestuft wurde.
  • G-Sense Error Rate: Der Schock-Sensor, misst die heftigen Erschütterungen oder Vibrationen im Betrieb. Zu starke Erschütterungen können ein mechanisches Berühren des Lese/Schreibkopfes auf die Platten auslösen. Ein Ausfall der Festplatte wäre die Folge.
  • Load Friction: Ein interner Wert, wie hoch der Reibungswiderstand beim Bewegen des Lese/Schreibkopfes ist.
  • Torque Amplification Count: Die Anzahl der Neuanpassungen des Drehmoments vom Plattenmotor.
  • Rein statistische Werte, die nicht direkt den Gesundheitszustandes der Festplatte wiedergeben:
  • Loaded Hours: Gibt an, wie lange die Platte unter Volllast stand.
  • Start/Stop Count: Die Anzahl der Start/Stop-Vorgänge des Laufwerks.
  • Power On Hours Count: Zählt die Betriebsstunden des Laufwerks.
  • Load/Unload Cycle Count: Die Anzahl der Parkvorgänge der Schreib/Leseeinheit. Bei längeren Pausen parkt der Lese/Schreibkopf außerhalb der Plattenreichweite um bei Erschütterungen keinen Kontakt mit der Plattenoberfläche zu haben.
  • Read Channel Margin: Gibt an, wie viel der Bandbreite bei Lesevorgängen im Durchschnitt genutzt wird.
  • Device Power Cycle Count: Die Statistik, wie oft das Laufwerk ein- und ausgeschaltet worden ist.
  • Power-Off Retract Cycle:Protokolliert, wie oft die Festplatte abgeschaltet wurde.
  • Load/Unload Retry Count:Protokolliert wie oft der Schreib/Lesekopf die Position geändert hat.
  • Load-in Time: Protokolliert die Zeit wie lange der Lese/Schreibkopf nicht in der Parkzone geparkt war.
  • GMR Head Amplitude: Der Wert über den zurückgelegten Weg des Schreib/Lesekopfes während einer Bewegung.

Das QNAP NAS meldet bei S.M.A.R.T.-Tests die Überschreitungen der (von den Festplattenherstellern) definierten Schwellenwerte (=thresholds) und gibt entsprechende Warnmeldungen aus.

Genaue Angaben zu einzelnen S.M.A.R.T. Werten und den für jedes Festplattenmodell individuellen Schwellenwerten liefern die Festplattenhersteller.

Weitere Details zu den Testmöglichkeiten der Festplatten im QNAP NAS findet man u.a. auch hier Firmware QTS 4.2.x: http://docs.qnap.com/nas/4.2/SMB/de/index.html?disks.htm


HDD-Leistungstest einmalig durchführen, regelmässigen Test einrichten:

Ab QTS 4.3 bietet die QTS-App "Storage&Snapshots" (deutsches QTS: "Speicher & Snapshots") zahlreiche weitere HDD-Test- und Analysefunktionen.
Klicken Sie im "Storage&Snapshots" Fenster rechts oben im Eck auf das Zahnrad um regelmässige Tests einzurichten, oder nutzen Sie im Bereich "Disks/VJBOD" (deutsches QTS: "Datenträger/VJBOD) den Knopf "Performance test" (deutsches QTS: "Leistungstest") für IOPS oder Lesetests der Festplatten.

Folgende Hinweise:

  1. Ein RAID mit schlechter Performance wird womöglich durch die schlechte Performance nur einer einzigen Festplatte verursacht. Der Leistungstest hilft beim Finden der HDD mit schlechten Lese- oder IOPS Werten. 
    (auf dem QNAP CLI steht ihnen zur Ermittlung einer nicht performanten Festplatte ebenfalls ein nützliches Tool zur Verfügung: "iostat -x 1" während dem Kopiervorgang großer Datei eingeben und Sie erkennen eine Festplatte mit Performance Problemen.)
  2. Unbedingt vor einer geplanten System-Migration oder einer RAID-Migration einen physikalischen Oberflächentest durchführen.
  3. Der physikalische Oberflächentest kann bis zu 20% der NAS Gesamtperformance beanspruchen!

 

Tipp:

Einige Festplattenmodelle der Seagate IronWolf Pro Serie bieten neben SMART deutlich erweiterte Analyse Funktionen bzw. das sogenannte Health Management "IHM" an. Details zur Nutzung innerhalb von QNAP hier: https://www.qnap.com/solution/ihm/de-de/ 

 

(42 vote(s))
Helpful
Not helpful

Comments (0)