Tutorial

Simpele vragen: Wat is SMART en wat doet het?

Velen van ons hebben een storing op de harde schijf ervaren; Sommigen van ons hebben zelfs geprobeerd meer te weten te komen over de betrouwbaarheid van harde schijven en hun diep verborgen voorspellingsfunctie die deel uitmaakt van een technologie die SMART wordt genoemd. Men zou kunnen beweren dat SMART niet zo betrouwbaar is als het niet in alle gevallen falen voorspelt. Dit feit is gedeeltelijk waar, maar de werkelijke innerlijke werking van dit zelfcontrolesysteem is niet zo eenvoudig. Laten we dus proberen deze onzekere situatie te verhelpen en onderzoeken hoe SMART echt werkt. Laten we beginnen:

SMART - Een beetje geschiedenis

SMART, soms geschreven als SMART (Self-Monitoring, Analysis and Reporting Technology) is een systeem dat de interne informatie van uw schijf controleert. Het werd ontwikkeld vanaf het jaar 1992 en is nu opgenomen in alle moderne IDE en Serial ATA harde schijven (HDD's). Natuurlijk is het een functie die ook aanwezig is in solid-state drives (SSD's).

De geschiedenis omvat een reeks namen zoals Predictive Failure Analysis of IntelliSafe en invoer van alle grote fabrikanten van harde schijven: IBM, Seagate, Quantum, Western Digital. Ten slotte is de documentatie voor het eerst in 2004 opgenomen in de Parallel ATA-standaard en ontving deze tot 2008 regelmatig herzieningen.

De creatie ervan was gebaseerd op de noodzaak om de status van een schijf te controleren en het zal vermoedelijk vertellen of de harde schijf op het punt staat om te sterven. Hoewel je misschien denkt dat SMART op magische wijze kan raden of de schijf gezond is, toont het feitelijk een reeks variabelen waarvan het aantal en type variëren van schijf tot schijf, die indicatoren zijn voor de betrouwbaarheid ervan. Voor een volledige lijst met kenmerken, zoals er ongeveer 50 zijn (bijvoorbeeld onbewerkte leesfouten, starttijd, gerapporteerde niet-corrigeerbare fouten, inschakeltijd, aantal laadcycli, enz.), Kan hier worden geraadpleegd.

Afgezien van enkele singuliere pogingen (Google, Backblaze), zijn de meeste SMART-gegevens niet gedocumenteerd. Het systeem biedt veel interne gegevens, maar er zijn veel inconsistenties in de statistieken, vooral omdat veel fabrikanten van de harde schijf verschillende definities en metingen gebruiken. Sommige fabrikanten slaan bijvoorbeeld inschakeltijden op als uren, terwijl anderen in minuten of seconden meten. Ook probeert geen van hen uit te leggen welke van de verschillende attributen of variabelen onze aandacht waard zijn, waardoor we verdrinken in de gegevens.

Voordat we proberen te begrijpen welke van de attributen relevant is, moeten we eerst een onderscheid maken tussen de belangrijkste soorten fouten: voorspelbaar en niet-voorspelbaar. Het eerste type omvat de fouten die in de tijd verschijnen en die worden veroorzaakt door een defecte schijfmechaniek of schade aan het oppervlak van de schijf. Problemen worden na verloop van tijd erger en de schijf zal uiteindelijk uitvallen. Niet-voorspelbare fouten worden veroorzaakt door plotselinge gebeurtenissen, waarvan we bijvoorbeeld plotselinge stroompieken kunnen noemen.

OPMERKING: het is belangrijk om te weten dat SMART alleen u kan helpen voorspelbare fouten te detecteren.

Belangrijke SMART-attributen

De gezondheidsstatus van de harde schijf wordt voortdurend bewaakt door het gebruik van meerdere sensoren. De waarden worden gemeten met behulp van typische algoritmen en vervolgens worden de bijbehorende kenmerken aangepast op basis van de resultaten.

In elk monitoringprogramma dat u gebruikt, hebben alle SMART-kenmerken deze velden:

  • Identifier: de definitie van het attribuut. Het heeft meestal een standaard betekenis en het is gemarkeerd met een nummer tussen 1 en 250 (bijvoorbeeld 9 is Power-on Count). Alle hulpprogramma's voor het controleren en testen van schijven bieden echter de naam en een tekstuele beschrijving van het kenmerk.
  • Drempelwaarde: de minimumwaarde voor het kenmerk. Als deze waarde wordt bereikt, staat uw harde schijf op het punt te mislukken.
  • Waarde: huidige waarde van het attribuut. Het algoritme berekent dit nummer op basis van de onbewerkte gegevens. Een nieuwe harde schijf heeft een hoog aantal, het theoretische maximum (100, 200 of 253 afhankelijk van de fabrikant), dat zal tijdens de levensduur van de harde schijf afnemen.
  • Slechtst: de kleinste waarde van het attribuut dat ooit is geregistreerd.
  • Gegevens: onbewerkte meetwaarden geleverd door een sensor of een teller. Dit zijn de gegevens die worden gebruikt door het algoritme dat is ontworpen door de fabrikant van de HDD. De inhoud is afhankelijk van het attribuut en de maker van de harde schijf. Gewone gebruikers moeten deze overslaan.
  • Vlaggen: het doel van het attribuut. Dit wordt meestal ingesteld door de fabrikant en varieert daarom van schijf tot schijf. Elk van de attributen is ofwel kritisch en kan een aanstaande fout voorspellen (bijvoorbeeld het aantal toegewezen sectoren 5 opnieuw toegewezen) of statistisch zonder direct effect op de status (bijvoorbeeld ID 174 onverwacht aantal vermogensverlies).

OPMERKING: Onthoud altijd dat wanneer u de status van een SMART-kenmerk probeert te begrijpen, u de waarden van deze drie velden controleert: waarde, drempelwaarde en vlaggen. Onthoud ook dat kleinere waarden een aanwijzing zijn voor een afname van de betrouwbaarheid.

Schijftemperatuur is een zeer besproken parameter. Toch wordt aangenomen dat waarden boven 60 ° C de levensduur van een harde schijf verkorten en de kans op schade vergroten. We raden aan om een ​​ventilator te gebruiken om de temperatuur van uw harde schijven te verlagen en mogelijk hun levensduur te verlengen.

Zoals we hierboven vermeldden, zijn niet alle SMART-kenmerken van cruciaal belang voor het voorspellen van fouten. De twee bovengenoemde onderzoeken naar faalpercentages van harde schijven en andere bronnen zijn het erover eens dat een belangrijk hulpmiddel bij het identificeren van falende schijven ID 5-herverdeelde sectortellingen zijn. Herallocatie gebeurt wanneer de logica van de schijf een beschadigde sector opnieuw koppelt, als gevolg van terugkerende zachte of harde fouten, naar een nieuwe fysieke sector uit zijn reserveonderdelen. Dit kenmerk geeft het aantal keren weer dat een remapping is opgetreden en geeft een indicatie van de oppervlakteslijtage van de harde schijf.

Een ander bruikbaar kenmerk dat moet worden bewaakt, is ID 197 - Huidige sectorentoekenning in behandeling. Dit telt de "onstabiele" sectoren, dat wil zeggen de beschadigde met leesfouten die wachten op een herafbeelding, een soort "proeftijd" -systeem. SMART's algoritmen hebben gemengde gevoelens over dit specifieke kenmerk, omdat het soms niet overtuigend is, maar er wordt gesteld dat het een eerdere waarschuwing voor mogelijke problemen kan bieden.

De laatste van deze indicatoren die moeten worden gecontroleerd, is ID 187 - Gemelde niet-corrigeerbare fouten. Het is het aantal fouten dat niet kan worden hersteld en dat nuttig is omdat het voor alle fabrikanten dezelfde betekenis lijkt te hebben.

OPMERKING: Alle bovengenoemde SMART-kenmerken hebben een waarde die gemakkelijk te interpreteren is. Als ze een aantal van 1 of meer melden, is het heel goed mogelijk dat je schijf niet werkt, dus begin maar beter met back-ups te maken. Ondanks dat dit handige indicatoren zijn voor de betrouwbaarheid van drives, zijn ze niet onfeilbaar en moet je ze vergelijken met het advies van de door jou gekozen HDD-monitoringtool.

Conclusie

Dit was onze korte studie over de interne werking van SMART en zijn mogelijkheden om harde schijfstoringen te monitoren en te voorspellen. Het belangrijkste gezichtspunt dat u moet onthouden, is dat dit zelfcontrolesysteem u helpt de status van uw HDD te bekijken. Als u deze SMART-gegevens wilt gebruiken om te zien of uw eigen schijf problemen heeft, lees dan de artikelen die hieronder worden aanbevolen.