Wie man den Zustand der SSD/HDD unter Linux überprüft

Wenn du ein Systemadministrator bist und für die Verwaltung von Linux Systemen im Datacenter verantwortlich bist. Dann ist es empfehlenswert, den Zustand der SSD und HDD Laufwerke regelmäßig zu überprüfen. Es wird dir helfen, ausgefallene Laufwerke zu identifizieren und sie können ersetzt werden, bevor ein Datenverlust auftritt. S.M.A.R.T. ist ein Tool, mit dem du den Gesundheitszustand von SSD und HDD überwachen kannst. Es erlaubt dir auch, on-demand Tests auf dem Laufwerk durchzuführen.

In diesem Beitrag zeigen wir dir, wie du den Zustand von SSD und HDD unter Linux überprüfen kannst.

Voraussetzungen

  • Ein Server oder Desktop, auf dem das Betriebssystem Linux läuft.
  • Ein Root-Passwort ist auf dem Server konfiguriert.

Smartctl installieren

Standardmäßig ist Smartctl im Standard-Repository aller großen Linux-Distributionen enthalten.

Für Debian und Ubuntu installierst du Smartctl mit dem folgenden Befehl:

apt-get install smartmontools -y

Für die Distributionen RHEL, CentOS und Fedora installierst du Smartctl mit dem folgenden Kommando:

dnf install smartmontools

Nachdem du Smartctl installiert hast, starte den Smartctl-Dienst mit dem folgenden Befehl:

systemctl start smartd

Du kannst den Status des Smartd mit dem folgenden Befehl überprüfen:

systemctl status smartd

Du solltest die folgende Ausgabe erhalten:

? smartmontools.service - Self Monitoring and Reporting Technology (SMART) Daemon
     Loaded: loaded (/lib/systemd/system/smartmontools.service; enabled; vendor preset: enabled)
     Active: active (running) since Fri 2021-07-02 08:58:33 UTC; 11s ago
       Docs: man:smartd(8)
             man:smartd.conf(5)
   Main PID: 1042 (smartd)
     Status: "Next check of 0 devices will start at 09:28:33"
      Tasks: 1 (limit: 2353)
     Memory: 1.2M
     CGroup: /system.slice/smartmontools.service
             ??1042 /usr/sbin/smartd -n

Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, opened
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, [QEMU     QEMU HARDDISK    2.5+], 53.6 GB
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sda, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Try 'smartctl -s on /dev/sda' to turn on SMART features
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, opened
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, [AN       Volume           2.5+], S/N: sdb, 53.6 GB
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Device: /dev/sdb, IE (SMART) not enabled, skip device
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Try 'smartctl -s on /dev/sdb' to turn on SMART features
Jul 02 08:58:33 ubuntu2004 smartd[1042]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 0 NVMe devices
Jul 02 08:58:33 ubuntu2004 systemd[1]: Started Self Monitoring and Reporting Technology (SMART) Daemon.

Test Health of SSD/HDD

Nachdem du Smartctl installiert hast, musst du die SMART-Funktionen auf deiner Festplatte einschalten.

Das kannst du mit folgendem Befehl tun:

smartctl -s on /dev/sda

Das erste, was du tun musst, ist, Informationen über die SSD oder HDD zu erhalten.

Dies kannst du mit dem folgenden Befehl tun:

smartctl -i /dev/sda

Damit erhältst du die detaillierten Informationen deiner Festplatte.

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD5000LPVX-75V0TT0
Serial Number:    WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jul  2 14:39:33 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Wenn du einen kurzen Test des Laufwerks durchführen möchtest, führe den folgenden Befehl aus:

smartctl -t short -a /dev/sda

Du solltest die folgende Ausgabe erhalten:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD5000LPVX-75V0TT0
Serial Number:    WXV1EC4KN2N7
LU WWN Device Id: 5 0014ee 65af65611
Firmware Version: 01.01A01
User Capacity:    500,107,862,016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Jul  2 14:40:23 2021 IST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		( 9360) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.

Der Kurztest wird die elektrischen Eigenschaften, die mechanischen Eigenschaften und das Lesen/Verifizieren testen.

Um das Ergebnis des Selbsttests zu finden und zu drucken, führe den folgenden Befehl aus:

smartctl -l selftest /dev/sda

Du solltest die folgende Ausgabe erhalten:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      7609         -
# 2  Short offline       Interrupted (host reset)      90%      6972         -
# 3  Short offline       Aborted by host               70%      6972         -
# 4  Short offline       Interrupted (host reset)      70%         2         -

Um einen langen Test auszuführen, verwende den folgenden Befehl:

smartctl -t long -a /dev/sda

Du solltest die folgende Ausgabe erhalten:

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 107 minutes for test to complete.
Test will complete after Fri Jul  2 16:30:41 2021

Use smartctl -X to abort test.

Der lange Test wird alles testen, was im kurzen Test enthalten ist.

Du kannst den Test stoppen, indem du den folgenden Befehl ausführst:

smartctl -X /dev/sda

Du solltest die folgende Ausgabe sehen:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Abort SMART off-line mode self-test routine".
Self-testing aborted!

Um den allgemeinen Zustand des Laufwerks zu testen, führe den folgenden Befehl aus:

smartctl -d ata -H /dev/sda

Du solltest die folgende Ausgabe erhalten:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Um die geschätzte Zeit für die Durchführung des Tests zu prüfen, führe den folgenden Befehl aus:

smartctl -c /dev/sda

Du solltest die folgende Ausgabe erhalten:

smartctl 6.2 2013-07-26 r3841 [x86_64-linux-4.4.0-148-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (  25)	The self-test routine was aborted by
					the host.
Total time to complete Offline 
data collection: 		( 9360) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 107) minutes.
Conveyance self-test routine
recommended polling time: 	 (   5) minutes.
SCT capabilities: 	       (0x7035)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

Um nur das Fehlerprotokoll zu drucken, führe den folgenden Befehl aus:

smartctl -l error /dev/sda

Um Hilfeinformationen zu erhalten, führe den folgenden Befehl aus:

smartctl --help

Links

Fazit

In der obigen Anleitung hast du gelernt, wie du das S.M.A.R.T Tool installierst und benutzt, um den Zustand deiner SSH und HDD Laufwerke zu überprüfen. Ich hoffe, dass dir das sehr helfen wird. Für weitere Informationen, lies die smartctl man page.

Das könnte dich auch interessieren …