Neulich ist in meinem FreeNAS basierten Storage eine HDD ausgefallen. Ich habe mir eine baugleiche bestellt und die Seriennummer der kaputten HDD notiert. So konnte ich die Kiste runterfahren und die korrekte HDD ausbauen und durch das Ersatzlaufwerk ersetzen.

[yellow_box]Den Vorgang des Ersetzens in der GUI habe ich in einer VM nachgestellt, daher passen die Poolgrößen nicht zu den Ausgaben im späteren Verlauf des Blogartikels[/yellow_box]

Hierzu oben in der Navigatin auf Speicher (Storage) klicken, den als DEGRADED markierten pool auswählen und unten auf Laufwerksstatus klicken.

drive_state

Nun die fehlende, defekte HDD markieren und unten auf ersetzen klicken.

replace_drive

Jetzt kann man in der Shell oder auf der Konsole zpool status ausführen, um den Resilver-Fortschritt des ZFS Pools zu beobachten.

resilvering

Nachdem der Resilver-Vorgang nun 17 Stunden und 6 Minuten gelaufen war, und die HDD LED nicht mehr blinkte, machte ich mir nicht weiter Gedanken und fuhr kurz darauf guten Gewissens zur OHM2013, weil mir auch die GUI durch den grünen Knopp zu verstehen gab, dass wieder alles in Ordnung sei. Heute habe ich zufällig mal auf der Konsole des Servers geguckt und war ganz erstaunt, dass zpool status den ZFS Pool noch immer als DEGRADED ausweist:

# zpool status
 pool: Storage
 state: DEGRADED
 scan: resilvered 1.20T in 17h6m with 0 errors on Fri Jul 19 15:44:20 2013
config:
NAME STATE READ WRITE CKSUM
 Storage DEGRADED 0 0 0
 raidz2-0 DEGRADED 0 0 0
 gptid/3ab4da16-9385-11e0-b811-f46d04d67ba4 ONLINE 0 0 0
 replacing-1 DEGRADED 0 0 0
 7664928453203112043 OFFLINE 0 0 0 was /dev/dsk/gptid/3b6b82d5-9385-11e0-b811-f46d04d67ba4
 gptid/e117522c-efe9-11e2-a57d-001b212cbacc ONLINE 0 0 0
 gptid/3c208d25-9385-11e0-b811-f46d04d67ba4 ONLINE 0 0 0
 gptid/3cd05bf5-9385-11e0-b811-f46d04d67ba4 ONLINE 0 0 0
 gptid/3d971064-9385-11e0-b811-f46d04d67ba4 ONLINE 0 0 0
 gptid/3e3f4dbb-9385-11e0-b811-f46d04d67ba4 ONLINE 0 0 0
errors: No known data errors

Was sagt uns nun diese Meldung? Erst einmal wird bescheinigt, dass der Resilver-Vorgang erfolgreich abgeschlossen wurde, und es gibt keine bekannten Datenfehler, dennoch ist der Pool DEGRADED. Aber es sind alle 6 HDDs mit dem Hinweis ONLINE gelistet. Hintergrund ist der, dass noch immer eine Referenz auf die entfernte HDD vorhanden ist – auch wenn sonst alles OK ist.

Nach einem erfolgreichen HDD-Tausch muss man also die Referenz auf die HDD noch aus dem Pool detatchen:

# zpool detach Storage 7664928453203112043

Jetzt ist wirklich wieder alles gut