[Toulibre] Surveiller l'état des disques durs

Aymeric mulx at aplu.fr
Lun 15 Juin 19:30:58 CEST 2015


Salut,

On 15/06/2015 10:59, Jérôme wrote:
> -> Est-ce possible que le disque soit en train de mourir mais que
> smartmontools ne voit rien ?

Oui, S.M.A.R.T. n'est là que pour remonter les infos du disque.
Dans la plupart des cas ça remonte suffisamment d'info qui permette de
prévoir mais ça n'empêchera pas les cas où le disque est mort que
S.M.A.R.T. n'a rien vu venir.

Il faut aussi s'avoir lire les états S.M.A.R.T....
Tu peux poster le logs que tu as avec ?
smartctl -a /dev/sda
(si sda est bien ton disque douteux).

Tu as peut être des secteurs défectueux en pending, si il y a de la
place en réserve il faut récrire dessus pour que S.M.A.R.T. fasse la
ré-allocation (et si il y a des secteurs défectueux, selon historique du
disque, je te recommande de faire un effacement complet destructif)

Tu peux aussi lancer l'execution d'un test de surface via S.M.A.R.T., je
te recommande de passer le livecd UltimateBootCD et d'executer le check
via l'outil constructeur (ou celui de seagate si il n'y a pas).

> -> Comment alors surveiller ses disques ? Notamment, là, sur mon PC
> perso, je vois des erreurs qui m'alertent car elles affectent le
> système, mais sur un RAID, elles risquent d'être masquées par la
> redondance, et donc je ne verrai les problèmes que lorsque la redondance
> ne suffira plus. Je n'aurai alors que repoussé le problème.

Le RAID par mdadm (je ne connais pas les capacités RAID de lvm) execute
un check régulièrement (en tout cas sur debian).
Le test est lancé par crontab une fois par mois via (source
/etc/cron.d/mdadm)
/usr/share/mdadm/checkarray --all
Le comportement de MDADM si est disque n'est pas conforme c'est de le
retirer du groupe, ce qui génère une alerte visible dans /proc/mdadm ou
via mdadm. Comme dit ailleurs tu peux catcher ces alertes pour recevoir
un mail.

Du RAID avec btrfs il faut exécuter un scrub régulièrement, je ne sais
pas si c'est passer dans cron ou pas.

Les autres FS qui font du RAID (ZFS), je ne sais pas.
>
> -> Est-il possible de dialoguer avec un RAID logiciel pour avoir des
> alertes liées à la couche RAID, autres que celles de smartmontools qui
> sont au niveau disque ?

Si tu as RAID logiciel tu peux toujours interroger tes disques dur
directement par smartctl.

>
> J'ai laissé les vérifs par défaut au démarrage tous les N montages, ou
> après indicent. Peut-être que cette vérif est une alternative à
> smartmontools, en tout cas pour une machine perso qui redémarre
> régulièrement.

Ça vérifie la cohérence du FS, objectivement il y a peu de change que ça
remonte une erreur mais ça ne coûte que quelques minutes au démarrage
une fois tous les x jours.


Dans tous les cas, tu as des backups ? :-)


A+

Aymeric



Plus d'informations sur la liste de diffusion Toulouse-ll