[Toulibre] Surveiller l'état des disques durs

Aymeric mulx at aplu.fr
Jeu 18 Juin 00:01:51 CEST 2015



On 17/06/2015 13:10, Jérôme wrote:
> Mais alors je ne m'explique pas les plantages systèmes et les messages
> d'erreur que j'aurais du photographier avant d'éteindre l'ordi.
Ça peut être un problème câble sata :|

> Le 2015-06-17 01:36, Aymeric a écrit :
>
>> Quelques détail avec les valeurs « raw » :
>>
>> 12) Nombre de « Load cycle Count » tu es à 2323 sur 300000
>> constructeurs, valeur très faible donc aucun risque à ce niveau là. Ça
>> correspond d'ailleurs au nombre d’allumage, j'en conclu donc que soit tu
>> fais des accès disques en permanence lorsque le disque est allumé, soit
>> Linux n'effectue jamais de « park head » (c'est souvent le cas sur les
>> PC fixe, sur les PC portable en général il y a un paquet pour reposer
>> les têtes).
> C'est un PC fixe, donc ça se tient. Sur les portables, je suppose que
> c'est pour empêcher que ça casse en cas de chute. En contrepartie, ça
> doit occasionner une usure plus avancée. Y a-t-il un intérêt en économie
> d'énergie (y compris sur PC fixe) ?

Mettre les têtes repos ne fait pas faire d'économie d’énergie mais ça
permet aussi de couper la rotation du disque (et ça par contre ça
économise de l’énergie).
Pour les PC portables surtout utilise lorsqu'il bouge pour éviter
d'avoir un atterrissage des têtes sur le disques.

>
>> -> Ce n'est pas spécifié dans la doc mais tu dois avoir environ
>> 2000/3000 secteurs de réserve. Ce que tu peux faire c'est faire une
>> réecriture complète sur le disque et vérifier que cette valeur n'a pas
>> changé.
>>     Si cette valeur ou la valeur de 197 augmente ça signifie que :
>>          1) Le test extented est foireux ... (bug du firmware?)
>>          2) La surface est défectueuse  ou qu'il n'y a jamais eu d'init
>> de la smart
> Une fois remplacé mon disque, je pourrai faire une réécriture complète.
>
> Je fais quoi ? Un truc à base de dd et de /dev/null ou tu penses à autre
> chose ?

Soit formatage de bas niveau par les outils constructeurs mais un dd
fait aussi l'affaire.
>> Selon les cartes, tu as un truc via smart, sinon c'est outil constructeur...
> Dans le cas du serveur au boulot, c'est outil constructeur DELL. J'ai
> pas trop envie d'utiliser ça. Et peut-être une alternative, j'ai pas
> creusé, avec le BIOS balèze de la machine, qui est capable d'envoyer
> certaines alertes par ethernet.

Ça serait effectivement le mieux de recevoir un mail quand un disque est
mort.
>
>> Ne pas oublier lorsqu'on fait du RAID, deux disques du mêmes fabriquant,
>> même modèle, même série ont une forte probabilité de tomber en panne en
>> même temps... (ou suffisamment proche pour ne pas laisser le temps à
>> raid de se réparer...)
> Oui, et on a bien sûr mis les 4 disques neufs identiques achetés avec la
> machine... Dans la pratique, le serveur héberge un hôte minimaliste qui
> contient des VMs dont on fera des sauvegardes, donc si on perd le
> serveur, on en remonte un vite fait et on relance les VM. C'est pas
> ultra-critique.
>
> Et bien sûr, chez moi, j'ai commandé deux disques identiques. J'ai pris
> deux Western Digital Red. J'ai hésité à prendre un Red et un Blue pour
> éviter que tout casse en même temps mais je l'ai pas fait...

L'essentiel c'est de se poser les bonnes questions et de prendre les
décisions en évaluant les risques.
>
>> Enfin.. si une météorite explose tout le sud-ouest, je ne suis pas sûr
>> que tes backups soit le premier de tes soucis. ^^
> Ben j'aurai peut-être perdu toute ma famille et mes guitares, mais
> j'aurai encore les photos...
Sauf si tu rejoints aussi ta famille :-P
>
>>> C'est une question annexe, mais tant que j'y suis, je veux bien
>>> confirmation qu'en RAID 1, je peux démonter un disque et le lire
>>> ailleurs et je peux utiliser un live-cd pour lire son contenu, alors
>>> qu'en RAID 5, j'ai besoin d'avoir le système lancé avec mdadm et le
>>> RAID complet (en tout cas deux disques) pour que ça marche. Et si je
>>> démonte deux disques, j'ai pas un accès trivial à la donnée. Si j'ai
>>> bien compris, alors autant partir sur du RAID 1. Le mieux est l'ennemi
>>> du bien.
>> Soft raid linux :
>> -> metadata 0.9 ou 1.0 tu peux relire sans mdadm
>> -> metadata 1.1 ou 1.2 il faut mdadm pour relire le raid.
>> Après si c'est raid1 tu peux toujours activer l'array en degraded avec
>> un seul disque sur les deux..
> Ah.
>
> Sur Jessie, c'est mdadm 3.3.2 donc le format 1.2
> https://raid.wiki.kernel.org/index.php/RAID_superblock_formats
>
> Je suis pas sûr d'avoir le choix à l'installation. Et il doit y avoir de
> bonnes raisons d'utiliser une version récente de metadata. Donc ça sera
> 1.2.
les 1.x sont globalement équivalente, seul l'emplacement où sont stocké
ces métadata change.
>
> Ma problématique, c'est juste que si je casse la carte-mère ou si mon
> système déconne complètement, j'aime l'idée de pouvoir récupérer
> facilement mes données en branchant mon disque sur n'importe quelle
> machine.
>
> Si je comprends bien, il me faudra un machine avec mdadm. Il faudrait de
> toute façon une machine linux ou un live-CD pour lire la partition ext4,
> donc ça ne rajoute pas vraiment une limitation. Et on a un deuxième
> poste en Debian à la maison.
C'est ça, n'importe quel machine avec un Linux et mdadm fera l'affaire
(+ lvm si tu utilise lvm sur le raid).

> Si la CM est cuite, je peux mettre les deux disques dans une autre
> machine et ça va marcher, non ?
Oui.
> Et si le système est cassé, en mettant les deux disques dans une autre
> machine (avec deux ports SATA) ou bien en bootant sur un live-CD, puis
> en utilisant mdadm, je devrais retrouver mes petits.
Oui.
> Ce que je souhaite, c'est mettre tout mon système sur le RAID 1
> (éventuellement en plusieurs partitions avec LVM), pas juste une
> partition de données.
>
> Ce que j'ai du mal à comprendre, c'est comment mdadm peut être
> responsable du RAID tout en étant lancé par le système qui se trouve sur
> le RAID.
>
> Au démarrage, il faut bien assembler le RAID pour pouvoir lancer le
> système qui va exécuter mdadm ? Ou bien l'installer met en place une
> instance de mdadm indépendante du système, mais alors il doit bien y
> avoir une partie du disque qui n'est pas gérée par mdadm, par exemple le
> secteur de boot. Ça m'échappe.
>
> L'aide de Debian apporte des éléments de réponse
> (https://www.debian.org/releases/stable/amd64/ch06s03#mdcfg) en disant
> que la partition /boot doit être séparée... mais qu'elle peut être en
> RAID 1 aussi...
>
Grub2 supporte le RAID1, il n'activera pas tout les disques mais est
capable de démarrer même si la totalité du système est sur du raid.

A titre d'info chez moi j'ai le système sur une partition lvm qui est
sur du raid1 (2+2 disques) .. et grub est capable d'aller chercher le
système, pas de partition /boot dédié :-)

-- 
Aymeric



Plus d'informations sur la liste de diffusion Toulouse-ll