[Toulibre] Erreur au démarrage / RAID1 LVM

Jérôme jerome at jolimont.fr
Jeu 21 Jan 09:50:09 CET 2016


Bonjour.

Merci pour ta réponse.

>> error: disk `lvmid/Yxknle-OEes-...` not found.
>> Entering rescue mode...
>> grub rescue> ls
>> (hd0) (hdO,msdos1), (hd1) (hd1,msdos1) (hd2) (hd2,msdos2) (md/0)
>>
> 
> Parmis ces disques, il y a donc ceux de ton RAID1 et ton disque de 500Go ?

Je suppose que oui. En tout cas ça a l'air de coller.

> On parle bien d'un RAID *logiciel*, avec mdadm ?

Oui.
 
>> Ma config est évoquée sur cette liste dans le (long) fil "Surveiller
>> l'état des disques durs..." (15 juin 2015). C'est deux disques 1 To en
>> RAID 1 avec une LVM comprenant partition "/", partition "/home" séparée,
>> pas de partition "/boot". L'installation s'est faite assez naturellement
>> avec l'installeur Debian, à part une histoire de Grub qui n'était pas
>> dupliqué sur les MBR de chaque disque et j'ai du faire une manip à la
>> main (même problème que décrit ici:
>>
> http://unix.stackexchange.com/questions/25513/is-grub-installed-to-all-the-mbr-of-a-raid-array-by-default-by-the-debian-instal
> ).
>>
> 
> De ce que je comprends, tu n'as pas créé de partition avant de créer le
> RAID, c'est le disque entier qui est dans la grappe ?

Oui, de mémoire mais à peu près certain. J'ai fait un seul RAID sur tout
le volume des disques, là-dessus j'ai fait un LVM, puis mon
partitionnement "/" et "/home".

> As-tu une sauvegarde de la conf LVM pour recréer les volumes 'à la main' ?

Non. Je ne sais pas à quoi ça pourrait ressembler ou comment la faire.
 
>> J'ai tenté de démarrer sur Live-CD Knoppix et Ubuntu, et seul mon vieux
>> disque de sauvegarde apparaît comme lecteur. Rien sur les volumes en
>> RAID.
>>
> 
> Ça me semble normal, mdadm ne doit pas être installé par défaut.

Oui. En tout cas sur le disque Ubuntu, c'est sûr que non. Knoppix j'ai
pas vérifié.

Hier avec Ubuntu, j'ai installé mdadm, mais je savais pas trop quoi
faire avec.

Est-ce que si je démarre avec un CD qui contient mdadm par défaut, ça
pourrait fonctionner tout seul ?

J'ai vu hier un lien vers un Live-CD Debian Grub Rescue, qqchose comme
grmf.org. Je ne retrouve plus le nom exact. Le code est hébergé sur
GitHub. Ça aiderait, un truc comme ça ?

> Est-ce qu'on moins tes disques sont mentionnés dans le dmesg ?

Il faut que je regarde, je sais pas.

> Peux-tu vérifier si un disque a subit une défaillance avec smartctl
> (pending allocation,...) ?

J'avais pris la peine de configurer smartctl pour m'envoyer des alertes
par courriel en cas de pépin, donc je pense que non. En plus, les
disques ont à peu près 6 mois. Je doute qu'ils soient tombés en panne en
même temps (oui, c'est les mêmes modèles (WD Red), mais quand-même).


Je penche plutôt pour une mise à jour malheureuse (mais je vois pas
quoi) ou une mauvaise manip (j'ai joué avec dd en root pour tenter de
formater une clé USB, je suis à peu près certain de ne pas avoir touché
aux autres /dev, mais comme je vois pas d'explication, j'en viens à
douter...).

> Si tu n'arrive pas à réassembler l'array, il faudra à terme définir le
> disque 'maître' pour récupérer les données et reconstruire le RAID1. Celui
> qui est en meilleur santé est probablement le meilleur candidat.

Je comprends pas. Pour moi, l'intérêt du RAID, c'est précisément que si
un disque tombe, le système fonctionne encore. Or, quand je démarre sur
un disque seul, quel que soit le disque, j'ai cette erreur.

Le fait que l'erreur ait changé lorsque j'ai débranché un disque est
peut-être un effet du RAID. La première erreur faisait peur (volume LVM
perdu). Maintenant, ça se présente comme une erreur de type problème de
Grub qui se résoudrait peut-être classiquement avec un Live-CD dès lors
que le RAID est assemblé et les partitions accessibles.

Et comme je sais pas trop jouer avec mdadm, un Live-CD qui ferait tout
ça automatiquement, ça m'aiderait bien.

>> J'ai tenté de débrancher les disques un par un. Avec le premier, rien de
>> différent. En débranchant l'autre, ça change d'erreur, et maintenant,
>> j'ai toujours cette nouvelle erreur même en rebranchant tout.
>>
>> error: file `/boot/grub/i386-pc/normal.mod` not found.
>>
>> Avez-vous une idée de ce que je peux faire ?
>>
> 
> Attention au boot dégradé. Comme dit plus haut, tu risque de ne plus
> pouvoir réassembler le RAID ensuite.
> Si tu fais ce genre de test, il faut absolument booter avec le RAID en
> read-only.

Ah bon. Je ne sais pas comment on fait.
 
>> J'ai cherché et je continuerai à chercher, mais certains messages
>> d'erreurs peuvent avoir des causes très différentes, et parmi les
>> solutions que je vois, il y a l'utilisation d'un Live-CD pour copier des
>> fichiers de Grub, mais je n'ai pas accès au système de fichier.
>> Peut-être dois-je utiliser mdadm à la main pour assembler le RAID ?...
 
> Pour moi, ce serait la meilleure solution.
> Depuis un live-cd, installer mdadm et tenter d'assembler la grappe.
> Dans l'idéal il te faut le fichier de conf de la grappe, qui est dans
> /etc/mdadm et donner l'identifiant de la grappe en ligne de commande.
> Sinon il te faut assembler avec 1 seul disque et l'autre le forcer
> 'missing'.
> Mais toujours laisser en read-only, car si tu commence à recréer une
> nouvelle grappe, tu risque de tout perdre.

Ça fait beaucoup de manips que je ne sais pas faire.

En gros, après l'install de mdadm, je bloque. Je sais lire les docs et
tout, mais ça commence à toucher à des concepts que je connais trop mal.

Comment avoir accès à /etc/mdadm alors qu'il est sur les disques que je
n'arrive pas à lire ? Il aurait fallu que je la sauvegarde, mais lors de
mes recherches pour la mise en place du RAID, je n'ai pas vu
d'instruction pour faire ça, sinon je l'aurais fait.

Y a-t-il un Live-CD magique qui me mâcherait le boulot ?

A vrai dire, quand ma machine démarre d'habitude, elle s'en sort, donc
c'est bien que c'est possible. (Et je demande comment elle lit le
mdadm.conf avant d'avoir assemblé les disques.)

> La présence de LVM ne va pas faciliter la récupération des données.
> Si déjà la grappe se monte manuellement sans erreur, ça vient probablement
> de Grub (à réinstaller sur les mbr, refaire la config dans /boot/grub... ).
> 
> Conseil: Avant de vouloir tenter une réparation de Grub, commence par
> sauvegarder tout ce qui ne l'a pas été dès que tu as accès aux données.
> En cas de problème sérieux, un dump avec dd du disque sain t'assurera de ne
> rien perdre.

Oui, si je parviens à accéder aux données, je récupère ce qui me manque.

C'est bien la seule recommandation saine que je sois capable
d'appliquer...
 
> Enfin, pour un RAID1, modifier le flag du disque (je ne sais pas si c'est
> possible quand tout le disque est utilisé sans partition) ou supprimer les
> metadata du raid, pour qu'il ne soit plus détecté en tant que raid par le
> noyau, devrait te permettre d'y accéder comme un disque 'classique'.
> Mais par contre, il est quasi certain que tu ne pourras pas ensuite le
> réintégrer au raid sans perdre les données (la taille ou position des
> metadata peuvent changer).
> Ce serait donc l'autre disque qui servirait de 'maitre' dans la
> (re)création de la grappe.
> 
> Bon courage avec ce pb épineux.

Merci...

-- 
Jérôme




Plus d'informations sur la liste de diffusion Toulouse-ll