Serveur dédié injoignable - erreur de boot

Le
Vinc Teteve
--f46d0444ef31eeb022051f01616e
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Bonjour à tous,

Je commence par un petit historique de mes manip jusqu'aux problèmes
actuels :
J'ai un serveur dédié chez OVH sur lequel est installé Proxm=
ox 3.0, avec en
gros une VM par service (toutes sous Debian dans des CT OpenVZ).
La semaine dernière, j'ai fait une mise à jour de la VM DNS. En f=
in de
semaine, j'ai voulu ajouter un NDD sur cette VM. Impossible de m'y
connecter en SSH (de mémoire, le message était : pas de pty dispo=
nible). Je
me suis dit que les mises à jour ne devaient pas être terminÃ=
©e, et qu'elles
devaient attendre un retour de ma part. J'ai redémarré la VM via
l'interface Proxmox : VM up, mais impossible de m'y connecter en SSH
(network error : Connection timed out). N'étant pas en état de ch=
ercher une
solution intelligente, j'ai redémarré tout le serveur (sic). E=
t depuis,
impossible de me reconnecter sur l'hôte.
Là, intervention d'OVH :

"Cette opération a été achevée le 2015-09-04 03:10:46
Voici les détails de cette opération :
Boot sur interface diagnostique (rescue)
Date 2015-09-04 03:07:47, yoann P a fait Boot sur interface diagnostique
(rescue):
Voici le detail de l'intervention realisee:
Le serveur lance un memtest lors du boot sur disque.
Actions entreprises:
Redemarrage du serveur sur mode 'rescue' (Linux)
Resultat:
Boot OK. Systeme 'rescue' accessible.
Recommandations:
Configuration/erreur a corriger par le client"

J'ai effectué les tests via le manager en mode rescue : tous OK. Je l'=
ai
démarré en mode rescue, accès SSH OK. J'ai déplacé=
le répertoire
/etc/grub.d/20_memtest86+ pour éviter qu'il lance un memtest au boot, =
mais
toujours aucun accès SSH après reboot sur HD. Donc retour en mode=
rescue,
et histoire de cumuler, j'ai eu la merveilleuse idée de me dire : "Une=
mise
à jour du système va tout résoudre" Donc apt-get update &=
& apt-get
upgrade en chroot sur ma partition principale /dev/md1.
Et là, c'est le drame :
"Errors were encountered while processing:
bind9
pve-cluster
qemu-server
pve-manager
E: Sub-process /usr/bin/dpkg returned an error code (1)"
Donc bien évidemment, ça n'a rien résolu du tout !! Je me su=
is enfin dit
qu'il valait mieux aller se coucher que de continuer à tout casser
Donc au final, j'ai un serveur partiellement mis à jour en mode rescue=
, qui
à priori démarre en HD, mais impossible de s'y connecter. Dé=
jà, je voudrais
commencer par résoudre ce problème de boot. Mais à distance,=
je ne sais pas
où s'arrête la séquence de boot, dans quel état est le =
serveur
Et je vous avoue ne pas trop savoir quoi chercher et par où commencer.=
..

Si quelqu'un aurait une piste/idée, je suis preneur. De même, je =
n'ai pas
envie de faire un pavé encore plus gros qu'actuellement avec des infos
inutiles, mais n'hésitez pas si vous voulez plus d'infos techniques
Je vais même aller plus loin : si quelqu'un se sent l'âme de me f=
aire un
devis pour une prestation de sauvetage de serveur, je suis également
intéressé. Je ne veux absolument pas perdre les données sur =
le serveur

Bon w-e à tous.

--f46d0444ef31eeb022051f01616e
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

<div dir="ltr"><span style="font-size:12.8px">Bonjour à tous,</spa=
n><div style="font-size:12.8px"><br></div><div style="font-size:12.8px"=
>Je commence par un petit historique de mes manip jusqu&#39;aux problè=
mes actuels :</div><div style="font-size:12.8px">J&#39;ai un serveur dÃ=
©dié chez OVH sur lequel est installé Proxmox 3.0, avec en gros=
une VM par service (toutes sous Debian dans des CT OpenVZ).</div><div styl=
e="font-size:12.8px">La semaine dernière, j&#39;ai fait une mise Ã=
  jour de la VM DNS. En fin de semaine, j&#39;ai voulu ajouter un NDD sur=
cette VM. Impossible de m&#39;y connecter en SSH (de mémoire, le mess=
age était : pas de pty disponible). Je me suis dit que les mises Ã=
  jour ne devaient pas être terminée, et qu&#39;elles devaient =
attendre un retour de ma part. J&#39;ai redémarré la VM via l&#39=
;interface Proxmox : VM up, mais impossible de m&#39;y connecter en SSH (ne=
twork error : Connection timed out). N&#39;étant pas en état de c=
hercher une solution intelligente, j&#39;ai redémarré tout le ser=
veur (sic). Et depuis, impossible de me reconnecter sur l&#39;hôte.=
</div><div style="font-size:12.8px">Là, intervention d&#39;OVH :</di=
v><div style="font-size:12.8px"><div><br></div><div>&quot;Cette opér=
ation a été achevée le 2015-09-04 03:10:46</div><div>Voici l=
es détails de cette opération : <br></div><div>Boot sur inte=
rface diagnostique (rescue)</div><div>Date 2015-09-04 03:07:47, yoann P a f=
ait Boot sur interface diagnostique (rescue):</div><div> Voici le deta=
il de l&#39;intervention realisee:</div><div>Le serveur lance un memtest lo=
rs du boot sur disque.</div><div>Actions entreprises: <br></div><div>R=
edemarrage du serveur sur mode &#39;rescue&#39; (Linux)</div><div>Resultat:=
 <br></div><div>Boot OK. Systeme &#39;rescue&#39; accessible.</div><di=
v>Recommandations:<br></div><div>Configuration/erreur a corriger par le cli=
ent&quot;</div></div><div style="font-size:12.8px"><br></div><div style=
="font-size:12.8px">J&#39;ai effectué les tests via le manager en mo=
de rescue : tous OK. Je l&#39;ai démarré en mode rescue, accÃ=
¨s SSH OK. J&#39;ai déplacé le répertoire /etc/grub.d/20_m=
emtest86+ pour éviter qu&#39;il lance un memtest au boot, mais toujour=
s aucun accès SSH après reboot sur HD. Donc retour en mode rescue=
, et histoire de cumuler, j&#39;ai eu la merveilleuse idée de me dire =
: &quot;Une mise à jour du système va tout résoudre&quot;=
Donc apt-get update &amp;&amp; apt-get upgrade en chroot sur ma partition =
principale /dev/md1.</div><div style="font-size:12.8px">Et là, c&#39=
;est le drame :</div><div style="font-size:12.8px">&quot;Errors were enco=
untered while processing:</div><div style="font-size:12.8px">  bind9=
</div><div style="font-size:12.8px">  pve-cluster</div><div style==
"font-size:12.8px">  qemu-server</div><div style="font-size:12.8px">=
  pve-manager</div><div style="font-size:12.8px"> E: Sub-proces=
s /usr/bin/dpkg returned an error code (1)&quot;</div><div style="font-si=
ze:12.8px">Donc bien évidemment, ça n&#39;a rien résolu du t=
out !! Je me suis enfin dit qu&#39;il valait mieux aller se coucher que de =
continuer à tout casser</div><div style="font-size:12.8px">Donc a=
u final, j&#39;ai un serveur partiellement mis à jour en mode rescue, =
qui à priori démarre en HD, mais impossible de s&#39;y connecter.=
 <span style="font-size:12.8px">Déjà, je voudrais commence=
r par résoudre ce problème de boot. Mais à distance, je ne s=
ais pas où s&#39;arrête la séquence de boot, dans quel Ã=
©tat est le serveur</span></div><div style="font-size:12.8px">Et je =
vous avoue ne pas trop savoir quoi chercher et par où commencer</di=
v><div style="font-size:12.8px"><br></div><div style="font-size:12.8px"=
>Si quelqu&#39;un aurait une piste/idée, je suis preneur. De même=
, je n&#39;ai pas envie de faire un pavé encore plus gros qu&#39;actue=
llement avec des infos inutiles, mais n&#39;hésitez pas si vous voulez=
plus d&#39;infos techniques</div><div style="font-size:12.8px">Je vai=
s même aller plus loin : si quelqu&#39;un se sent l&#39;âme de me=
faire un devis pour une prestation de sauvetage de serveur, je suis é=
galement intéressé. Je ne veux absolument pas perdre les donnÃ=
©es sur le serveur</div><div style="font-size:12.8px"><br></div><div=
style="font-size:12.8px">Bon w-e à tous.</div></div>

--f46d0444ef31eeb022051f01616e--
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Grégory Bulot
Le #26365819
Le Sat, 5 Sep 2015 17:08:01 +0200,
Vinc Teteve
Bonjour à tous,



Salut,

Je me permets de répondre limite HS. J'ai eu un problème similair e en
apparence, la solution était de réutiliser le noyau "ovh" au boot
(modification directe de /boot/grub/grub.cfg pour specifier le bon No
correspondant au menuentry, sa commence à 0 ...)

alors certe, c'est un noyau 2.6, mais cela a été salvateur (je ne
retrouve plus la page qui en parle)
Jean-Michel OLTRA
Le #26365826
Bonjour,


Le samedi 05 septembre 2015, Vinc Teteve a écrit...


commencer par résoudre ce problème de boot. Mais à distance, je ne sais pas
où s'arrête la séquence de boot, dans quel état est le serveur...
Et je vous avoue ne pas trop savoir quoi chercher et par où commencer...



Lorsque tu tentes le boot sur le disque, tu dois avoir des logs que tu
peux lire en rebootant en rescue juste derrière.

D'autre part, il faudrait voir ce que tu as d'activé en mode rescue, en
comparaison du mode normal (points de montage, services…).
Éventuellement tenter des redémarrages manuels, pour voir ce qui
pourrait bloquer (déjà, ce qui a été mis à jour partiellement), les
désactiver sur la séquence de boot et tenter des redémarrages en mode
normal. Par élimination et tâtonnements, tu pourrais trouver une
séquence de boot valide sur le disque avec ce qui fonctionne encore.

--
jm
Vinc Teteve
Le #26366043
--089e0141aa2251cbad051f2a6b6a
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Merci Jean-Michel pour ta réponse. Le problème est que mon fichie r
/var/log/dmesg date de décembre 2014, date du dernier reboot réus si du
serveur.
Donc à priori, je pense que le serveur ne démarre pas du tout, à moins
qu'il ne log rien au démarrage...
J'ai beau retourner ma config dans tous les sens, je ne vois pas où pe ut se
trouver le problème.
J'ai 2 disques en RAID logiciel, avec /dev/md1 pour le système / et
/dev/md3 avec LVM pour les datas...

~# fdisk -l

Disk /dev/sda: 1000.2 GB, 1000204886016 bytes
[...]
Device Boot Start End Blocks Id System
/dev/sda1 * 4096 20482048 10238976+ fd Linux raid
autodetect
/dev/sda2 20482049 40960000 10238976 82 Linux swap / Solari s
Partition 2 does not start on physical sector boundary.
/dev/sda3 40960001 1953517568 956278784 fd Linux raid
autodetect
Partition 3 does not start on physical sector boundary.

Disk /dev/sdb: 1000.2 GB, 1000204886016 bytes
[...]
Device Boot Start End Blocks Id System
/dev/sdb1 4096 20482048 10238976+ fd Linux raid
autodetect
/dev/sdb2 20482049 40960000 10238976 82 Linux swap / Solari s
Partition 2 does not start on physical sector boundary.
/dev/sdb3 40960001 1953517568 956278784 fd Linux raid
autodetect
Partition 3 does not start on physical sector boundary.

Disk /dev/md3: 979.2 GB, 979229409280 bytes
2 heads, 4 sectors/track, 239069680 cylinders, total 1912557440 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Alignment offset: 3584 bytes
Disk identifier: 0x00000000
Disk /dev/md3 doesn't contain a valid partition table

Disk /dev/md1: 10.5 GB, 10484645888 bytes
2 heads, 4 sectors/track, 2559728 cylinders, total 20477824 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000
Disk /dev/md1 doesn't contain a valid partition table

Disk /dev/mapper/vg--vm-lv--vm: 107.4 GB, 107374182400 bytes
255 heads, 63 sectors/track, 13054 cylinders, total 209715200 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000
Disk /dev/mapper/vg--vm-lv--vm doesn't contain a valid partition table

Disk /dev/mapper/vg--vm-lv--bck: 32.2 GB, 32212254720 bytes
255 heads, 63 sectors/track, 3916 cylinders, total 62914560 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000
Disk /dev/mapper/vg--vm-lv--bck doesn't contain a valid partition table

Disk /dev/mapper/vg--vm-lv--data: 805.3 GB, 805306368000 bytes
255 heads, 63 sectors/track, 97906 cylinders, total 1572864000 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000
Disk /dev/mapper/vg--vm-lv--data doesn't contain a valid partition table

~# dd if=/dev/sda bsD6 count=1
[;;;]GRUB GeomHard DiskRead Error
1+0 records in
1+0 records out
446 bytes (446 B) copied, 3.3286e-05 s, 13.4 MB/s

Je me pose une question bête : GRUB doit bien être installé sur /dev/sda,
et pas sur /dev/md1 ??
Et comment être sûr que le système log bien ce qu'il fait au boot ?

Cdlt

Le 6 septembre 2015 14:26, Jean-Michel OLTRA <
a écrit :


Bonjour,


Le samedi 05 septembre 2015, Vinc Teteve a écrit...


> commencer par résoudre ce problème de boot. Mais à dista nce, je ne sais
pas
> où s'arrête la séquence de boot, dans quel état est le serveur...
> Et je vous avoue ne pas trop savoir quoi chercher et par où commen cer...

Lorsque tu tentes le boot sur le disque, tu dois avoir des logs que tu
peux lire en rebootant en rescue juste derrière.

D'autre part, il faudrait voir ce que tu as d'activé en mode rescue, en
comparaison du mode normal (points de montage, services…).
Éventuellement tenter des redémarrages manuels, pour voir ce qu i
pourrait bloquer (déjà, ce qui a été mis à jour partiellement), les
désactiver sur la séquence de boot et tenter des redémarra ges en mode
normal. Par élimination et tâtonnements, tu pourrais trouver un e
séquence de boot valide sur le disque avec ce qui fonctionne encore.

--
jm





--089e0141aa2251cbad051f2a6b6a
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

    Bonjour,<br>
<br>
<br>
Le samedi 05 septembre 2015, Vinc Teteve a écrit...<br>
<span class=""><br>
<br>
&gt; commencer par résoudre ce problème de boot. Mais à dist ance, je ne sais pas<br>
&gt; où s&#39;arrête la séquence de boot, dans quel éta t est le serveur...<br>
&gt; Et je vous avoue ne pas trop savoir quoi chercher et par où comme ncer...<br>
<br>
</span>Lorsque tu tentes le boot sur le disque, tu dois avoir des logs que tu<br>
peux lire en rebootant en rescue juste derrière.<br>
<br>
D&#39;autre part, il faudrait voir ce que tu as d&#39;activé en mode r escue, en<br>
comparaison du mode normal (points de montage, services…).<br>
Éventuellement tenter des redémarrages manuels, pour voir ce qui< br>
pourrait bloquer (déjà, ce qui a été mis à jour pa rtiellement), les<br>
désactiver sur la séquence de boot et tenter des redémarrage s en mode<br>
normal. Par élimination et tâtonnements, tu pourrais trouver une< br>
séquence de boot valide sur le disque avec ce qui fonctionne encore.<b r>
<span class="HOEnZb"><font color="#888888"><br>
--<br>
jm<br>
<br>
</font></span></blockquote></div><br></div>

--089e0141aa2251cbad051f2a6b6a--
Jean-Michel OLTRA
Le #26366085
Bonjour,


Le lundi 07 septembre 2015, Vinc Teteve a écrit...


J'ai 2 disques en RAID logiciel, avec /dev/md1 pour le système / et
/dev/md3 avec LVM pour les datas...



Sur quel noyau tentes tu de démarrer ? Si tu cherches les archives (du
mois d'août, je pense), tu verras que, dans une configuration similaire
(à part que j'ai md0 sur /boot), et avec un noyau 4.x, je ne pouvais
plus démarrer, suite à un souci sur lvm2. Actuellement, c'est corrigé
chez Debian. Ça pourrait être ça ?

--
jm
Grégory Bulot
Le #26366137
Bonjour,

As-tu essayé d'utiliser la console IPMI pour avoir l'équivalent d'un
accès physique au serveur. Tu pourras voir les messages affichés à
l'écran.

ManagerV6 -> ton serveur -> onglet IPMI -> Depuis une applet Java et
hop, console comme si tu étais sur la machine physique



Je réponds, sachant que je ne suis pas l'auteur du post :

Y'a pas ipmi sur les kimsuffi

:-/
Daniel Caillibaud
Le #26366138
Le 05/09/15 à 17:08, Vinc Teteve VT> Je ne veux absolument pas perdre les données sur le serveur...

Ça va pas résoudre ton problème mais peut-être te perme ttre d'essayer plus sereinement,
sauvegarde d'abord tes données
- boot en rescue et se connecter en ssh
- si elle n'y est pas ajouter ta clé ssh (dans /root/.ssh/authorized_k eys
ou /root/.ssh/authorized_keys2) pour éviter de retaper le mot de pas se tout le temps
- mkdir /mnt/data
- si tu sais pas quelle est la partition de data "parted -l" (ou lvdisplay si c'est du lvm)
- mount /dev/sdX /mnt/data

Et ensuite sur ton pc
rsync -av :/mnt/data/ /un/dossier/avec/assez/d/espace/libre
(tu peux aussi sauvegarder tout /etc, c'est pas énorme, et éventu ellement des trucs de /var/lib
si tu as des datas perso dedans)

Sinon, pour travailler sur ton serveur en rescue, avant le chroot faut mont er dedans les
dossiers spéciaux et tout ce qu'il faut pour que le système puiss e tourner (par ex sans /var
apt-get marche moins bien…)

Si /dev/sdX est /boot, /dev/sdX la racine et /dev/sdZ /home, tu dois tout m onter avant le chroot

# un dossier pour le chroot
mkdir /mnt/foo

# les partitions
mount /dev/sdY /mnt/foo
mount /dev/sdX /mnt/foo/boot
mount /dev/sdX /mnt/foo/home

# et les répertoires spéciaux
mount -o bind /proc /mnt/foo/proc
mount -o bind /sys /mnt/foo/sys/
mount -o bind /dev /mnt/foo/dev/
mount -o bind /dev/pts /mnt/foo/dev/pts/

# tu peux chroot
chroot /mnt/foo


--
Daniel

Pourquoi lave-t-on une injure alors qu'on essuie un affront ?
Alphonse Allais
bruno.debian
Le #26366180
Oui je m'en doute mais il n'a pas précisé quelle gamme il utilisait :
kimsufi, soyoustart ou OVH.



On 08/09/2015 10:35, Grégory Bulot wrote:
Bonjour,

As-tu essayé d'utiliser la console IPMI pour avoir l'équivalent d'un
accès physique au serveur. Tu pourras voir les messages affichés à
l'écran.

ManagerV6 -> ton serveur -> onglet IPMI -> Depuis une applet Java et
hop, console comme si tu étais sur la machine physique



Je réponds, sachant que je ne suis pas l'auteur du post :

Y'a pas ipmi sur les kimsuffi

:-/

Vinc Teteve
Le #26366225
--f46d0444ee159403ee051f3e55dc
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: quoted-printable

Bonsoir,

Le 7 septembre 2015 20:31, Jean-Michel OLTRA <
a écrit :
Sur quel noyau tentes tu de démarrer ? Si tu cherches les archives ( du


mois d'août, je pense), tu verras que, dans une configuration similair e
(à part que j'ai md0 sur /boot), et avec un noyau 4.x, je ne pouvais plus


démarrer, suite à un souci sur lvm2. Actuellement, c'est corrig é
chez Debian. Ça pourrait être ça ?



J'essaye de démarrer avec le noyau par défaut dans Proxmox v3 : l e
2.6.32-26-pve
# ls -l /boot/
total 22944
-rw-r--r-- 1 root root 2525801 Oct 14 2013 System.map-2.6.32-26-pve
-rw-r--r-- 1 root root 104818 Oct 14 2013 config-2.6.32-26-pve
drwxr-xr-x 3 root root 4096 Sep 7 18:15 grub
-rw-r--r-- 1 root root 16639161 Sep 7 18:18 initrd.img-2.6.32-26-pve
-rw-r--r-- 1 root root 4207920 Oct 14 2013 vmlinuz-2.6.32-26-pve

Je n'ai pas fait de changement de noyau depuis le dernier reboot qui
fonctionnait...

Le 8 septembre 2015 10:35, Grégory Bulot Je réponds, sachant que je ne suis pas l'auteur du post :
Y'a pas ipmi sur les kimsuffi



Le serveur est un serveur dédié (gamme "pro") et non un kimsufi. Je
pourrais donc avoir l'option IPMI, sous réserve de souscrire l'option
"Pro", avec la sous-option "vKVM"...etc...
Ce qui ne rentre pas dans mon budget mensuel... :/

Par contre, j'avance un peu. J'ai lancé un reboot "classique" du serve ur,
et demandé à OVH ce qu'il y avait sur l'écran :
"Voici le detail de l'intervention realisee:
Le serveur reste bloqué durant la phase de boot sur le message :
(grub)
Actions entreprises:
Redémarrage du serveur sur mode 'rescue' (Linux)
Resultat:
Boot OK. Systeme 'rescue' accessible."

J'ai donc bien un souci de grub...

Je viens de faire les manips indiquées par Daniel pour monter le chroo t.
J'avais déjà essayé, mais apparemment le /dev/pts est indisp ensable...
Il n'était pas indiqué dans les tutos que j'avais trouvés, e t ça me
bloquait pour monter mes volumes LVM.
Je lance toutes les sauvegardes ce soir, et tente une réinstall de gru b
dans la foulée...

--f46d0444ee159403ee051f3e55dc
Content-Type: text/html; charset=UTF-8
Content-Transfer-Encoding: quoted-printable


--f46d0444ee159403ee051f3e55dc--
Publicité
Poster une réponse
Anonyme