OVH Cloud OVH Cloud

tolérances de panne

3 réponses
Avatar
Elekaj
Bonjour,

Suite a un crash de notre serveur (l'alim a peter, envoyant une vilaine
tension sur les periph + cartes mère -> tout a dégager, les 5 HDD en
RAID 5 aussi).

La n'est pas le problème, ayant a notre disposition un serveur de spare,
la restauration de la sauvegarde faite, tout est reparti.

Le problème, c'est que pendant presque 4H30, les services réseaux ont
été interrompus. Y a til un moyen pour que par ex 2 serveurs identiques
(fournissant les mêmes services) tournent en parallèle. Le but etant que
si l'un crash, l'autre prend le relais.

Moi je pensait faire en sorte d'avoir une machine relais (sur lequel se
connecte les clients). Cette machine renverrai alors les requetes sur le
serveur principal si il est "up" ou sur le serveur de secours si le
serveur principal est HS.

J'ai aussi entendu parler de cluster, mais j'ai l'impression que c'est
assez difficile a mettre en place.

Si vous avez d'autre propositions, je suis preneur. Le but étant d'avoir
aucune interruption de service ou tout du moins très limité dans le
temps (< 10 minutes)

Cordialement,

Elekaj

3 réponses

Avatar
Kevin Denis
Le 24-11-2006, Elekaj a écrit :

Moi je pensait faire en sorte d'avoir une machine relais (sur lequel se
connecte les clients). Cette machine renverrai alors les requetes sur le
serveur principal si il est "up" ou sur le serveur de secours si le
serveur principal est HS.

En proprio (cher) tu as alteon.

En linux, tu as virtualserver. http://www.linuxvirtualserver.org/
Ou bien ucarp, sans doute.

Si vous avez d'autre propositions, je suis preneur. Le but étant d'avoir
aucune interruption de service ou tout du moins très limité dans le
temps (< 10 minutes)

Ensuite, ca peut dependre selon tes criteres. 10 mn, ca suffit a

quelqu'un pour brancher une machine. 10 s , il faut un systeme
automatique.

Avatar
Arol
"Elekaj" a écrit dans le message de news:
J'ai aussi entendu parler de cluster, mais j'ai l'impression que c'est
assez difficile a mettre en place.


La tolérance aux pannes devient une expression trop générique et fourre
tout.
Quels logiciels doivent être tolérants aux pannes ?
Le serveur de fichiers ?
La base de données ?
Le serveur web ?
Le firewall ?

Quand tu auras déterminé ce qui doit être tolérant aux pannes, la solution
facile viendra toute seule.

Avatar
Emmanuel Florac
Le Fri, 24 Nov 2006 16:36:30 +0100, Elekaj a écrit :


J'ai aussi entendu parler de cluster, mais j'ai l'impression que c'est
assez difficile a mettre en place.


Ça dépend des services fournis. Pour un serveur, web, mail, nfs, base de
données, pas de problème, c'est assez facile : heartbeat, une adresse ip
virtuelle, un stockage centralisé redondé (par exemple deux petits
serveurs iSCSI en miroir).

Certains services (samba) ne peuvent pas supporter la déconnexion, donc
il y a forcément interruption (quelques secondes) et risque de pertes de
donnnées. Il faut voir aussi les performances : avec des disques
mirrorés en iSCSI, la sécurité est maxi mais la perf médiocre, avec
un vrai SAN c'est bien mieux mais beaucoup plus cher.

--
Il y a toujours un bug de plus.
Loi de Lubarsky.