OVH Cloud OVH Cloud

Backups : est-ce possible ?

25 réponses
Avatar
Fabien LE LEZ
Bonjour,

Jusqu'à présent, je croyais que seuls des gens qui n'y connaissent pas
grand-chose en informatique ne faisaient pas de backups. Bien sûr, les
programmeurs et autres informaticiens ont appris (souvent à leurs
dépens) qu'il faut faire des backups réguliers et fiables.

Je me trompais.

<http://www.pureftpd.org/>
"The death of that hard disk has a lot of implications. I've lost
almost all my work from the last 5 years."

En gros, si j'ai bien saisi, l'auteur de PureFTP n'a fait, pendant 5
ans, aucun backup sur CD-R, DVD-R ou autre media du même style. Juste
une copie sur une autre machine, copie qu'il n'a pas hésité à
supprimer parce qu'il manquait de place.

Je suis sur le cul.

Enfin bon, je ne sais pas si ce message est d'une grande utilité
(c'est plus une réaction épidermique), à part peut-être comme un
rappel : vérifiez bien que vous sauvegardez très souvent toutes vos
données, et que tous vos collègues font de même.

Note : en 2005, j'ai renvoyé quatre disques durs (250 Go IDE Maxtor)
en SAV. J'ai nettement l'impression que les disques durs sont de plus
en plus fragiles.

10 réponses

1 2 3
Avatar
Xavier Roche
Fabien LE LEZ wrote:
En gros, si j'ai bien saisi, l'auteur de PureFTP n'a fait, pendant 5
ans, aucun backup sur CD-R, DVD-R ou autre media du même style. Juste


Et il avait l'avantage certain d'avoir ses projets (comme pureFTPd) en
libre, c'est à dire répliqués à quelques milliers d'exemplaires un peu
partout. C'est déja une protection (elle m'a personnellement servie une
fois :p), mais cela ne règle pas tout le reste (les mails reçus et
envoyés, les documents, passwords, sites web..)

rappel : vérifiez bien que vous sauvegardez très souvent toutes vos
données, et que tous vos collègues font de même.


Et préférer le SCSI face au SATA/IDE pour les données sensibles (ou plus
exactement, préférer le "entreprise storage" par rapport au "personal
storage") (1) ; même si c'est beaucoup plus cher (actuellement, environ
un facteur 7 en terme de prix/capacité)

-ou-, vu le coût négligeable des disques aujourd'hui, on peut assez
facilement ajouter un disque SATA de "backup", avec un cron hebdomadaire
ou mensuel, qui dormira la plupart du temps (cf. hdparm) ; et de temps
en temps faire une archive tarball qui sera gravée (et mise en sûreté -
les incendies, cela existe aussi)

Une solution simple et pas chère, c'est aussi de faire un rsync croisé
entre deux serveurs hébergés à deux endroits différents via réseau.

Enfin, que ce soit pour les serveurs (même petits) ou les desktops, du
RAID0 est une option à considérer. Réinstaller est tellement embêtant
(pas tellement l'opération, mais l'intervention), changer un disque HS
est tellement simple, et le coût abordable par rapport au prix du PC,
que bon.. et ne pas soublier qu'un disque, cela finit toujours par
mourir (2)

Note : en 2005, j'ai renvoyé quatre disques durs (250 Go IDE Maxtor)
en SAV. J'ai nettement l'impression que les disques durs sont de plus
en plus fragiles.


Le problème c'est que pour le end-user, les constructeurs ont à la fois
augmenté les capacités, et écrasé les prix, en rognant absolument
partout sur l'électronique (jusqu'aux condensateurs "cheap" !), donnant
des disques parfois pas très fiables - surtout en régime permanent (1)

Un constructeur célèbre pour ses disques "Etoile de la mort" avait même
indiqué que ses disques SATA n'étaient pas prévus pour "fonctionner plus
de 11 heures par jour" (3)

Bref les disques sont des éléments fragiles, qui peuvent effectivement
donner pas mal de déconvenues..

Quelques références:

(1) More than an interface — SCSI vs. ATA
<http://www.ccs.neu.edu/course/csg389/readings/Anderson03.pdf>
Ou pourquoi le SCSI est plus fiable que le SATA [en fait, il faut
comprendre disques "end user" vs. disques "entreprise" ; car il existe
des disques SATA "entreprise", beaucoup plus chers que les disques "end
user" SATA]. Un papier vraiment excellent et qui donne pas mal
d'informations sur les qualités respectives des deux grandes lignes de
produits des constructeurs.

(2) Disk Infant Mortality in Large Storage Systems
<http://ssrc.cse.ucsc.edu/Papers/xin-mascots05.pdf>
Ou comment gérer et prévoir les pannes (inévitables!) disque dans des
systèmes de stockages massifs.

(3) IBM Soothes Concerns Over New Hard Drive Spec
<http://www.extremetech.com/article2/0,1697,115967,00.asp>
"If you run it more than 11 hours per day, that doesn't mean it's not
going to work"

Avatar
Fabien LE LEZ
On 03 Feb 2006 07:35:59 GMT, Xavier Roche a writé :

En gros, si j'ai bien saisi, l'auteur de PureFTP n'a fait, pendant 5
ans, aucun backup sur CD-R, DVD-R ou autre media du même style. Juste


Et il avait l'avantage certain d'avoir ses projets (comme pureFTPd) en
libre


Notons en passant que PureFTP est un logiciel destiné à accepter des
connexions depuis Internet. Peut-on sérieusement faire confiance, en
matière de sécurité, à un type qui ne prend pas au sérieux la plus
simple et la plus importante des mesures de sécurité : le backup ?

Et préférer le SCSI face au SATA/IDE pour les données sensibles


C'est cher. Et un bloc de deux disques ATA en RAID 1 me semble à la
fois plus fiable et moins cher.

Enfin, que ce soit pour les serveurs (même petits) ou les desktops, du
RAID0 est une option à considérer.


J'imagine que tu voulais parler de RAID 1 ?

Le RAID 0, s'il est censé améliorer la vitesse, ne fait que fragiliser
le système.

En tout cas, je viens d'installer Fedora Linux sur un PC avec 4
disques durs, et y mettre du RAID1 (pour le système et le swap) et du
RAID 5 (pour /home) est un jeu d'enfant.

(3) IBM


C'est pas pour rien qu'ils se sont débarrassés de leur section
"disques durs"...


Avatar
rejoc
Enfin, que ce soit pour les serveurs (même petits) ou les desktops, du
RAID0 est une option à considérer. Réinstaller est tellement embêtant
RAID1 plutôt... non ?

ou, en général, RAID > 0 mais pas 0 (stripping) qui ne fait qu'augmenter
le problème (le premier disque du RAIDset qui plante fait qu'on perd
toutes les données du volume)

Avatar
Kevin Denis
Le 03-02-2006, Xavier Roche a écrit :

rappel : vérifiez bien que vous sauvegardez très souvent toutes vos
données, et que tous vos collègues font de même.


Et préférer le SCSI face au SATA/IDE pour les données sensibles (ou plus
exactement, préférer le "entreprise storage" par rapport au "personal
storage") (1) ; même si c'est beaucoup plus cher (actuellement, environ
un facteur 7 en terme de prix/capacité)

-ou-, vu le coût négligeable des disques aujourd'hui, on peut assez
facilement ajouter un disque SATA de "backup", avec un cron hebdomadaire
ou mensuel, qui dormira la plupart du temps (cf. hdparm) ; et de temps
en temps faire une archive tarball qui sera gravée (et mise en sûreté -
les incendies, cela existe aussi)

Une solution simple et pas chère, c'est aussi de faire un rsync croisé
entre deux serveurs hébergés à deux endroits différents via réseau.

Enfin, que ce soit pour les serveurs (même petits) ou les desktops, du
RAID0 est une option à considérer.


RAID1, plutot, amha. Le RAID0 permet d'accelerer le debit d'entree
sortie en utilisant plusieurs disques. Si un seul d'entre eux meurt,
plus aucun fichier n'est utilisable.
Le RAID1 s'appelle technologie miroir. On a deux disques identiques
dont l'un est la copie parfaite de l'autre. En cas de crash physique
d'un des disques, le second permet de recuperer les donnees.

Note : en 2005, j'ai renvoyé quatre disques durs (250 Go IDE Maxtor)
en SAV. J'ai nettement l'impression que les disques durs sont de plus
en plus fragiles.


J'ai de plus en plus de problemes avec les sauvegardes CD. J'ai verifie,

sur des CD qui datent de 5 ans, j'ai 80% d'illisibles (!!!). La majorite
sont des vieux logs ou des sauvegardes qui n'ont plus d'utilite, mais
ce taux de dechet m'inquiete. J'ai plusieurs CD de differentes marques.

Je me demande quel stockage a long terme est vraiment fiable?

Bref les disques sont des éléments fragiles, qui peuvent effectivement
donner pas mal de déconvenues..

Mais pas que les disques. J'ai une barrette memoire sur un PC qui m'a

pourri toute une partition lors d'un boot. Ca aurait pu ne faire qu'un
kernel panic, ca a bien vautre le systeme (/usr donc facile a remettre
en etat neanmoins).

--
Kevin


Avatar
Emmanuel Florac
Le Fri, 03 Feb 2006 07:35:59 +0000, Xavier Roche a écrit :


Et préférer le SCSI face au SATA/IDE pour les données sensibles (ou plus
exactement, préférer le "entreprise storage" par rapport au "personal
storage") (1) ; même si c'est beaucoup plus cher (actuellement, environ
un facteur 7 en terme de prix/capacité)


C'est une légende à la vie dure, entretenue par les marchands de disques
SCSI. Le CERN a fait une longue étude sur plusieurs dizaines de To de
stockage, pendant une longue période, pour comparer la fiabilité des
disques SATA ou ATA, SCSI et Fibre Channel. La conclusion de l'étude est
qu'il n'y a aucune différence, et depuis lors le CERN utilise du stockage
ATA ou SATA.

les détails sont là :
http://lpsc.in2p3.fr/cdsagenda/askArchive.php?base=agenda&categ 589&id 589s1t0/transparencies

--
L'Algérie était au bord du gouffre, aujourd'hui elle a fait un grand pas
en avant.
Aït Ahmed.

Avatar
Fred
Fabien LE LEZ wrote:

En tout cas, je viens d'installer Fedora Linux sur un PC avec 4
disques durs, et y mettre du RAID1 (pour le système et le swap) et du


RAID1 pour le swap est un peu contre-productif, RAID0 serait
probablement plus adapté (ou FAT32 pour le swapfile de Windows)

RAID 5 (pour /home) est un jeu d'enfant.


Ne pas oublier que RAIDx ne protège pas contre une erreur, humaine par
exemple.

Avatar
lap

Notons en passant que PureFTP est un logiciel destiné à accepter des
connexions depuis Internet. Peut-on sérieusement faire confiance, en
matière de sécurité, à un type qui ne prend pas au sérieux la plus
simple et la plus importante des mesures de sécurité : le backup ?


tu auras ta réponse en auditant le code source de pure-ftp :)

LaP

Avatar
Xavier Roche
Emmanuel Florac wrote:
C'est une légende à la vie dure, entretenue par les marchands de disques
SCSI.


Attention, on ne parle pas de différence entre SCSI et SATA, mais entre
qualité "end user" et "entreprise". Il se trouve que la plupart des SCSI
sont dans la 2e catégorie, et les SATA plutôt dans la première. Mais..

Les remarques de l'étude sont pertinentes amha:
- différences de qualité au niveau mécanique, électronique, protection
magnétique.. (voir la partie "Technology Differences")
- protection contre les vibrations mutuelles entre disques
- meilleure électronique embarqués (notamment pour le réordonnement des
secteurs - c'est de moins en moins vrai avec la nouvelle norme sata)
- tests plus poussés notamment pour calibrer l'irrégularité des pistes
- temps d'accès meilleurs

Le CERN a fait une longue étude sur plusieurs dizaines de To de
stockage, pendant une longue période, pour comparer la fiabilité des
http://lpsc.in2p3.fr/cdsagenda/askArchive.php?base=agenda&categ 589&id 589s1t0/transparencies


Sauf qu'ils ne prennent pas des SATA "de base", mais des SATA certifiés
pour du 24/7 (pas les étoiles de la mort donc :p) en 7200. Je soupçonne
en fait ces SATA d'être de classe "entreprise storage" ; ou d'une classe
intermédiaire (ils bénéficient d'ailleurs parfois de garantie
d'échange standard). Mais toujours moins chers cependant que du SCSI.

Et il faudrait comparer au bout de quelques années deux ensembles pour
se faire une opinion - à cause de la fameuse courbe en "baignoire" (cf.
<http://ssrc.cse.ucsc.edu/Papers/xin-mascots05.pdf>)

Avatar
Xavier Roche
Fabien LE LEZ wrote:
J'imagine que tu voulais parler de RAID 1 ?


Oui évidemment, ou RAID5. Lapsus.

C'est pas pour rien qu'ils se sont débarrassés de leur section
"disques durs"...


Et les repreneurs arrivent à en vendre apparamment. Brrrr.....

Avatar
Fabien LE LEZ
On 03 Feb 2006 14:08:46 GMT, Fred :

En tout cas, je viens d'installer Fedora Linux sur un PC avec 4
disques durs, et y mettre du RAID1 (pour le système et le swap) et du


RAID1 pour le swap est un peu contre-productif, RAID0 serait
probablement plus adapté


Sauf que si un disque dur foire, le swap foire aussi... Et je ne suis
pas sûr que Linux supporte ça sans planter.

L'idée du RAID[*], c'est que même si un disque dur flanche, le PC
continue à travailler comme si de rien n'était. Et on peut attendre le
soir, quand tout le monde est parti, pour changer le disque.

Par contre, quitte à avoir 4 disques, j'aurais peut-être dû mettre le
swap sur du RAID 1+0. M'enfin bon, j'ai plus besoin d'un serveur
fiable que d'un serveur rapide, surtout pour la charge que je compte
lui demander...


[*] Hors RAID0 bien sûr -- d'ailleurs, c'est un terme abusif, puisque
le "R" de "redondance" n'a rien à voir avec le RAID0.


1 2 3