Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Distributed filesystems

2 réponses
Avatar
Nicolas Ecarnot
Bonjour,

Avant de me lancer un peu plus loin dans ce genre de recherches, je
voulais simplement demander à ceux qui connaissent les systèmes de
fichiers distribués, du genre OpenAFS, Coda, Intermezzo si ça se faisait
encore.
Ou est-ce que ce genre de chose est purement théorique et universitaire
?
Le développement est-il encore actif ? Les performances sont-elles
acceptables ? Les protocoles sont-ils fiables ? Les implémentations
sont-elles fiables ?

Merci.

--
Nicolas Ecarnot

2 réponses

Avatar
Nicolas Ecarnot
Le 12-01-2005, Loic Tortay écrivait :
Coda et Intermezzo sont quasiment purement théoriques et ne sont plus
développés ou maintenus (en gros).


Etonnant pour coda, dont les dernières releases semblent dater de fin
2004.
Vous êtes sûr ?

Le développement de OpenAFS est actif.


J'ai vu ça aussi.
Pour Intermezzo, le temps semble s'être arrêté en 2002.

Les performances de AFS (en général) ne sont pas excellentes (inférieures à
NFS dans la plupart des cas), ce système de fichier n'est pas conçu pour
être utilisé uniquement sur un réseau local mais pour être un système de
fichier global accessible depuis le monde entier (on n'est évidemment pas
obligé de l'utiliser de cette manière).


L'idée, dans un réseau d'entreprise, de disposer d'un système de
fichiers distribués sur une portion de tous les clients windows vous
semble donc irréalisable ?

Les performances sont améliorées sensiblement par un cache local
semi-persistant (de l'espace disque réservé).


Je m'interessait surtout au principe de distrib.fs pour disposer d'un
espace :
- partagé
- redondant
- sécurisé

Or quand je lis 'cache disque', je considère qu'on retombe plutôt dans
la problématique 'système de fichiers distribué et partagé pour
utilisateurs mobiles et parfois déconnectés', ce qui n'est pas mon
souci. (Bien que ce genre de solution est théoriquement interessante)

Il y a des fonctionnalités intéressantes qu'on trouve maintenant dans
d'autre systèmes de fichiers mais qui sont dans AFS depuis plus de 10 ans
(espace de nom global, copies multiples des données, déplacement des
données d'un serveur à un autre de manière totalement transparente pour
l'utilisateur, ACL évoluées, etc.)


En gros, ce que je cherche, c'est un équivalent de freenet, mais en
réseau local, et donc plus rapide. (Quoique j'ignore si freenet est
redondant... Je crois que oui)

OpenAFS comme client est fiable sur la plupart des plateformes supportées,
les plateformes les plus utilisées/fiables sont Linux, Solaris, Windows et
MacOS X.


Ok, à tester vite donc.

Pour Linux, le support des noyaux 2.6 n'est pas total, il y a un problème
d'architecture (logicielle) qui n'est pas réglé (pour autant que je sache)
dans la gestion des permissions (en très gros). Des discussions longues
ont eu lieu entre les développeurs du noyau et ceux d'OpenAFS (Linus
Torvalds et Alan Cox en tête).

Pour la partie serveur de OpenAFS, les deux plateformes stables et fiables
sont Linux et Solaris (les grosses cellules AFS utilisent très
majoritairement des serveurs Solaris). Le serveur OpenAFS pour AIX est
particulièrement peu fiable (quand il compile).


Aïe, ça veut dire que mon idée de faire de tous mes clients des petits
serveurs tombe à l'eau. En tout cas dans des conditions réalistes...

Il y a d'autres clients AFS, le principal est Arla
<http://www.stacken.kth.se/projekt/arla/>, il y a une partie serveur en
développement depuis des années (Milko) mais elle n'avance pas (KTH utilise
d'ailleurs OpenAFS comme serveur).


Faut-il voir dans ce manque d'entrain la conclusion que les distrib.fs
sont dépassés (pour l'utilisation que je comptais en faire) et que le
raid (que j'utilise actuellement) reste la meilleure solution ?

Il y a des entreprises (Intel, Merryl-Lynch) des universités (KTH,
Stanford) et des instituts/centre de recherche (CERN, IN2P3 en France) qui
utilisent AFS à (très) grande échelle (des dizaines de serveurs, des
centaines ou milliers de clients simultanés sur chaque serveur, des
milliers ou dizaines de milliers d'utilisateurs).


Oui j'ai vu ça pour le cern.

Comme alternative théorique à AFS, il y a Lustre qui est très à la mode
(<http://www.clusterfs.com>).


Merci bsp pour toutes ces infos.

--
Nicolas Ecarnot

Avatar
Croco
Le 12-01-2005, Nicolas Ecarnot a écrit :
Le 12-01-2005, Loic Tortay écrivait :
Les performances de AFS (en général) ne sont pas excellentes (inférieures à
NFS dans la plupart des cas), ce système de fichier n'est pas conçu pour
être utilisé uniquement sur un réseau local mais pour être un système de
fichier global accessible depuis le monde entier (on n'est évidemment pas
obligé de l'utiliser de cette manière).


L'idée, dans un réseau d'entreprise, de disposer d'un système de
fichiers distribués sur une portion de tous les clients windows vous
semble donc irréalisable ?


Irréalisable peut-être pas (encore que la plupart des systèmes de
fichiers distribués sont prévus des systèmes robustes, pas des
postes de travail Windows).

Irraisonnable, sans aucun doute (tolérence aux pannes, AUX VIRUS, tout
ça...).

Il y a d'autres clients AFS, le principal est Arla
<http://www.stacken.kth.se/projekt/arla/>, il y a une partie serveur en
développement depuis des années (Milko) mais elle n'avance pas (KTH utilise
d'ailleurs OpenAFS comme serveur).


Faut-il voir dans ce manque d'entrain la conclusion que les distrib.fs
sont dépassés (pour l'utilisation que je comptais en faire) et que le
raid (que j'utilise actuellement) reste la meilleure solution ?


Ce n'est pas vraiment dépassé. Ce n'est simplement pas prévu pour, à
l'échelle d'une entreprise s'entend.

A l'heure actuelle, un système de fichier distribué n'étant pas trivial
à mettre en oeuvre, son utilisation est principalement réservée à des
sites ayant de très nombreux clients (genre cern...) ou des systèmes
ayant des besoins importants en performance (grappe de calcul par
exemple).

Et dans (presque) tous les cas que je connais en production (ie pour
autre chose que simplement du test), les noeuds de stockages sont des
serveurs dédiés...

Croco