id et caractère "/"

unbewusst.sein

11/06/2008 à 11:54

Vincent Lefevre <vincent+ wrote:

> pas grave, il doit-être particuliérement rare d'avoir un site qui
> fonctionne sur plusieurs systèmes de fichiers non ?

Mais l'édition d'un fichier peut modifier l'inode. Et les inodes
changent en cas de récupération des données via un backup.

oui, merci, j'ai appris ça, entre-temps, j'ai donc abandonné inode...

> > Peut-être qu'il faudra que tu codes quelque chose d'équivalent à
> > base64, mais adapté aux ID.

> ben il faut un codage unique rapide implémentable facilement en JS et en
> PHP, voire en ruby.
> comme, pour les noms de fichiers, la tendance est à l'utf-8, voire
> utf-16,

Ça n'a pas de sens. Un id est une suite de caractères, alors que de
l'UTF-8 est une suite d'octets et l'UTF-16 est une suite de mots de
16 bits.

c'est pourquoi la solution proposée conjointement par "Mickaël Wolff aka
Lupus Michaelis" et "Olivier Miakinen" est la base :
utiliser un base64 modifié qui me semble bien marcher, voir mon essai en
php :
http://thoraval.yvon.free.fr/PHP/AJAX_dir_tree/map/base64.php
ou js :
http://thoraval.yvon.free.fr/PHP/AJAX_dir_tree/map/base64.html

> notes que l'auteur original de "AJAX_File_Browser" ne s'est pas cassé
> les pieds il a mis carément le path comme id sans-même encoder les
> "/"...
> et sur mac os x ça roule, mais il y a qq petits bugs dans ces scripts.
> <http://gscripts.net/free-php-scripts/Listing_Script/AJAX_File_Browser/d
> etails.html>

Pas standard. Et même sans parler d'id, certains caractères de contrôle
(qui peuvent se trouver dans les noms de fichiers) sont incompatibles
avec XML.

oui, je sais, il ne s'est pas emm@&dé, il a mis carément le path comme
ID...

ceci dit suite à échanges avec stef, je vais regarder une solution sans
besoin d'ID, le "dossier" à remplir par XHR étant défini par this...

--
Une Bévue

unbewusst.sein

11/06/2008 à 11:54

Olivier Miakinen <om+ wrote:

D'accord. Ça ne pose pas de problème, il suffit d'utiliser le « . » à la
place du « : » pour remplacer le « / » de Base64.

ouais, ok, je modifierai ça...
si je ne peux pas remplacer mes IDs par this...
--
Une Bévue

Vincent Lefevre

11/06/2008 à 12:42

Dans l'article <484f0d92$,
Olivier Miakinen <om+ écrit:

Le 11/06/2008 01:05, Vincent Lefevre a écrit :
>
> Mieux vaut faire un codage adapté sans passer par base64.

Pourquoi cela ?

Pour avoir un code qui prend moins de place en moyenne.

--
Vincent Lefèvre - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)

unbewusst.sein

11/06/2008 à 12:52

Vincent Lefevre <vincent+ wrote:

Pour avoir un code qui prend moins de place en moyenne.

ben j'ai regardé les implémentations base64 en C et en JS, côté JS, ça
évite (ie. en implémentant un code spécifique) une ligne de trois appels
à String#replace(...) :
Base64.encode(path).replace(/+/g,'-').replace(///g,':').replace(/=/g,
'_');

côté php, comme base64_encode/decode sont standards, il faut ré-écrire
tout le code (de l'ordre de 80 lignes).

pas sûr que ça prenne poins de place, in fine.
--
Une Bévue

Vincent Lefevre

11/06/2008 à 18:51

Dans l'article <1iidfek.pfidhqn2cnx3N%,
Une Bévue écrit:

Vincent Lefevre <vincent+ wrote:

> Pour avoir un code qui prend moins de place en moyenne.

ben j'ai regardé les implémentations base64 en C et en JS, côté JS, ça
évite (ie. en implémentant un code spécifique) une ligne de trois appels
à String#replace(...) :
Base64.encode(path).replace(/+/g,'-').replace(///g,':').replace(/=/g,
'_');

Dans l'article <1iidfek.pfidhqn2cnx3N%unbewusst.sein@weltanschauung.com.invalid>,
Une Bévue <unbewusst.sein@weltanschauung.com.invalid> écrit:

Vincent Lefevre <vincent+news@vinc17.org> wrote:

> Pour avoir un code qui prend moins de place en moyenne.

ben j'ai regardé les implémentations base64 en C et en JS, côté JS, ça
évite (ie. en implémentant un code spécifique) une ligne de trois appels
à String#replace(...) :
Base64.encode(path).replace(/+/g,'-').replace(///g,':').replace(/=/g,
'_');

Vous avez filtré cet utilisateur ! Consultez son message

Dans l'article <1iidfek.pfidhqn2cnx3N%,
Une Bévue écrit:

Vincent Lefevre <vincent+ wrote:

> Pour avoir un code qui prend moins de place en moyenne.

ben j'ai regardé les implémentations base64 en C et en JS, côté JS, ça
évite (ie. en implémentant un code spécifique) une ligne de trois appels
à String#replace(...) :
Base64.encode(path).replace(/+/g,'-').replace(///g,':').replace(/=/g,
'_');

Olivier Miakinen

12/06/2008 à 00:32

Le 11/06/2008 18:51, Vincent Lefevre a écrit :

Par "code", j'entendais la chaîne encodée. J'ai vu une suggestion de
remplacer un caractère par 2 caractères (parce qu'il n'y avait pas
assez de caractères de disponibles?), ce qui est une mauvaise idée.

C'était une boutade, parce qu'en fait il y a assez de caractères de
disponibles, et je ne comprenais pas pourquoi Une Bévue semblait revenir
sur l'ancienne idée selon laquelle ce n'aurait pas été le cas.

Par ailleurs, les caractères que je proposais de redoubler sont
rarissimes lors de l'encodage en base64 de noms de fichiers. Mais
bon, dans l'absolu tu as raison.

Et rappel: le ":" ne doit pas se trouver dans un id si les namespaces
sont utilisées.

D'accord. Le nombre de caractères autorisés reste donc au nombre de 65
au lieu de 66, ce qui suffit amplement pour un encodage type Base64,
même en conservant le caractère de padding dont on pourrait très bien
se passer.

Maintenant, il semble que ID, qui doit matcher Name, peut contenir
beaucoup de choses, en particulier toutes les suites de "Letter",
avec:

[84] Letter ::= BaseChar | Ideographic
[85] BaseChar ::= [#x0041-#x005A] | [#x0061-#x007A] |
[#x00C0-#x00D6] | [#x00D8-#x00F6] | [#x00F8-#x00FF] |
[ ... ]
[86] Ideographic ::= [#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]

Je n'en ai pas l'impression, du moins pas en HTML (ni, donc, en
XHTML 1.0) :

<http://www.la-grange.net/w3c/html4.01/types.html#type-name>
les atomes ID et NAME doivent commencer par une lettre ([A-Za-z]), qui
peut être suivie par un nombre quelconque de lettres, de chiffres
([0-9]), de caractères trait d'union « - », souligné « _ », deux-points
« : » et points « . ».
</>

<http://www.w3.org/TR/html4/types.html#type-name>
ID and NAME tokens must begin with a letter ([A-Za-z]) and may be
followed by any number of letters, digits ([0-9]), hyphens ("-"),
underscores ("_"), colons (":"), and periods (".").
</>

unbewusst.sein

12/06/2008 à 06:34

Olivier Miakinen <om+ wrote:

C'était une boutade, parce qu'en fait il y a assez de caractères de
disponibles, et je ne comprenais pas pourquoi Une Bévue semblait revenir
sur l'ancienne idée selon laquelle ce n'aurait pas été le cas.

ah bon, j'ai écris ça ?
j'ai pensé, un moment, ne pas avoir à utiliser d'ID, et donc d'encodage,
en utilisant « this » mais, après vérification, ce n'est pas possible.

j'utilise b64 modifié dernière version (avec . au lieu de :)
--
Une Bévue

unbewusst.sein

12/06/2008 à 06:34

Vincent Lefevre <vincent+ wrote:

Par "code", j'entendais la chaîne encodée. J'ai vu une suggestion de
remplacer un caractère par 2 caractères (parce qu'il n'y avait pas
assez de caractères de disponibles?), ce qui est une mauvaise idée.

Et rappel: le ":" ne doit pas se trouver dans un id si les namespaces
sont utilisées.

ce qui est mon cas. j'ai tenu compte de cette remarque (ie concernant :
et namespace) même si c'est un bug, amha.
je n'ai jamais eu l'intention de remplacer un caractère par 2
caractères.
--
Une Bévue

Vincent Lefevre

12/06/2008 à 16:55

Dans l'article ,
Olivier Miakinen <om+ écrit:

> Maintenant, il semble que ID, qui doit matcher Name, peut contenir
> beaucoup de choses, en particulier toutes les suites de "Letter",
> avec:
>
> [84] Letter ::= BaseChar | Ideographic
> [85] BaseChar ::= [#x0041-#x005A] | [#x0061-#x007A] |
> [#x00C0-#x00D6] | [#x00D8-#x00F6] | [#x00F8-#x00FF] |
> [ ... ]
> [86] Ideographic ::= [#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]

Je n'en ai pas l'impression, du moins pas en HTML

Ah, je considérais XHTML.

(ni, donc, en XHTML 1.0) :

Si, c'est autorisé, mais déconseillé si on veut être compatible avec
les parseurs HTML:

http://www.w3.org/TR/xhtml1/#C_8

C. HTML Compatibility Guidelines

This appendix is informative.

[...]

C.8. Fragment Identifiers
[...]
Note that the collection of legal values in XML 1.0 Section 2.3,
production 5 is much larger than that permitted to be used in the ID
and NAME types defined in HTML 4. When defining fragment identifiers
to be backward-compatible, only strings matching the pattern
[A-Za-z][A-Za-z0-9:_.-]* should be used.

--
Vincent Lefèvre - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)

id et caractère "/"

9 réponses

Veuillez sélectionner un problème