OVH Cloud OVH Cloud

punycode

23 réponses
Avatar
Le Gaulois
Bonjour,

qu'est-ce que c'est "punycode" ?
(La question a un rapport avec une correction de bug dans
Firefox 1.0.1)

10 réponses

1 2 3
Avatar
Jack
Le 01/03/2005 14:03, :
Bonjour,

qu'est-ce que c'est "punycode" ?
(La question a un rapport avec une correction de bug dans
Firefox 1.0.1)


Relatif aux noms DNS vs IDN.
Avatar
Pascal Chevrel
Le 01/03/2005 14:03, Le Gaulois a ecrit :
Bonjour,

qu'est-ce que c'est "punycode" ?
(La question a un rapport avec une correction de bug dans
Firefox 1.0.1)



Depuis quelques temps il est possible d'avoir des noms de domaine
internationaux contenant des caractères accentués, pour cela ces noms de
domaines sont en unicode qui englobe tous les jeux de caractères.

Firefox et Opera supportent ces noms de domaine nativement, donc si tu
tapes http://españa.com/ dans ta barre d'adresse tu vas sur ce site.

La faille de sécurité est dans le principe même des noms de domaines
internationaux (IDN), tu peux trouver certaines lettres visuellement
identiques plusieurs fois en unicode, donc il est possible de créer deux
noms de domaines différents mais qui affichent le même nom dans ta barre
d'adresse, par exemple le "é" français s'affiche de la même manière sur
un ordinateur que le e accentué espagnol mais ce n'est pas la même
lettre. La solution transitoire choisie par Firefox est de ne pas
afficher ces noms en unicode dans la barre d'adresse mais d'utiliser
l'équivalent en ASCII, donc si tu tapes :

www.españa.com
Firefox affichera http://xn--espaa-rta.com/, donc si tu te retrouves sur
un site bancaire genre www.bnp.fr et que le nom est transformé comme
précédemment, ça veut dire que tu es sur un faux site que l'escroc aura
monté en utilisant un nom de domaine en unicode et en ayant utilisé un n
par exemple qui est dans l'alphabet russe ou grec.

Voilà, en gros c'est ça. Les navigateurs qui supportent nativement les
noms de domaine internationaux (Opera et Firefox) utilisent ces
solutions transitoires en attendant qu'une solution technique soit mise
en place en amont au niveau du système d'enregistrement des noms de
domaines.

pascal

--
Pascal Chevrel - Mozilla Champion
FAQ Mozilla/Netscape en français : http://www.chevrel.org/fr/faq/
Forums SOS online.net: http://forums.chevrelbureau.com/
Avatar
Sergio
Pascal Chevrel avait prétendu :

Depuis quelques temps il est possible d'avoir des noms de domaine
internationaux contenant des caractères accentués, pour cela ces noms de
domaines sont en unicode qui englobe tous les jeux de caractères.



Quel est l'abruti des îles qui a eu cette idée débile ?

Outre les problèmes de "punycode", cela multiplie les problèmes de
cybersquatting !

Supposons que mon entreprise s'appelle "Société Générale" (un exemple
hein :-) ).

Il em faudra réserver les dommaines en :
- Sociétégénérale
- Societegenerale

Et toutes les combinaisons entre "é" et "e" (et "è" et "ê" tant qu'à
faire).

Sans oublier qu'un internaute américain sera incapable, avec son
clavier, de taper le premier nom de domaine! (et je ne parle pas des
domaines en unicode chinois ou autres langues exotiques...).

Encore un exemple de débilité technocratique...

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
nofuture
Sergio wrote:

> Quel est l'abruti des îles qui a eu cette idée débile ?

tout ceux qui n'ont pas notre alphabet et ils sont nombreux.

> Outre les problèmes de "punycode", cela multiplie les problèmes de
> cybersquatting !
>
> Supposons que mon entreprise s'appelle "Société Générale" (un exemple
> hein :-) ).
>
> Il em faudra réserver les dommaines en :
> - Sociétégénérale
> - Societegenerale
>
> Et toutes les combinaisons entre "é" et "e" (et "è" et "ê" tant qu'à
> faire).
>

ça fait belle lurette que les gens ne tapent plus les noms dans les
barres d'adresses mais passent par des moteurs et cliquent sur des liens.

> Sans oublier qu'un internaute américain sera incapable, avec son
> clavier, de taper le premier nom de domaine! (et je ne parle pas des
> domaines en unicode chinois ou autres langues exotiques...).
>

et bien, il cliquera sur un lien, la belle affaire.

> Encore un exemple de débilité technocratique...
>

sans commentaire, affligeant.
Avatar
Pierre Goiffon
Le Gaulois wrote:
qu'est-ce que c'est "punycode" ?



Comme l'a dis Pascal, les IDN peuvent contenir tout caractère du jeux
Unicode. Pour représenter ces IDN en us-ascii classique, on utilise un
codage, et ce codage c'est Punycode. Pour les détails voir la RFC
correspondante :
http://www.ietf.org/rfc/rfc3492.txt?number492

Et pour appronfondir vraiment le sujet, les RFC autour de ce numéro
(3490, 3491) apportent aussi pas mal d'informations.
Avatar
Le Gaulois
Pierre Goiffon a écrit :

Le Gaulois wrote:
> qu'est-ce que c'est "punycode" ?

Comme l'a dis Pascal, les IDN peuvent contenir tout caractère du jeux
Unicode. Pour représenter ces IDN en us-ascii classique, on utilise un
codage, et ce codage c'est Punycode. Pour les détails voir la RFC
correspondante :
http://www.ietf.org/rfc/rfc3492.txt?number492

Et pour appronfondir vraiment le sujet, les RFC autour de ce numéro
(3490, 3491) apportent aussi pas mal d'informations.



Merci à tout ceux qui ont répondu. j'avais compris le principe
de la faille.
Et la ménagère de moins de 50 ans lorsqu'elle voudra utiliser
internet, il faudra qu'elle lise et comprenne les 53 pages
de la RFC 3492 pour lire le nom du site actuellement affiché
dans son navigateur ?

Je viens d'essayer http://españa.com/
avec Mozilla 0.93 ça fonctionne,
avec Internet Explorer 5, je tombe sur une pub de Verisign
qui me propose d'installer un plug-in i-nav(TM)
Avatar
Pierre Goiffon
Le Gaulois wrote:
Et la ménagère de moins de 50 ans lorsqu'elle voudra utiliser
internet, il faudra qu'elle lise et comprenne les 53 pages
de la RFC 3492 pour lire le nom du site actuellement affiché
dans son navigateur ?



C'est la solution adoptée par la Mozilla Fondation sur ses navigateurs,
mais tout le monde n'a pas fait ce choix la :
<http://blog-and-blues.org/weblog/2005/02/25/401-opera-8-beta-2-media-speech-exif-atom-idn>

Tous les éditeurs de navigateurs renvoient la balle aux registars, et il
faudrait en effet qu'ils essaient de ne pas enregistrer n'importe quoi.

Cela dis on a des problèmes aussi dans l'implémentation que fait le
navigateur, car tout bêtement certaines polices ont des glyphes très
proches pour des caractères pourtant bien différents. Et même en
us-ascii de base, on peut avoir confusion entre "1" et "l" par exemple...

avec Internet Explorer 5, je tombe sur une pub de Verisign



Pour IE, le support des IDN n'est pas natif mais est possible via un
plugin en effet.
Avatar
Laurent Wacrenier
Pierre Goiffon écrit:
Tous les éditeurs de navigateurs renvoient la balle aux registars, et il
faudrait en effet qu'ils essaient de ne pas enregistrer n'importe quoi.



Ainsi que les fournisseurs de certificats SSL...
Ça fait beaucoup de monde dans la dance.

Il n'y a pas une norme listant les caractères autorisés ?
Avatar
Sergio
Le Gaulois a couché sur son écran :

Je viens d'essayer http://españa.com/
avec Mozilla 0.93 ça fonctionne,



Mozilla 0.93 ? Mon dieu ! ça existe encore ! Ne confondrais-tu pas avec
Firefox ;-)

avec Internet Explorer 5, je tombe sur une pub de Verisign
qui me propose d'installer un plug-in i-nav(TM)



Avec FF 1.01, il me dit que le site est introuvable
Avec IE 6, comme toi
Avec Opera 7.54 ça marche
Avec K-meleon 0.82, ça marche
Note : Avec K-meleon il m'affiche l'URL "http://españa.com/" alors que
Opera affiche "http://españa.com/

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Pierre Goiffon
Laurent Wacrenier wrote:
Tous les éditeurs de navigateurs renvoient la balle aux registars, et il
faudrait en effet qu'ils essaient de ne pas enregistrer n'importe quoi.



Ainsi que les fournisseurs de certificats SSL...



Pourquoi ? Un certificat SSL s'appuie sur le nom de domaine ?

Il n'y a pas une norme listant les caractères autorisés ?



Rapidement à partir de la home du site de l'IANA on tombe sur :
http://www.iana.org/assignments/idn/

Et on découvre le lien :
http://www.ietf.org/internet-drafts/draft-klensin-reg-guidelines-06.txt

Qui contient dans l'introduction :
"The basic IDN definition potentially allows a very large number of
possible characters in domain names, and this richness may lead to
serious user confusion about similar-looking names. To avoid this
confusion, it is necessary for the IDN registration process to impose
rules that disallow some otherwise-valid name combinations"

Document encore en l'état de draft, daté du 16/02

Sinon, en fouillant un peu chez Verisign on peut tomber sur des pages
qui font allusion au prb.
1 2 3