OVH Cloud OVH Cloud

UTF-8 ou ISO-8859-1 ?

48 réponses
Avatar
docanski
Bonjour,

Quel est donc le meilleur choix pour la meta à insérer dans l'en-tête
des pages X(HTML) ?
La question peut paraître bizarre mais je constate, depuis que j'utilise
une distribution Linux, que ce dernier me donne toujours un affichage
zarbi lorsque j'affiche avec Firefox un page codée sous Gedit. Lorsque
je force (dans les options d'affichage de FF) l'affichage en UTF-8, le
texte est respecté ... mais cette option se remet toujours à ISO-8859-1
lorsque je rafraîchis la page.
Je n'avais jamais constaté un tel problème sous Win, avec un paramétrage
pourtant parfaitement identique.
Une idée ?

Cordialement,
--
docanski

Portail et annuaire du nord-Bretagne : http://armorance.free.fr/
Guide des champignons d'Europe : http://mycorance.free.fr/
La vallée de la Rance maritime : http://valderance.free.fr/
Les côtes du nord de la Bretagne : http://docarmor/free.fr/

10 réponses

1 2 3 4 5
Avatar
Bruno Desthuilliers
BertrandB a écrit :
docanski a écrit :
Bonjour,

Quel est donc le meilleur choix pour la meta à insérer dans l'en-tête
des pages X(HTML) ?
La question peut paraître bizarre mais je constate, depuis que
j'utilise une distribution Linux, que ce dernier me donne toujours un
affichage zarbi lorsque j'affiche avec Firefox un page codée sous
Gedit. Lorsque je force (dans les options d'affichage de FF)
l'affichage en UTF-8, le texte est respecté ... mais cette option se
remet toujours à ISO-8859-1 lorsque je rafraîchis la page.
Je n'avais jamais constaté un tel problème sous Win, avec un
paramétrage pourtant parfaitement identique.
Une idée ?

Cordialement,


Léger HS :
il exsite deux formes de UTF-8 avec BOM ou sans BOM (premier caractère
non affichable). Beaucoup de traitements de texte ne savent générer que
de l'UTF8 avec BOM ce qui peut être la source de bug vicieux notamment
sous php.



Mettre un BOM (nb : Byte Order Mark) sur de l'UTF-8 est une ânerie
monumentale comme seule une certaine firme de Redmond sait en inventer.

Quand à ton "traitement de texte" (je suppose que tu veux dire "éditeur
de code", parce que je ne vois pas le rapport entre traitement de texte
et programmation...), s'il ne sait pas reconnaître et afficher un BOM,
c'est qu'il ne vaut pas tripette => mauvais éditeur, changer d'éditeur.

Donc pour un site qui n'utilisera que des langues européennes il vaut
mieux se contenter de l'ISO-8859-1 (ou 15).



Pas mon avis. Le meilleur moyen que je connaisse à ce jour pour ne pas
avoir de pb d'encodage est d'utiliser systématiquement utf8 à toutes les
étapes de la chaine.
Avatar
Bruno Desthuilliers
BertrandB a écrit :
Patrick Texier a écrit :

On n'utilise pas un traitement de textes mais un éditeur de texte pour
développer.



Tiens il y avait longtemps que je ne m'étais pas fait traité de demeuré.

Un truc qui se baserait sur le BOM UTF-8, on le jette.



Le problème ne se pose pas effectivement quand on a les bons outils et
que l'on travaille seul sur un site.



???

Maintenant j'ai été confronté à des ajours sur un site qui ont été fait
avec notepad et wordpad. J'ai proposé à la personne concerné d'utiliser
un véritable éditeur de texte mais en attendant je me suis palucher
plusieurs page à devoir corriger les accents.



man iconv
Avatar
Olivier Miakinen
Le 17/03/2008 10:12, Bruno Desthuilliers a écrit :

[ la réponse que je m'apprétais à faire, que ce soit à propos de
l'ânerie qu'est un BOM pour UTF-8, de sa mauvaise opinion des
éditeurs de texte qui ne savent pas les gérer comme il faut, ou
de l'intérêt d'utiliser UTF-8 à toutes les étapes de la chaîne ]



Je n'ai donc rien à ajouter.
Avatar
romer
Bruno Desthuilliers
wrote:

Pas mon avis. Le meilleur moyen que je connaisse à ce jour pour ne pas
avoir de pb d'encodage est d'utiliser systématiquement utf8 à toutes les
étapes de la chaine.



TaF.
Et en plus que les utilisateurs des navigateurs aient l'idée de placer
la commande "encodage de texte" sur "defaut" sinon charabia assuré.
--
A+

Romer
Avatar
Olivier Miakinen
Le 17/03/2008 19:18, Bernd a écrit :

[ utiliser systématiquement utf8 ]



Et en plus que les utilisateurs des navigateurs aient l'idée de placer
la commande "encodage de texte" sur "defaut" sinon charabia assuré.



Tu veux dire qu'il existerait des utilisateurs qui forceraient un jeu de
caractères particulier en lecture, différent de UTF-8, indépendamment de
ce qu'annoncent les entêtes HTTP ? Si vraiment il en existe, ils doivent
être bien malheureux à ne pouvoir surfer nulle part (à commencer par les
moteurs de recherche comme Google ou les portails comme Yahoo).
Avatar
romer
Olivier Miakinen <om+ wrote:

Tu veux dire qu'il existerait des utilisateurs qui forceraient un jeu de
caractères particulier en lecture, différent de UTF-8, indépendamment de
ce qu'annoncent les entêtes HTTP ?



Le entêtes ne sont pas vérifiés par beaucoup de monde.
J'ai vu pas mal de navigateurs où iso-latin-1 était sélectionné.
Je suppose que un jour ou l'autre, ces utilisateurs sont tombés sur un
ou plusieurs site mal ou pas encodés du tout et ils ont remarqué les
signes cabalistiques habituels. En bricolant l'encodage, ils ont trouvé
que ça marchait avec iso-latin-1 et du coup ils se sont dit que c'était
cela qui convenait le moins mal même si les sites bien encodés
présentaient à leur tour les glyphes bizarres.

La preuve ici par exemple :

<http://www.e-leclerc.com/voyages/ete2008/index.asp>

Chez moi ça déjante côté accents...
--
A+

Romer
Avatar
BertrandB
Bruno Desthuilliers a écrit :
BertrandB a écrit :
Patrick Texier a écrit :

On n'utilise pas un traitement de textes mais un éditeur de texte pour
développer.



Tiens il y avait longtemps que je ne m'étais pas fait traité de demeuré.

Un truc qui se baserait sur le BOM UTF-8, on le jette.



Le problème ne se pose pas effectivement quand on a les bons outils et
que l'on travaille seul sur un site.



???



oui lorsque q'une partie du site est mis à jour par une ou plusieurs
personnes qui utilise une ou plusieurs plateforme ...


Maintenant j'ai été confronté à des ajours sur un site qui ont été
fait avec notepad et wordpad. J'ai proposé à la personne concerné
d'utiliser un véritable éditeur de texte mais en attendant je me suis
palucher plusieurs page à devoir corriger les accents.



man iconv




va dire ça à ma cliente tiens ... petit plaisantin
Avatar
BertrandB
Bruno Desthuilliers a écrit :

Quand à ton "traitement de texte" (je suppose que tu veux dire "éditeur
de code", parce que je ne vois pas le rapport entre traitement de texte
et programmation...), s'il ne sait pas reconnaître et afficher un BOM,
c'est qu'il ne vaut pas tripette => mauvais éditeur, changer d'éditeur.



Oh si je n'ai pas fourchelangué ...
Ma cliente a réussi à me modifier un ficher avec word ... et je ne
racontes pas tout.
Avatar
Olivier Miakinen
Le 17/03/2008 19:58, Bernd a écrit :

Tu veux dire qu'il existerait des utilisateurs qui forceraient un jeu de
caractères particulier en lecture, différent de UTF-8, indépendamment de
ce qu'annoncent les entêtes HTTP ?



Le entêtes ne sont pas vérifiés par beaucoup de monde.



Mais si, il suffit qu'il y en ait.

La preuve ici par exemple :

<http://www.e-leclerc.com/voyages/ete2008/index.asp>



- pas de charset dans un entête HTTP
- pas de charset dans une déclaration XML
- pas de charset dans un élément META

Ce n'est pas de la faute des visiteurs si le site est mal foutu ! Et la
solution, pour l'auteur du site, n'est évidemment pas de se restreindre
à ISO-8859-1 : c'est d'abord de renseigner l'entête HTTP correctement.

Note qu'un contournement existe *aussi* dans certains navigateurs. Dans
Mozilla, SeaMonkey et Firefox, c'est :
View / Character Encoding / Auto-detect / Universal
ou :
Affichage / Encodage des caractères / Détection automatique / Universel
Avatar
Bruno Desthuilliers
BertrandB a écrit :
Bruno Desthuilliers a écrit :
BertrandB a écrit :
Patrick Texier a écrit :

On n'utilise pas un traitement de textes mais un éditeur de texte pour
développer.



Tiens il y avait longtemps que je ne m'étais pas fait traité de demeuré.

Un truc qui se baserait sur le BOM UTF-8, on le jette.



Le problème ne se pose pas effectivement quand on a les bons outils
et que l'on travaille seul sur un site.



???



oui lorsque q'une partie du site est mis à jour par une ou plusieurs
personnes qui utilise une ou plusieurs plateforme ...



J'ai l'habitude de travailler à plusieur sur les mêmes sites, certains
sous Windows (différentes variantes), certains sous MacOS X, certains
sous Linux (différentes distribs).


Maintenant j'ai été confronté à des ajours sur un site qui ont été
fait avec notepad et wordpad. J'ai proposé à la personne concerné
d'utiliser un véritable éditeur de texte mais en attendant je me suis
palucher plusieurs page à devoir corriger les accents.



man iconv




va dire ça à ma cliente tiens ... petit plaisantin



Non, je te le dis à toi. Mais bon, si tu préfères continuer à te
"palucher" ça à la mano, hein...
1 2 3 4 5