OVH Cloud OVH Cloud

[charset iso] codage ou non des accents?

26 réponses
Avatar
DN
Bonjour,

Notre site Internet est en langue francaise avec parfois de l'espagnol,
allemand et angla

Nous déclarons notre site en ISO-8859-15, mais nous continuons à coder en
entité symbolique (exemple avec é = é)

Ma question est : est ce inutile? peut on saisir directement les accents,
apostrophe etc?

J'ai essayé de passer en UFT-8, mais cela est desastreux. Pourquoi? parce
qu'il faut convertir les entité symbolique en UFT-8? ex : é => C389 ?
si oui, je suppose qu'il y a des moulinettes specialisées dans la
conversion?

l'uft-8 est il le futur?

il y a un tableau des caracteres http://www.miakinen.net/vrac/c10/charsets
dont l'auteur fait partie de ce forum. Tres bien mais complexe a comprendre.
Dommage qu'il n'y ai pas de mode operatoire pour comprendre les laisons.etc.

Merci de votre eclaircissement
--
Denis

6 réponses

1 2 3
Avatar
Zyrtox
Patrick Mevzek nous disait :

et lors de la publication sur le web, parmi différentes choses, il y
a passage automatique en UTF8 (et remplacement de l'apostrophe par la
vraie élision française qui a un code à part en UNICODE, mais ca ce
n'est pas iconv qui le fait).



Je ne suis pas certain que le jeu en vaille la chandelle, même si c'est
un élément typographique auquel je suis très attaché. En outre, c'est
fait de façon inégale sur vos sites, ne serait-ce que dans
http://www.dotandco.net, sur le titre de la page d'accueil, par
exemple. J'imagine que c'est une histoire de report du titre de <title>
vers le corps par un PHP ou quelque chose du genre, mais cette
substitution est source d'hétérogénéité typographique. Même sur
<http://www.dotandco.net/newsgroups.fr>, les apostrophes sont
différentes d'un paragraphe à l'autre, dans le corps du texte.

J'ajouterais que si des traitements de texte comme LaTeX peuvent
intelligemment gérer ce genre de choses en choisissant le glyphe
approprié, vous êtes ici soumis à l'aléa du système utilisé et des
polices d'affichage. J'ai déjà remarqué que des polices par défaut sous
un Linux quelconque substituait à l'apostrophe droite l'apostrophe dite
« élégante », alors que ce n'est pas le cas sous Windows par exemple.
Vous me direz, ce n'est pas forcément un problème, juste un
comportement différent.

Je ne parle même pas du cas (tordu) où l'on montre l'élision de la
première syllabe (comme dans « 'tain », pour être un poil trivial), ce
qui peut parfois arriver, en tant que retranscription du langage écrit
ou pour marquer visuellement une prononciation : l'apostrophe doit
alors être retournée et c'est un inconvénient supplémentaire.

Bon d'accord, tout cela peut être considéré comme mineur, j'en
conviens. Toutefois, mettre une entité unicode pour une pauvre
apostrophe, caractère fréquent s'il en est, je ne sais pas si c'est
d'une folle efficience.

Utilisez-vous les guillemets français, au fait ?

--
David (Zyrtox) -+- http://www.gattaca.org
« Se donner du mal pour les petites choses, c'est parvenir aux grandes,
avec le temps. » (Beckett)
Avatar
Zyrtox
loufoque nous disait :

l'uft-8 est il le futur?



Oui, moi je n'utilise plus qu'Unicode pour coder toutes mes chaînes
de caractères.
Ça permet de travailler avec n'importe quel caractère au monde d'une
façon unique.



Moi, ça me fait une belle jambe, je n'ai jamais utilisé le moindre
idéogramme de mandarin pékinois, donc je m'en fiche pas mal. Plus
sérieusement, je trouve que cet argument devrait être limité aux sites
utilisant réellement des caractères « exotiques » pour l'Europe
occidentale. Sinon, l'UTF-8 n'est pas plus le futur par rapport au
Latin-1 que XHTML l'est pour le HTML (hop, c'est reparti pour un tour).

Le Latin-1 a de plus l'avantage d'être beaucoup plus léger, et je ne
vois pas pourquoi on devrait, pour 99 % des sites francophones par
exemple, utiliser l'UTF-8 à la place, si ce n'est pour alourdir la
page.

--
David (Zyrtox) -+- http://www.gattaca.org
« J'ai toujours vu que pour réussir dans le monde, il faut avoir l'air
fou et être sage. » (Montesquieu)
Avatar
Sergio
Pierre Goiffon a émis l'idée suivante :
Sergio wrote:
Nous déclarons notre site en ISO-8859-15, mais nous continuons à coder en
entité symbolique (exemple avec é = &eacute;)

Ma question est : est ce inutile? peut on saisir directement les accents,
apostrophe etc?



Oui, sauf bien sûr ceux qui sortent de la norme



Quelle norme ??



La norme 8859-15, bien sûr...


--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Pierre Goiffon
Zyrtox wrote:
l'uft-8 est il le futur?



Oui, moi je n'utilise plus qu'Unicode pour coder toutes mes chaînes
de caractères.



Moi, ça me fait une belle jambe, je n'ai jamais utilisé le moindre
idéogramme de mandarin pékinois, donc je m'en fiche pas mal.



:)
C'est vrai si l'on se cantonne à l'espagnol, l'anglais, le portugais,
l'allemand, le français, ... Mais il faut quand même avouer que devoir
intégrer des contenus en langue d'Europe de l'Est devient fréquent, par
exemple. Et là, Latin-1 ou 9 ne suffisent plus...

Le Latin-1 a de plus l'avantage d'être beaucoup plus léger



Je parlerai plus volontier de Latin-9 que de Latin-1, déjà. Ensuite, en
effet, plusieurs caractères en UTF-8 seront exprimés sur 2 octets au
lieu d'un seul en Latin-9... Ce qui ajoute donc au poids de la page.
Mais franchement, pour une page en HTML bien structuré et qui pèsera
donc quelques Ko au max...

Mais enfin, le problème que vous soulevez est très pertinent : pourquoi
changer alors que ce que l'on utilise aujourd'hui nous convient très
bien ! (« if it works, don't upgrade »)
A chacun de faire son choix, en connaissance de cause...
Avatar
Olivier Miakinen
Le 08/11/2005 00:09, Zyrtox a écrit :

[...] J'ai déjà remarqué que des polices par défaut sous
un Linux quelconque substituait à l'apostrophe droite l'apostrophe dite
« élégante », alors que ce n'est pas le cas sous Windows par exemple.



Bien qu'anti-Microsoft primaire et bestial, je trouve là qu'ils ont
eu raison de garder dans leurs polices les glyphes droits pour les
caractères ' et " (qui servent en programmation aussi bien à gauche qu'à
droite des chaînes) afin de les distinguer des apostrophes et guillemets
typographiques.

Il ne s'agit d'ailleurs pas que d'un problème d'aspect. Pour ceux qui
font du traitement automatisé de phrases, la sémantique des caractères
est importante. C'est un peu comme si l'on confondait le eszet allemand
(ß) avec le bêta grec.

Cela dit, par flemme j'ai laissé des tas de « single-quotes » dans mes
pages web perso. Faites ce que je dis, ne faites pas ce que je fais,
en somme...

Je ne parle même pas du cas (tordu) où l'on montre l'élision de la
première syllabe (comme dans « 'tain », pour être un poil trivial), ce
qui peut parfois arriver, en tant que retranscription du langage écrit
ou pour marquer visuellement une prononciation : l'apostrophe doit
alors être retournée et c'est un inconvénient supplémentaire.



Oh ! J'ignorais cela. Je me permets de faire suivre vers le groupe
<news:fr.lettres.langue.francaise> où l'on trouve toutes sortes de
spécialistes, y compris de typographie.

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)
Avatar
Olivier Miakinen
Le 08/11/2005 00:13, Zyrtox a écrit :

l'uft-8 est il le futur?



Oui, moi je n'utilise plus qu'Unicode pour coder toutes mes chaînes
de caractères.
Ça permet de travailler avec n'importe quel caractère au monde d'une
façon unique.



Moi, ça me fait une belle jambe, je n'ai jamais utilisé le moindre
idéogramme de mandarin pékinois, donc je m'en fiche pas mal. Plus
sérieusement, je trouve que cet argument devrait être limité aux sites
utilisant réellement des caractères « exotiques » pour l'Europe
occidentale. Sinon, l'UTF-8 n'est pas plus le futur par rapport au
Latin-1 que XHTML l'est pour le HTML (hop, c'est reparti pour un tour).



Je suis globalement d'accord. Celui qui n'utilise que des langues
représentées par Latin1, et dont l'éditeur de texte préféré sauve en
Latin1 par défaut, n'a pas besoin de s'em...der avec UTF-8. Inversement,
celui qui sait qu'il aura à traiter des langues exotiques, et/ou dont
l'éditeur de texte préféré fait de l'UTF-8 comme un charme, peut très
bien choisir de passer à UTF-8 tout de suite.

Tout est question de balance entre les divers avantages de l'un et de
l'autre.

Le Latin-1 a de plus l'avantage d'être beaucoup plus léger, et je ne
vois pas pourquoi on devrait, pour 99 % des sites francophones par
exemple, utiliser l'UTF-8 à la place, si ce n'est pour alourdir la
page.



Là je ne suis pas d'accord. Il y a des tas de bons arguments pour rester
en Latin1, mais le poids des pages n'en est pas un car le surcroît de
poids est quand même assez minime pour ces langues. En revanche, que les
Japonais préfèrent Shift-JIS à UTF-8, c'est beaucoup plus défendable
puisque *tous* leurs caractères ont besoin de plus d'octets en UTF-8
qu'en Shift-JIS.

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)
1 2 3