Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Codes pour caractères non latins

30 réponses
Avatar
Jacques-A
Bonjour,

Pour les lettres accentuées, il existe des codes HTML (par exemple Á s'écrit
À).
Existe-t'il l'équivalent pour les lettres non latines (cyrilique, grec,
hébreu, etc.)?

Merci d'avance.

Jacques

10 réponses

1 2 3
Avatar
Paul Gaborit
À (at) Fri, 03 Aug 2007 10:27:44 +0200,
Pierre Goiffon écrivait (wrote):
[à propos de l'utilisation d'entités dans du HTML]

Paul Gaborit wrote:
Dans le cas particulier où on peut contrôler de manière sûre le codage
des documents (X)HTML, on peut se passer des entités (numériques ou
nommées).



Ce que j'exprimais en vous répondant est que votre postulat de départ
ne doit pas exister : on doit *toujours* pouvoir contrôler le codage
utilisé tout au long de la chaîne de publication !



Dnas l'absolu, c'est tout à fait vrai. Mais la réalité est parfois
moins propre. Le "ne doit pas exister" est un voeux pieux.

Là où j'ai effectivement été un peu abusif, c'est en disant que
pouvoir contrôler le codage de manière sûre était un cas
particulier. C'est plutôt le cas général (quand c'est bien conçu,
utilisé, configuré....).

Ça devrait même être toujours comme ça... mais ça ne l'est
malheureusement pas ! Et on n'a pas toujours moyen d'agir sur le
responsable voire même, tout simplement, de l'identifier.

Ne suffit-il pas d'écrire en cyrilique, grec, hébreu, etc... ?



Oui, cela devrait être aussi simple que cela.



"devrait", on est d'accord... ;-)

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Avatar
Paul Gaborit
À (at) Fri, 03 Aug 2007 14:52:05 +0200,
Pierre Goiffon écrivait (wrote):
Il y a quand même aujourd'hui tous les produits et offres dont on peut
avoir besoin ! Si l'on se retrouve coincé, c'est soit par manque de
compétences, soit parce que l'on s'en fiche !



Avez-vous déjà travaillé pour ou dans de grosses entreprises ou
organisations ? Oui, effectivement certains administrateurs/décideurs
manquent parfois des compétences et d'autres s'en fichent. Mais ceux
qui sont face au problème n'ont parfois aucun moyen de changer cette
situation (parfois ils ne connaissent même pas le nom des personnes
responsables) . Et là, il faut bien qu'ils trouvent une solution quand
même.

Il y a aussi d'autres situations qui ne mettent en cause ni la
compétence ni le professionnalisme des intervenants. Ex: les
administrateurs ont choisi un outil (un seul pour faire simple). Il y
a des bugs dans la version installée et d'autres bugs dans la future
version. Ils doivent donc choisir ! En général, ils choissisent la
version où les bugs sont les moins critiques pour l'activité de
l'organisation. Si les bugs restants concernent le paramètrage du
codage, il faut bien faire avec... S'il y a une compétence à remettre
en cause, c'est celle des développeurs. Mais ils ne font pas partie de
l'organisation. Les administrateurs pourraient aussi décider de
changer de produit, mais cela a un coût !

Et des situations de ce type, c'est monnaie courante. On peut le
déplorer mais c'est la réalité. Il y a donc l'idéal technique vers
lequel on doit tendre. Et puis, il y a le pragmatisme des situations
réelles.

En fait ce que j'enseigne à mes élèves, c'est que dans les systèmes
d'information, il est très rare qu'un problème insoluble soit purement
technique. Dans 99% des cas, à la base, c'est un problème humain. Mais
même en sachant cela, on n'a pas trouver pour autant le moyen de le
résoudre. Et il faut donc parfois accepter de "bricoler" pour que ça
marche en attendant la solution plus pérenne mais impossible à mettre
en oeuvre dans l'immédiat. Et il n'est pas rare de constater qu'une
solution temporaire finit par durer. ;-)

Pour moi le "bricolage" est une nécessité dans toute organisation
(j'ai une collègue qui en a fait son sujet de recherche et son travail
est bien reconnu). Croire qu'on peut s'en passer fait partie des
utopies rationalistes. Cette croyance est aussi l'une des raisons
majeures de la dégradation des relations entre de nombreux services
informatiques et leurs utilisateurs.

Vous conviendrez que j'exprime rarement des avis aussi tranché ici
mais franchement là, il y a de quoi.



Les avis tranchés, j'aime ça... si on peut continuer à discuter. :-)

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Avatar
Paul Gaborit
À (at) Fri, 03 Aug 2007 16:37:02 +0200,
Pierre Goiffon écrivait (wrote):
Paul Gaborit wrote:
Oui, effectivement certains administrateurs/décideurs manquent
parfois des compétences et d'autres s'en fichent. Mais ceux qui
sont face au problème n'ont parfois aucun moyen de changer cette
situation



Je vois assez ce dont vous parlez, évidemment j'y suis confronté aussi
comme tout professionnel.



Bon. Nous sommes déjà d'accord sur le constat.

Mais encore une fois, dans le cadre de la publication sur le Web, on
a toutes les offres possibles pour pouvoir s'en sortir ! Le serveur
toto de l'entreprise est trop fermé ? J'héberge dehors, et ça sera
sans aucun doute moins cher, avec plus de services ! On m'interdit
de faire sortir les données des murs de l'entreprise ? Un serveur en
infogérance. Etc etc.


[...]

Il y a aussi d'autres situations qui ne mettent en cause ni la
compétence ni le professionnalisme des intervenants. Ex: les
administrateurs ont choisi un outil (un seul pour faire simple). Il y
a des bugs dans la version installée et d'autres bugs dans la future
version.



On s'écarte assez du sujet...

Si on confronte cela au marché des CMS, si aujourd'hui on est pieds et
points liés à l'éditeur du produit utilisé c'est qu'on a fait de très
mauvais choix ! Ou qu'on était là trop tôt :) Pour ce dernier exemple,
regardez les ex clients de Spectra ou Vignette... Demandez leur quel
aurait été leur choix s'ils étaient arrivés en 2002 plutôt qu'en 1998
par exemple...

Choisir aujourd'hui un outil de CMS qui ne soit ni open source ni
totalement ouvert (moteur de templates modifiable facilement,
plugins, ...) est une faute : sur ce marché ce sont des
caractéristiques minimum.



Mais le CMS ou le site Web ne sont que deux éléments d'un système
intégré plus global. Souvent l'intégration s'est faite dans la douleur
et nombreux sont ceux qui perçoivent les défauts de l'ensemble. Mais
faire évoluer ce système demande beaucoup d'énergie, de temps et donc
d'argent. Chaque modification d'une brique a un impact sur l'ensemble.
Et puis, on n'est pas toujours maître de ses budgets (informatiques).

Mais là encore, ce n'est que la technique (et les coûts associés) qui
bloquent.

Souvent le vrai blocage vient, par exemple, du responsable
informatique qui ne veut pas reconnaître que son choix n'était pas le
bon, du chef de service qui a décidé que c'était cet outil parce qu'il
avait lu quelque part qu'il était bien, du directeur qui pense que
tout ça ne sert à rien et qu'on ferait mieux d'investir l'argent
utilement, etc.

Evidemment on trouvera toujours une situation bloquée parce que
telle politique globale, parce que tel manager, (...), mais on
revient au point de départ et on a tout intérêt à changer de
travail.



Si la situation le permet. Et puis, parfois cette tâche n'est pas
obligatoirement la tâche principale. Certains sont très heureux dans
leur entreprise et ne veulent pas quitter le navire à cause de ces
quelques petits désagréments. Mais ils veulent quand même bien faire
malgré les blocages qu'ils rencontrent.

En fait ce que j'enseigne à mes élèves, c'est que dans les systèmes
d'information, il est très rare qu'un problème insoluble soit
purement technique. Dans 99% des cas, à la base, c'est un problème
humain. Mais même en sachant cela, on n'a pas trouver pour autant
le moyen de le résoudre. Et il faut donc parfois accepter de
"bricoler" pour que ça marche en attendant la solution plus pérenne
mais impossible à mettre en oeuvre dans l'immédiat.



Et nous parlons ici d'hébergement de site Web, de solution de
publication de contenu : les solutions sont aujourd'hui foison ! Je
ne vois vraiment pas de situation de total bloquage qui "impose" de
mal faire.



J'ai malheureusement rencontré très souvent de telles situations (et
pas qu'au niveau Web et CMS) et dans des entreprises où on ne
soupçonne pas que ça puisse arriver. Souvent le "blocage" n'en est pas
vraiment un : il y a bein un plan d'évolution pour remédier à tous les
défauts... mais il est sur 3 ans, 5 ans voire même 10 ans. Et dans le
service qui sait que ça doit bouger pour eux en 2010, en attendant,
comment font-ils ? Si tous ne vont pas travailler ailleurs et s'ils
décident de faire malgré tout (publier du HTML en arabe par exemple),
il faut qu'ils bricolent. Et dans ce cas, je pense qu'il vaut mieux
les accompagner dans leur bricolage que de les laisser patauger tout
seul. C'est là que nombre de services informatiques ratent la marche
de l'accompagnement du changement.

Attention : le "bricolage", ce n'est pas accepter de "mal faire".
C'est faire au mieux dans un contexte où on ne peut pas tout changer.
Un bon bricolage résiste au temps et supporte très bien les
améliorations du système global. Et surtout, il est connu et reconnu
en tant que "bricolage" (mieux vaut faire des choses imparfaites en
connaissance de cause et à la vue de tout le monde que de ne rien
faire ou de "mal faire" en douce pour éviter que ça se voit et sans
vraiment comprendre si c'est acceptable ou non).

--
Paul Gaborit - <http://perso.enstimac.fr/~gaborit/>
Avatar
Jacques-A
"Pierre Goiffon" a écrit dans le message de news:
46b2e533$0$635$
Jacques-A wrote:
Dans un site sur lequel je travaille avec quelques amis, nous sommes
amenés à citer des mots avec orthographe non latine. >






Vous n'avez toujours pas exprimé les fonctionnalités du site que vous
souhaitez obtenir... aussi il est toujours difficile de répondre plus
avant.



Je pensais pourtant avoir clairement exposé mon problème (mais ma femme me
dit toujours que plus clair que moi c'est impossible....-), mais je vais
résumer la situation:
dans un site "classique" (HTML + PHP + MYSQL), on souhaite pouvouvoir mettre
des termes "non latins". Par exemple, la phrase suivante pourrait être
plausible même si ce n'est pas ce que nous envisageons (je ne suis pas le
rédacteur mais seulement celui qui traduit en HTML le texte voulu et serait
donc incapable de donner une phrase cohérente avec des mots plus longs):

«Je ne cèderai pas d'un IOTA se rapporte à la lettre grèque &iota;» qui est
dans un cadre où le terme de référence est grec (et dont je connais donc le
codage).
Ma question était donc de savoir s'il existe un lexique donnant d'autres
alphabets que latin ou grec (ce qui explique ma référence au cyrique et à
l'hébreu mais sans que ce soit exhaustif).
J'ai déja une première réponse m'indiquent que ma crainte que les codages
tels que &#1495; soient source d'ennui est erronée. Je peux donc partir du
principe que, associés à une police appropriée ces codes fonctionnent
parfaitement.

Cela résout partiellement mon problème en ce sens que cela marchera.
Cependant, alors que le rédacteur connait le nom des lettres (par exemple
cyrilique IA minuscule (qui ressemble à un R inversé) il est incapable de me
dire qu'il a pour code le 044F ce qui donne en HTML &#1103;).
Je cherche donc un moyen de trancoder proprement et en français (ou en
anglais) ces divers lettres (sans être obligé de développer une appli pour
cela).

Je vous remercie donc de vos suggestions.

Jacques


Dans un cadre général, vous omettez dans votre inventaire toutes les
applications en ligne de blog (Wordpress, Dotclear, ...) ou de CMS plus
génériques (Joomla, Spip, Xoops, ...). Il en existe énormément
aujourd'hui, majoritairement en open source, beaucoup sont aussi gratuites
! C'est bien à ces outils de publication de contenu (CMS) que je pensais !
Et ils sont souvent accessibles sans aucune connaissance technique :
plusieurs hébergeurs les proposent pré-installés... Une piste peut être à
creuser pour votre besoin ?

Ensuite, je copie les séquence &#...; ce qui était l'objet de ma question
car j'avais l'impression que c'était moins général que les séquences
genre &Eacute; ou &Agrave;.
A lire les réponses des uns et des autres, je m'inquiétais sante à tort.



A prioris oui : les entités numériques &#nnnn; doivent être correctement
supportées par à peu près tous les navigateurs (même Netscape 4, c'est
dire)
Avatar
Jacques-A
"ASM" a écrit dans le message
de news: 46b26f90$0$27371$
En réponse à Jacques-A qui écrivit, en date du : 2/08/07 9:25, le message
suivant :
Erreur de ma part, j'ai envoyé un peu vite. Le contexte est pour la
sauvegarde en HTML si on veut éviter les codes #numéro.



c'est quoi c'est qui qui sauve en #numéro des trucs écrits en cyrilique,
grec, hébreu, etc... ?


Word, OOo-writer, Netscape Composer, et je pense beaucoup d'autres mais pas
HAP-edit que j'utilise pour le PHP de mes pages.

Jacques
Avatar
Sergio
Jacques-A avait prétendu :
"Pierre Goiffon" a écrit dans le message de news:
46b2e533$0$635$
Jacques-A wrote:
Dans un site sur lequel je travaille avec quelques amis, nous sommes
amenés à citer des mots avec orthographe non latine. >






Vous n'avez toujours pas exprimé les fonctionnalités du site que vous
souhaitez obtenir... aussi il est toujours difficile de répondre plus
avant.



Je pensais pourtant avoir clairement exposé mon problème (mais ma femme me
dit toujours que plus clair que moi c'est impossible....-), mais je vais
résumer la situation:
dans un site "classique" (HTML + PHP + MYSQL), on souhaite pouvouvoir mettre
des termes "non latins". Par exemple, la phrase suivante pourrait être
plausible même si ce n'est pas ce que nous envisageons (je ne suis pas le
rédacteur mais seulement celui qui traduit en HTML le texte voulu et serait
donc incapable de donner une phrase cohérente avec des mots plus longs):

«Je ne cèderai pas d'un IOTA se rapporte à la lettre grèque &iota;» qui est
dans un cadre où le terme de référence est grec (et dont je connais donc le
codage).
Ma question était donc de savoir s'il existe un lexique donnant d'autres
alphabets que latin ou grec (ce qui explique ma référence au cyrique et à
l'hébreu mais sans que ce soit exhaustif).
J'ai déja une première réponse m'indiquent que ma crainte que les codages
tels que &#1495; soient source d'ennui est erronée. Je peux donc partir du
principe que, associés à une police appropriée ces codes fonctionnent
parfaitement.

Cela résout partiellement mon problème en ce sens que cela marchera.
Cependant, alors que le rédacteur connait le nom des lettres (par exemple
cyrilique IA minuscule (qui ressemble à un R inversé) il est incapable de me
dire qu'il a pour code le 044F ce qui donne en HTML &#1103;).
Je cherche donc un moyen de trancoder proprement et en français (ou en
anglais) ces divers lettres (sans être obligé de développer une appli pour
cela).



Si tu es sous Windows, le plus simple (pour utilisation ponctuelle) est
de coder ton site en UTF-8, d'utiliser un éditeur UTF-8 (par exemple
l'excellent SciTe comme éditeur de texte, ou Komposer [ex NVU] comme
éditeur wysiwyg) et d'insérer les caractères exotiques avec
l'utilitaire "table des caractères".

Je suppose sous les autres OS qu'il y a une utilitaire semblable à
"Table des caractères".


--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Jacques-A
"Sergio" a écrit dans le message de
news:
Jacques-A avait prétendu :
"Pierre Goiffon" a écrit dans le message de
news: 46b2e533$0$635$




Bonjour Sergio,


Si tu es sous Windows, le plus simple (pour utilisation ponctuelle) est de
coder ton site en UTF-8, d'utiliser un éditeur UTF-8 (par exemple
l'excellent SciTe comme éditeur de texte, ou Komposer [ex NVU] comme
éditeur wysiwyg)


Je suis effectivement sous Win-XP. Par contre, j'ignore les OS de ceux qui
vont lire les pages en questions (dans le groupe, il y a au moins plusieurs
Win, plusieurs Mac et peut-être l'un ou l'autre sous Linux).

Pour Komposer, je l'aiessayé en son temps mais, comme Word, je suis obligé
de reprendre par un autre éditeur car je ne suis jamais arrivé à gérer
correctement le PHP avant l'émission de l'entête de titre (par exemple, une
demande d'authentification par le navigateur).

et d'insérer les caractères exotiques avec l'utilitaire "table des
caractères".



Sous XP, j'ai la possibilité de changer de langue et même de créer des
claviers pesonnalisés s'ils n'existent pas.


Je suppose sous les autres OS qu'il y a une utilitaire semblable à "Table
des caractères".



Sous Linux, oui. Je ne travaille pas sur Mac.

Jacques


--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org


Avatar
Sergio
Il se trouve que Jacques-A a formulé :

Si tu es sous Windows, le plus simple (pour utilisation ponctuelle) est de
coder ton site en UTF-8, d'utiliser un éditeur UTF-8 (par exemple
l'excellent SciTe comme éditeur de texte, ou Komposer [ex NVU] comme
éditeur wysiwyg)


Je suis effectivement sous Win-XP. Par contre, j'ignore les OS de ceux qui
vont lire les pages en questions (dans le groupe, il y a au moins plusieurs
Win, plusieurs Mac et peut-être l'un ou l'autre sous Linux).



Pour ceux qui vont lire : pas de problèmes : Les normes sont faites
pour ça. UTF-8 est lu par tous les navigateurs modernes, quelque soit
l'OS. Il faut néanmoins installer parfois les tables de caractères
adhoc pour les langues exotiques.

Un bon test pour tout ça :
http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Unicode/Test

Pour Komposer, je l'aiessayé en son temps mais, comme Word, je suis obligé de
reprendre par un autre éditeur car je ne suis jamais arrivé à gérer
correctement le PHP avant l'émission de l'entête de titre (par exemple, une
demande d'authentification par le navigateur).



Donc un éditeur "texte" comme SciTe (ce que j'utilise, dispo sous
Windows et Linux), ou d'autres (les intervenants de ce forum se feront
un plaisir de promouvoir leur éditeur préféré...).

Quelque soit l'éditeur, ne pas oublier de lui dire de ne pas générer le
"BOM", qui peut perturber le serveur.

http://fr.wikipedia.org/wiki/Marque_d%27ordre_des_octets

Sous XP, j'ai la possibilité de changer de langue et même de créer des
claviers pesonnalisés s'ils n'existent pas.

Je suppose sous les autres OS qu'il y a une utilitaire semblable à "Table
des caractères".



Sous Linux, oui. Je ne travaille pas sur Mac.



No problème alors. Sous Linux aussi, tu peux personnaliser ton
clavier...

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Jacques-A
"Sergio" a écrit dans le message de
news:
Il se trouve que Jacques-A a formulé :



Merci beaucoup Sergio,
Je pense que j'ai tout ce qu'il faut pour progresser.

Bon WE,

Jacques


Si tu es sous Windows, le plus simple (pour utilisation ponctuelle) est
de coder ton site en UTF-8, d'utiliser un éditeur UTF-8 (par exemple
l'excellent SciTe comme éditeur de texte, ou Komposer [ex NVU] comme
éditeur wysiwyg)


Je suis effectivement sous Win-XP. Par contre, j'ignore les OS de ceux
qui vont lire les pages en questions (dans le groupe, il y a au moins
plusieurs Win, plusieurs Mac et peut-être l'un ou l'autre sous Linux).



Pour ceux qui vont lire : pas de problèmes : Les normes sont faites pour
ça. UTF-8 est lu par tous les navigateurs modernes, quelque soit l'OS. Il
faut néanmoins installer parfois les tables de caractères adhoc pour les
langues exotiques.

Un bon test pour tout ça :
http://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Unicode/Test

Pour Komposer, je l'aiessayé en son temps mais, comme Word, je suis
obligé de reprendre par un autre éditeur car je ne suis jamais arrivé à
gérer correctement le PHP avant l'émission de l'entête de titre (par
exemple, une demande d'authentification par le navigateur).



Donc un éditeur "texte" comme SciTe (ce que j'utilise, dispo sous Windows
et Linux), ou d'autres (les intervenants de ce forum se feront un plaisir
de promouvoir leur éditeur préféré...).

Quelque soit l'éditeur, ne pas oublier de lui dire de ne pas générer le
"BOM", qui peut perturber le serveur.

http://fr.wikipedia.org/wiki/Marque_d%27ordre_des_octets

Sous XP, j'ai la possibilité de changer de langue et même de créer des
claviers pesonnalisés s'ils n'existent pas.



Je suppose sous les autres OS qu'il y a une utilitaire semblable à
"Table des caractères".



Sous Linux, oui. Je ne travaille pas sur Mac.



No problème alors. Sous Linux aussi, tu peux personnaliser ton clavier...

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org


Avatar
Vincent Lefevre
Dans l'article ,
Sergio écrit:

Pour ceux qui vont lire : pas de problèmes : Les normes sont faites
pour ça. UTF-8 est lu par tous les navigateurs modernes, quelque soit
l'OS. Il faut néanmoins installer parfois les tables de caractères


^^^^^^^^^^^^^^^^^^^^
adhoc pour les langues exotiques.



Tu veux dire des fontes (polices), je suppose. Si elles ne sont pas
installées, alors quelle que soit la méthode choisie pour écrire le
caractère dans le source (caractère brut dans l'encodage du document,
entité numérique, entité nommée), il y aura un problème à l'affichage.

--
Vincent Lefèvre - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / Arenaire project (LIP, ENS-Lyon)
1 2 3