OVH Cloud OVH Cloud

emacs utf-8 et html

4 réponses
Avatar
francois.patte
Bonjour,

Je voudrais écrire des pages html utilisant des caractères avec signes
diacritiques: voyelles longues, lettres comportant des points
souscrits...

Les caractères html sont codés dans ce style:

ḍ Ḍ ṭ Ṭ

Existe-t-il une possibilité avec emacs (et peut-être utf-8) d'écrire
ces caractères de manière lisibles par un humain normal sans avoir une
liste scotchée sur l'écran, chaque fois qu'il faut en utiliser un? Ou
bien faut-il faire un script qui transforme les lettres en question en
code html?

Merci.

François Patte

4 réponses

Avatar
Georges Ko
(François Patte) a ecrit :

Existe-t-il une possibilité avec emacs (et peut-être utf-8) d'écrire
ces caractères de manière lisibles par un humain normal sans avoir une
liste scotchée sur l'écran, chaque fois qu'il faut en utiliser un? Ou
bien faut-il faire un script qui transforme les lettres en question en
code html?



J'utilise Mule-UCS-0.74 avec GNU Emacs 21.3 sur Windows et ça
marche bien (codage directement en UTF-8 dans le fichier).
--
Georges Ko 2004-04-02
Si vous n'etes pas dans ma liste blanche, ajoutez [m2gko] dans le sujet de
votre courrier.
Avatar
francois.patte
Georges Ko wrote in message news:...
(François Patte) a ecrit :

> Existe-t-il une possibilité avec emacs (et peut-être utf-8) d'écrire
> ces caractères de manière lisibles par un humain normal sans avoir une
> liste scotchée sur l'écran, chaque fois qu'il faut en utiliser un? Ou
> bien faut-il faire un script qui transforme les lettres en question en
> code html?

J'utilise Mule-UCS-0.74 avec GNU Emacs 21.3 sur Windows et ça
marche bien (codage directement en UTF-8 dans le fichier).



Merci, je suis content de savoir que ma quète n'est pas vaine; je
n'arrive pas à configurer emacs pour pouvoir m'en servir de cette
manière-là, trop de connaissances me manquent.

J'ai installé le package intlfonts et j'arrive à voir toutes les
écritures de la page HELLO d'emacs et, même, à les imprimer! Mais
j'ère comme une âme en peine dans le menu mule pour arriver à trouver
quelle configuration prendre:

Je voudrais savoir quel "language environment" choisir; j'ai mis utf-8
mais la page d'aide utf-8 ne m'aide absolument pas:

Character sets:
nothing specific to UTF-8

alors?


They correspond to these Emacs character sets:
ascii, latin-iso8859-1, mule-unicode-0100-24ff,
mule-unicode-2500-33ff, mule-unicode-e000-ffff

Lequel choisir? et comment?

Select input method: je ne vois rien qui corresponde à ce que je
cherche! J'ai mis TeX, parce que c'est ce que je connais le mieux,
mais ça ne correspond absolument pas à ce que je connais de Tex:
l'exemple donné dans emacs: 'a, donne bien a-accent-aigu dans le
buffer, mais rien dans un "browser" à part un carré noir! Maintenant
si je tape d d (qui devrait donner un d avec un point au-dessous, ce
qui est affiché dans emacs ne correspond à rien et j'ai toujours un
carré noir dans mozilla....

Voilà! Quelles pistes suivre?

Merci.
Avatar
Matthieu Moy
(Fran?ois Patte) writes:

They correspond to these Emacs character sets:
ascii, latin-iso8859-1, mule-unicode-0100-24ff,
mule-unicode-2500-33ff, mule-unicode-e000-ffff



Attention, les codages mule-quelque-chose sont spécifiques à Emacs, il
y a peu d'espoir d'en tirer quelque chose coté Mozilla ...

Lequel choisir? et comment?



(set-language-environment 'utf-8)

Dans ton ~/.emacs.el dira à Emacs d'utiliser UTF-8 pour sauver les
fichiers.

Tappes par exemple « été » dans un buffer, sauves le, puis regardes le
contenu du fichier avec la commande « cat » dans un terminal configuré
en latin-1 par exemple, tu devrais voir : été.

Maintenant, il faut que tu dises au navigateur que la page est encodée
en UTF-8. En XHTML, on fait comme ça :

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">
<head>
</head>
<body>
Ta page web ici
</body>
</html>

Select input method: je ne vois rien qui corresponde à ce que je
cherche! J'ai mis TeX, parce que c'est ce que je connais le mieux,



Très bien ...

Attention : TeX utilise une méthode un peu particulière pour encoder
les accents : un caractère `é', du point de vue de TeX, est une
superposition de `e' et d'un `'', purement visuelle.

Dans un navigateur ou dans Emacs, le caractère `é' est bien un
caractère à part entière, et le logiciel à besoin d'avoir une police
contenant ce caractère installé pour pouvoir l'afficher.

Si tu n'a pas de police contenant le caractère d d, alors, c'est sans
espoir ... (Et si tu fait des pages web, il faut aussi que le client
ai cette police installée, bien sur ...)

--
Matthieu
Avatar
francois.patte
Matthieu Moy wrote in message news:...
(Fran?ois Patte) writes:

> They correspond to these Emacs character sets:
> ascii, latin-iso8859-1, mule-unicode-0100-24ff,
> mule-unicode-2500-33ff, mule-unicode-e000-ffff

Attention, les codages mule-quelque-chose sont spécifiques à Emacs, il
y a peu d'espoir d'en tirer quelque chose coté Mozilla ...

> Lequel choisir? et comment?

(set-language-environment 'utf-8)

Dans ton ~/.emacs.el dira à Emacs d'utiliser UTF-8 pour sauver les
fichiers.



Peut-on associé cet commande au "style" html-helper, par exemple. J'ai
de mauvais rapport (pour l'instant) avec l'utf-8 qui semble installé
un peu sans précaution avec les distribution redhat (et fedora), et
j'ai beaucoup de mal à faire des choses "portables" vers d'autres
systèmes...

Maintenant, il faut que tu dises au navigateur que la page est encodée
en UTF-8. En XHTML, on fait comme ça :

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">



<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

marche en html

> Select input method: je ne vois rien qui corresponde à ce que je
> cherche! J'ai mis TeX, parce que c'est ce que je connais le mieux,

Très bien ...

Attention : TeX utilise une méthode un peu particulière pour encoder
les accents : un caractère `é', du point de vue de TeX, est une
superposition de `e' et d'un `'', purement visuelle.



Il y a des choses que je ne comprends pas: emacs n'affiche pas
certains caractères saisis en "input method" TeX: pi, int (c'est
l'exemple donné dans "describe input method"), et pour ce que je
cherche à faire, d d donne un d avec un point devant (enfin
presqu'en-dessous, mais devant) alors que &#7693; donne vraiment un d
avec un point dessous. Y a-t-il un moyen de "tripoter" ce fait pour
obtenir ce que je veux.


Dans un navigateur ou dans Emacs, le caractère `é' est bien un
caractère à part entière, et le logiciel à besoin d'avoir une police
contenant ce caractère installé pour pouvoir l'afficher.

Si tu n'a pas de police contenant le caractère d d, alors, c'est sans
espoir ... (Et si tu fait des pages web, il faut aussi que le client
ai cette police installée, bien sur ...)



Pour l'instant, j'essaie avec ce que j'ai (fedora core1) mozilla et
galeon n'ont pas de problème.... (aujourd'hui).

Merci pour toutes ces indications, c'est vraiment utile.

François Patte