OVH Cloud OVH Cloud

UTF8

12 réponses
Avatar
Prakash Countcham
Bonjour,

Les mails en UTF 8 que je lis avec Emacs ne sont pas correctement
affichés. Pourtant j'avais cru que ucs-tables suffisait. Qu'ai-je donc oublié ?

--
Prakash

PS : Si ça peut aider, j'utilise debian Sarge et j'ai mis ceci dans mon
.emacs :

(set-language-environment "Latin-9")
(setq selection-coding-system 'compound-text-with-extensions)
(standard-display-european 1)
(require 'ucs-tables)
(unify-8859-on-encoding-mode 1)
(unify-8859-on-decoding-mode 1)
(set-input-mode (car (current-input-mode))
(nth 1 (current-input-mode)) 0)

10 réponses

1 2
Avatar
lhabert
Prakash Countcham :

Les mails en UTF 8 que je lis avec Emacs ne sont pas correctement
affichés.



Tu les lis via quoi? Gnus? VM? Autre chose? Ils ont un content-type
correct? Qu'entends-tu par mal affiché?
Avatar
Prakash Countcham
--=-=- Content-Type: text/plain; charset=iso-8859-1
Content-Transfer-Encoding: 8bit

(Luc Habert) writes:
Tu les lis via quoi? Gnus? VM? Autre chose?



J'utilise Gnus.

Ils ont un content-type correct?



Comment le savoir si un content-type est correct ? J'ai pris deux mails où
j'ai des problèmes :

Content-Type: text/plain; charset=UTF-8
Content-Type: multipart/signed; micalg=sha1; protocol="application/x-pkcs7-signature"; boundary="=-ahrIbASzHF65eh/3NMsl"

Qu'entends-tu par mal affiché?



Voir des images jointes (j'espère qu'elles sont acceptées sur le groupe).

--=-=- Content-Type: image/png
Content-Disposition: inline; filename=im1.png
Content-Transfer-Encoding: base64
Content-Description: text/plain

iVBORw0KGgoAAAANSUhEUgAAARQAAAAVCAYAAACHWxFoAAAABmJLR0QA/wD/AP+gvaeTAAAACXBI
WXMAAAsTAAALEwEAmpwYAAAAB3RJTUUH1AkbEh0a0t+kDgAAAB10RVh0Q29tbWVudABDcmVhdGVk
IHdpdGggVGhlIEdJTVDvZCVuAAACAklEQVR42u2a0XHDIAyGnZyXyEIskgW6kBfxcu0Tdy7FWALJ
QPN9d31oShGIX0JAHq/X1/cCTez7+9fvIWw4peCn6J99f9/iq152P5EHCQXuSibHgL4r8fayS0IB
AGhkvSrhZ83m7EZzHwutjpG97N5VdY3GM/dhCNv0gegx/lRsn5YEWtcjrkkIW7HvGDDHn1x7yfg8
7IIyoQCMtvt6B3cvu6NsllYU71AkpZX0eJRblBrHHI8yV7bj+CVjLLUpCaqmPw+/SO1K/Fcz35qg
lfye2r0K7pIOWu1q5i7Vafo3TVttdVnSg5VOV8usfub03Oe1WT86vdb22VhKbbSi6uEXqV2J/0Z4
Xi3Z9hyfVZ9SnR7nommrncPZkdFap09Lx2vKw9ZFk9qWZPKWeYziF61dLqv7HE80a2K5RlebqJVO
mysUTbZG0PilVjOtfulld2RdecTv2jpwywzJDvZ//SIpp6Nw06NXi2962Z1BVx7x+2wZsPQpz+OW
PO2zdtFz89D0lcvc0v6sn2WtfGKx03voSnp/1cOut06t18grfv+88mhv+GtLK4vXAu2NuMUNurT0
074seZT20lt9zQtXy8tc+v8WdkvtPO166PSqItBUD1JdWcfvlF+957gE6HRM+GIbAJgxXYXCaxGg
UxIKAHDkAQAgoQAACQUASCgAAMuy/ADL8WNcp6uEwQAAAABJRU5ErkJggg= --=-=- Content-Type: image/png
Content-Disposition: inline; filename=im2.png
Content-Transfer-Encoding: base64
Content-Description: multipart/signed

iVBORw0KGgoAAAANSUhEUgAAAWQAAAAQCAYAAAAh3wVDAAAABmJLR0QA/wD/AP+gvaeTAAAACXBI
WXMAAA9hAAAPYQGoP6dpAAAAB3RJTUUH1AkbEiAUX4/BtwAAAB10RVh0Q29tbWVudABDcmVhdGVk
IHdpdGggVGhlIEdJTVDvZCVuAAACSklEQVR42u1cW66DIBBV4ypckEu4G+i6upFuzvuFMQZkXsCA
5yRNWkLtvM4wA9Z527bjOP4moE/8fp9p37/n+2mazs8AAH70xY9Zk5CvygIAAAA6rKlEG7DvXyRe
5xXAFTk/3X0LAL0VXpxKtzd+LHdhgvHD666Qp+QzShLVIPjpunhS5j/NHcXOwJg84iTK3vix5pT1
lpQBLGqA3wQIfuhw7iFL2hLKd6gtQMwQ9814y2C5tj0UGXNzYm3UfayEHjE/pPySm8eRL7atRbGP
ha45O5fwr4bYVxmeDpieWvEWPOLYhMMPC1uH2KX6tjY/pHGlSsilEgVnzHovivK7HvWgyBcLKqoe
Ghty5JMWAqkxS/9q/JFa1CRjteMvN58jH8UfltxtyQ9JXK0lS//U9gdFmVptUk5GrR4lWifN75aQ
OWYfqzgo3W5by/d0vRF5xJXPUp4ScWUln9Rva2lnUY3APQ0dfV9Jsn0kmVPDzt73rUeRzzuPvNvQ
mh+SuFop2Vu66nBPQ0u29TWTY+1Ao/qslR7ek8JI8nnm0dv4Ibneksvq0uoh1aZRx2pVNzF9r4bk
6KGRbdQqUmO/Grazli92Peq1UhWaZx6l9G3RebVcfGKdCcdH4Zbj6D/1LE+cqZvk1NXFsiXjntRy
5YudrlvqkZLb6hQ7V3lxqgLrVpp6F0NurKZ8lDsZNPFiySPrOzK4/qDYNsfdlvyQzpvf/CwL/AMR
QKwBnuJjgSkAAAB8LNavrZBxGg0gzgBvmPH4TQDoo3rC41XHxz8sGvAWQxOo5AAAAABJRU5ErkJg
gg= --=-=- Content-Type: text/plain; charset=iso-8859-1
Content-Transfer-Encoding: 8bit


Les caractères accentués sont remplacé par deux caractères bizarres.

--
Prakash

--=-=-=--
Avatar
Eric Marsden
"pc" == Prakash Countcham writes:











pc> Les mails en UTF 8 que je lis avec Emacs ne sont pas
pc> correctement affichés. Pourtant j'avais cru que ucs-tables
pc> suffisait. Qu'ai-je donc oublié ?

pc> (set-language-environment "Latin-9")
pc> (setq selection-coding-system 'compound-text-with-extensions)
pc> (standard-display-european 1)

il faudrait supprimer cette dernière ligne, qui ne devrait plus être
utilisée. L'autre point qui peut poser problème (affichage de
caractères par des rectangles vides) est le choix d'une police
adaptée au iso10646-1; cf

<URL:http://www.emacswiki.org/cgi-bin/wiki/DisplayingNonAsciiCharacters>

--
Eric Marsden <URL:http://www.laas.fr/~emarsden/>
Avatar
Georges Ko
Prakash Countcham a ecrit :

Les caractères accentués sont remplacé par deux caractères bizarres.



« Ã© » et « Ãª » codés en ISO 8859-1 correspondent à « é » et
« ê » codé en UTF-8.

Pour en avoir le coeur net, il faudrait d'abord aller voir comment
ces courriers sont vraiment codés (dans le fichier).

Pour vérifier si votre configuration affiche correctement l'UTF-8,
vous pouvez faire un tour dans fr.lettres.langue.chinoise et voir si
le 1er article UTF-8 du fil « Enquête sur les paysans chinois » passe
bien (caractères accentués et chinois simplifiés).

Georges
--
Georges Ko 2004-09-28
Si vous n'etes pas dans ma liste blanche, ajoutez [m2gko] dans le sujet de
votre courrier.
Avatar
Prakash Countcham
Bonjour,

Georges Ko writes:
« Ã© » et « Ãª » codés en ISO 8859-1 corres pondent à « é » et
« ê » codé en UTF-8.



C'est ce que j'avais pu comprendre d'après le contexte.

Pour en avoir le coeur net, il faudrait d'abord aller voir comment
ces courriers sont vraiment codés (dans le fichier).



C'est-à-dire ?

Pour vérifier si votre configuration affiche correctement l'UTF-8,
vous pouvez faire un tour dans fr.lettres.langue.chinoise et voir si
le 1er article UTF-8 du fil « Enquête sur les paysans chinois » pas se
bien (caractères accentués et chinois simplifiés).



J'ai regardé le thread en question. Certains articles sont lisibles mais pas
d'autres.

J'arrive à lire : 41529fb3$0$7168$
Mais est illisible.



--
Prakash
Avatar
Georges Ko
Prakash Countcham a ecrit :

« Ã© » et « Ãª » codés en ISO 8859-1 correspondent à « é » et
« ê » codé en UTF-8.



C'est ce que j'avais pu comprendre d'après le contexte.



Oui, donc le codage doit être bon côté envoyeur...

Pour en avoir le coeur net, il faudrait d'abord aller voir comment
ces courriers sont vraiment codés (dans le fichier).



C'est-à-dire ?



Si vous utilisez nnml, regarder le champ « Xref », qui donne le
numéro du fichier. Si le numéro est XXX, alors regarder la tête du
fichier XXX dans le répertoire où sont sauvegardé vos courriers.

vous pouvez faire un tour dans fr.lettres.langue.chinoise et voir si
le 1er article UTF-8 du fil « Enquête sur les paysans chinois » passe



J'ai regardé le thread en question. Certains articles sont lisibles mais pas
d'autres.

J'arrive à lire : 41529fb3$0$7168$
Mais est illisible.



Le 1er est codé en HZ-GB-2312 7 bits, le second en UTF-8
« quoted printable »... Pouvez-vous lire le tout 1er article de ce
fil, qui est en UTF-8 pur jus ? Référence:
<cindre$tbk$.

Est-ce que vous avez essayé:

- dans votre .gnus, mettre:

(setq gnus-summary-show-article-charset-alist
'((1 . iso-8859-1)
(2 . cn-gb-2312)
(8 . utf-8)
(5 . big5)))

et dans le tampon *Summary ...*, taper « C-u 8 g » ?

- d'ouvrir un fichier codé en UTF-8 ?

Georges
--
Georges Ko 2004-09-28
Si vous n'etes pas dans ma liste blanche, ajoutez [m2gko] dans le sujet de
votre courrier.
Avatar
Matthieu Moy
Georges Ko writes:

Si vous utilisez nnml, regarder le champ « Xref », qui donne le
numéro du fichier. Si le numéro est XXX, alors regarder la tête du
fichier XXX dans le répertoire où sont sauvegardé vos courriers.



Il y a surtout C-u g pour afficher le source d'un message.

Notter aussi '1 g' qui permet de choisir l'encodage à la main.

--
Matthieu
Avatar
Prakash Countcham
Georges Ko writes:
Pour en avoir le coeur net, il faudrait d'abord aller voir comment
ces courriers sont vraiment codés (dans le fichier).



C'est-à-dire ?



Si vous utilisez nnml, regarder le champ « Xref », qui donne le
numéro du fichier. Si le numéro est XXX, alors regarder la tête du
fichier XXX dans le répertoire où sont sauvegardé vos courriers.



J'ai essayé de faire
C-u g
1 g utf-8

comme le conseillait Matthieu, mais sans succès (Je continue à voir des 233,
221, etc.)

Le 1er est codé en HZ-GB-2312 7 bits, le second en UTF-8
« quoted printable »... Pouvez-vous lire le tout 1er article de ce
fil, qui est en UTF-8 pur jus ? Référence:
<cindre$tbk$.

Est-ce que vous avez essayé:

- dans votre .gnus, mettre:

(setq gnus-summary-show-article-charset-alist
'((1 . iso-8859-1)
(2 . cn-gb-2312)
(8 . utf-8)
(5 . big5)))

et dans le tampon *Summary ...*, taper « C-u 8 g » ?

- d'ouvrir un fichier codé en UTF-8 ?

Georges
--
Georges Ko 2004-09- 28
Si vous n'etes pas dans ma liste blanche, ajoutez [m2gko] dans le sujet de
votre courrie r.



--
Prakash
Avatar
Prakash Countcham
Désolé, je ne maîtrise pas tout à fait les raccourcis clavier et le message
précédent est parti tout seul.

Georges Ko writes:
Le 1er est codé en HZ-GB-2312 7 bits, le second en UTF-8
« quoted printable »... Pouvez-vous lire le tout 1er article de ce
fil, qui est en UTF-8 pur jus ? Référence:
<cindre$tbk$.



Non, je n'arrive pas à lire le message en question.


Est-ce que vous avez essayé:

- dans votre .gnus, mettre:

(setq gnus-summary-show-article-charset-alist
'((1 . iso-8859-1)
(2 . cn-gb-2312)
(8 . utf-8)
(5 . big5)))

et dans le tampon *Summary ...*, taper « C-u 8 g » ?



Je viens d'essayer, mais ça ne change rien.

- d'ouvrir un fichier codé en UTF-8 ?



Ça ne l'affiche pas correctement non plus.

--
Prakash
Avatar
Georges Ko
Prakash Countcham a ecrit :

Est-ce que vous avez essayé:

- d'ouvrir un fichier codé en UTF-8 ?



Ça ne l'affiche pas correctement non plus.



Je pense que vous devriez essayer de résoudre ce problème avant de
mêler Gnus à tout ça :-).

Pour ma part, j'utilise un vieux Mule-UCS 0.74, ça à l'air
de marcher correctement, alors je ne touche plus à rien...
--
Georges Ko 2004-09-30
Si vous n'etes pas dans ma liste blanche, ajoutez [m2gko] dans le sujet de
votre courrier.
1 2