mutt, html, charset

Le
Pierre Allken-Bernard
Bonjour,
Quand je lis mais mail avec mutt, et que ceux-ci sont en html, mutt
utilise w3m (normal). Et pour certains de ces mails, les caractères
accentués etc. ne sont pas affichés.
Pour comprendre, j'ai enregistré un de ces mails sous toto.html et j'ai
essayé lynx dessus (lynx semble avoir plus d'options que w3m) :

lynx -dump toto.html
n'affiche aucun caractère accentué.

alors que :
lynx -dump -assume_charset=latin1 -display_charset=utf8 toto.html
affiche le mail correctement.

Pourquoi mutt/w3m ne sait pas m'afficher le mail correctement ?
Ou bien est-ce la faute du mail reçu ?

Merci d'avance.

Pierre

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Dominique Asselineau
Le #20190951
Pierre Allken-Bernard wrote on Sun, Sep 20, 2009 at 10:21:44PM +0200
Bonjour,
Quand je lis mais mail avec mutt, et que ceux-ci sont en html, mutt
utilise w3m (normal). Et pour certains de ces mails, les caractères
accentués etc. ne sont pas affichés.
Pour comprendre, j'ai enregistré un de ces mails sous toto.html et j'ai
essayé lynx dessus (lynx semble avoir plus d'options que w3m) :

lynx -dump toto.html
n'affiche aucun caractère accentué.

alors que :
lynx -dump -assume_charset=latin1 -display_charset=utf8 toto.html
affiche le mail correctement.

Pourquoi mutt/w3m ne sait pas m'afficher le mail correctement ?



Parce que le charset n'est pas spécifié dans l'entête du mail ou dans
l'entête de la pièce jointe ou dans la partie <head> du code HTML, et
que le charset par défaut que tu utilises (probablement UTF-8) n'est
pas le même. C'est pourquoi, en le forçant avec l'option
-assume_charset=latin1, ça marche.

Ou bien est-ce la faute du mail reçu ?



On peut dire comme ça.

Dominique
--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Pierre Allken-Bernard
Le #20191041
>> Pourquoi mutt/w3m ne sait pas m'afficher le mail correctement ?



Parce que le charset n'est pas spécifié dans l'entête du mail ou dans
l'entête de la pièce jointe ou dans la partie <head> du code HTML, et
que le charset par défaut que tu utilises (probablement UTF-8) n'est
pas le même. C'est pourquoi, en le forçant avec l'option
-assume_charset=latin1, ça marche.



Merci. Je viens de faire un test sans l'option -assume_charset mais avec :
lynx -dump -display_charset=utf8 toto.html
et ça marche. Bizarre ?

Pierre

PS : les mails en question semblent provenir de webmail comme gmail.


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Vincent Lefevre
Le #20191541
On 2009-09-20 23:31:45 +0200, Pierre Allken-Bernard wrote:
Merci. Je viens de faire un test sans l'option -assume_charset mais avec :
lynx -dump -display_charset=utf8 toto.html
et ça marche. Bizarre ?



Le lynx.cfg contient peut-être ASSUME_CHARSET:iso-8859-1 ou quelque
chose du genre.

--
Vincent Lefèvre 100% accessible validated (X)HTML - Blog: Work: CR INRIA - computer arithmetic / Arénaire project (LIP, ENS-Lyon)

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Pierre Allken-Bernard
Le #20192341
Vincent Lefevre a écrit :
Le lynx.cfg contient peut-être ASSUME_CHARSET:iso-8859-1 ou quelque
chose du genre.



Oui, en fait lynx dit que c'est son réglage par défaut.
J'ai réglé le problème pour lynx dans ~/.lynxrc :
character_set=UNICODE (UTF-8)

Bizarre que ce ne soit pas le réglage par défaut.

Il ne me reste plus qu'à savoir faire pareil pour w3m ou bien à dire à
mutt d'utiliser lynx plutôt que w3m.

Pierre


--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Pierre Allken-Bernard
Le #20192481
Pierre Allken-Bernard a écrit :
Vincent Lefevre a écrit :
Le lynx.cfg contient peut-être ASSUME_CHARSET:iso-8859-1 ou quelque
chose du genre.



Oui, en fait lynx dit que c'est son réglage par défaut.
J'ai réglé le problème pour lynx dans ~/.lynxrc :
character_set=UNICODE (UTF-8)

Bizarre que ce ne soit pas le réglage par défaut.

Il ne me reste plus qu'à savoir faire pareil pour w3m ou bien à dire à
mutt d'utiliser lynx plutôt que w3m.



Voilà pour w3m : mettre
document_charset ISO-8859-1
dans ~/.w3m/config

Je suppose que cela signifie à w3m qu'il doit considérer par défaut que
les page qu'on lui demande d'afficher sont en ISO-8859-1 sauf si elles
disent le contraire.

Pierre

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Vincent Lefevre
Le #20193171
On 2009-09-21 09:05:13 +0200, Pierre Allken-Bernard wrote:
Oui, en fait lynx dit que c'est son réglage par défaut.
J'ai réglé le problème pour lynx dans ~/.lynxrc :
character_set=UNICODE (UTF-8)

Bizarre que ce ne soit pas le réglage par défaut.



Peut-être parce que le charset par défaut de HTTP est ISO-8859-1.

--
Vincent Lefèvre 100% accessible validated (X)HTML - Blog: Work: CR INRIA - computer arithmetic / Arénaire project (LIP, ENS-Lyon)

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Pierre Allken-Bernard
Le #20196441
Le 21/09/2009 à 11:31:27, Vincent Lefevre a écrit :
> Bizarre que ce ne soit pas le réglage par défaut.
Peut-être parce que le charset par défaut de HTTP est ISO-8859-1.



Peut-être en effet ;)
Bon finalement, j'ai annulé mes changement parce que du coup c'est
d'autres mails qui s'affichent mal.

Pierre

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Franck Delage
Le #20199251
--zhXaljGHf11kAtnf
Content-Type: text/plain; charset=iso-8859-1
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

Salut,

En me basant sur votre discussion, j'ai googlisé et j'ai trouvé un bon
plan :

ajouter dans ~/mailcap :

text/html w3m -I %{charset} -T text/html -dump; copiousoutput

et dans ~/.muttrc :

auto_view text/html

et du coup w3m prend le charset qui va bien.

j'ai testé sur pas mal de mails dans mutt, ça a l'air de bien marcher.

amicalement,

Franck.


--
Franck Delage
Création et hébergements de sites web
www.web82.net

--zhXaljGHf11kAtnf
Content-Type: application/pgp-signature; name="signature.asc"
Content-Description: Digital signature
Content-Disposition: inline

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iEYEARECAAYFAkq4cOAACgkQXLHx8YKDYqEevACgvrjkWsrVNgpim8C3bpM6Gmvd
nhYAn2KbRWQIHE7gzrpp+N345ElxPeaf
=XXjk
-----END PGP SIGNATURE-----

--zhXaljGHf11kAtnf--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Franck Delage
Le #20199471
--IiVenqGWf+H9Y6IX
Content-Type: text/plain; charset=iso-8859-1
Content-Disposition: inline
Content-Transfer-Encoding: quoted-printable

juste deux petites corrections à mon post précédent :

Franck Delage a écrit :
| Salut,
|
| En me basant sur votre discussion, j'ai googlisé et j'ai trouvé un bon
| plan :
|
| ajouter dans ~/mailcap :

c'est bien sûr dans ~/.mailcap

|
| text/html w3m -I %{charset} -T text/html -dump; copiousoutput

est c'est bien évidemment :

text/html;/usr/bin/w3m -I %{charset} -T text/html -dump; copiousoutput

avec le point virgule.

mais sans doute aviez-vous rectifié vous-même...

|
| et dans ~/.muttrc :
|
| auto_view text/html
|
| et du coup w3m prend le charset qui va bien.
|
| j'ai testé sur pas mal de mails dans mutt, ça a l'air de bien marcher.
|
| amicalement,
|
| Franck.
|
|
| --
| Franck Delage
| Création et hébergements de sites web
| www.web82.net



--
Franck Delage
Création et hébergements de sites web
www.web82.net

--IiVenqGWf+H9Y6IX
Content-Type: application/pgp-signature; name="signature.asc"
Content-Description: Digital signature
Content-Disposition: inline

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iEYEARECAAYFAkq4deEACgkQXLHx8YKDYqGU2QCgkMIEi/cRgratLCTYg6JhP75T
evMAn0tgdBQrnkyM889tCX9+rFgcyQq9
=/WDB
-----END PGP SIGNATURE-----

--IiVenqGWf+H9Y6IX--

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Pierre Allken-Bernard
Le #20225141
Franck Delage a écrit :
c'est bien sûr dans ~/.mailcap
text/html;/usr/bin/w3m -I %{charset} -T text/html -dump; copiousoutput
et dans ~/.muttrc :
auto_view text/html
et du coup w3m prend le charset qui va bien.
j'ai testé sur pas mal de mails dans mutt, ça a l'air de bien marcher.



C'est beau, c'est simple, ça marche, merci !

Pierre

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists Vous pouvez aussi ajouter le mot
``spam'' dans vos champs "From" et "Reply-To:"

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers
En cas de soucis, contactez EN ANGLAIS
Publicité
Poster une réponse
Anonyme