Pb de locales (eh oui !)

1 réponse

Nicolas Roudninski

24/03/2005 à 19:50

Bonjour,

J'utilise spamassassin et sa-learn pour filtrer mes mails.
Depuis quelques temps, et sans rien faire de spécial, je reçois des logs
de sa-learn "disant" :
Parsing of undecoded UTF-8 will give garbage when decoding
+entities at /usr/share/perl5/Mail/SpamAssassin/HTML.pm line 182.

J'ai de plus l'impression que sa-learn ne fonctionne pas ou mal : je
reçois pas mal de pollurriels(1) (env une 10ne par jour).

J'ai aussi du mal à comprendre ces locales :
- Pourquoi n'existe-t-il pas une locale "universelle" pour le français
ou les langues accentuées par exemple ? (question bebette ?).
- Et quelle(s) locale(s) utiliser pour éviter les problèmes ?
(j'utilise fr_FR@euro ISO-8859-15 - fr_FR ISO-8859-1 -
fr_FR.UTF-8@euro UTF-8 - fr_FR.UTF-8 UTF-8 )

Bref, si vous avez des adresses ou je pourrais trouver des
explications faciles et claires je suis preneur.

Merci

Cordialement,

Nicolas

(1) : Le petit Dico de la francophonie -
http://www.colba.net/~lorimier/Dico/Dico.htm

--
Nicolas Roudninski
nroudninski@wanadoo.fr

--
Pensez à lire la FAQ de la liste avant de poser une question :
http://wiki.debian.net/?DebianFrench

Pensez à rajouter le mot ``spam'' dans vos champs "From" et "Reply-To:"

To UNSUBSCRIBE, email to debian-user-french-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org

1 réponse

Leopold BAILLY

24/03/2005 à 22:30

Nicolas Roudninski writes:

J'ai aussi du mal à comprendre ces locales :
- Pourquoi n'existe-t-il pas une locale "universelle" pour le français
ou les langues accentuées par exemple ? (question bebette ?).

Parcce qu'au début l'informatique s'est principalement développée aux US et que
pour l'anglais 1 octet c'est largement suffisant pour décrire tous les
caractères (table ASCII sur 7 bits).

Ensuite sont arrivés le reste du monde, qui au lieu de remettre à plat le
système, s'est divisé en zones linguistiques pour qu'on puisse toujours
décrire tous les caractères d'une zone sur 1 octet (tables ISO-* sur 8 bits).

Enfin, mais trop tard, on a pensé à inventer des systèmes d'encodage sur
plusieurs octets pour pouvoir rassembler tous les caractères du monde dan s la
même table (UTF-*).

Je n'ai aucune référence sur le sujet, c'est comme ça que je l'imagin e.

- Et quelle(s) locale(s) utiliser pour éviter les problèmes ?
(j'utilise ISO-8859-15 - fr_FR ISO-8859-1 -
UTF-8 - fr_FR.UTF-8 UTF-8 )

Pour ta locale par défaut ? Ça dépend.

UTF-8 c'est universel, c'est l'avenir ... mais c'est moyennement supporté par
les logiciels et la plupart des gens utilisent ISO-8859-15.

À toi de voir en fonction de l'étendue du spectre des gens avec qui tu
communiques.

Par contre, mieux vaut générer (dpkg-reconfigure locales) toutes les fr _FR*, au
cas où un logiciel (sa-learn ?) en aurait besoin.

Léo.

Pb de locales (eh oui !)

1 réponse

Veuillez sélectionner un problème