OVH Cloud OVH Cloud

Caractères étranges

60 réponses
Avatar
Trouvetout
Bonjour,


Lorsque l'un de mes destinataires m'envoi un message, celui-ci se présente
comme ceci :

''services rendus liés a l'usage des différents éléments de la chose
louée ''

Donc avec des caractères étranges, s'agit-il d'un virus ? mon Anti-virus à
jour ne détecte rien.

Que puis je lui conseiller ?

Merci de votre aide

Trouvetout

10 réponses

2 3 4 5 6
Avatar
Luc
Fred nous a déclaré...

[...]
Je ne sais pas encore mais je suis en train de lire ceci :
http://www.ietf.org/rfc/rfc2646.txt?number&46


Tiens, sur fr.bienvenue, voilà un extrait de la doc "les bons usages -
quelques données techniques" (je sais, ici on n'est pas sur Usenet mais bon
!) qui confirme le bon usage de l'iso latin 9 et d'aucun codage MIME. C'est
d'ailleurs confirmé ici http://usenetfr.free.fr/faqoe.htm#Format qui dit de
cocher MIME sans codage.... mais rien n'est dit sur UUENCODE !

------------Début de copie------------
Le format et l'encodage des articles

Les articles doivent pouvoir être lus par tout le monde. Parce qu'il
existe de nombreux logiciels et de nombreuses langues, des normes
définissant les jeux de caractères ont été établies.

Pour le français (ainsi que des langues de l'Europe de l'ouest), afin
de lire et d'écrire correctement les caractères spécifiques à la
langue française (voyelles accentuées, ç mais aussi ceux des autres
langues occidentales comme le ß allemand, le ø scandinave ou le ¿
espagnol), ce jeu de caractères s'appelle l'ISO-8859-1 dit aussi
latin1 (ou son petit frère : ISO-8859-15 dit latin9 mais sans
utiliser les caractères qui ne sont pas dans l'ISO-8859-1).
Dans l'état actuel des choses, les autres normes, en particulier
l'UTF8 ou 7 (dit aussi Unicode ou « alphabet universel ») ne
conviennent pas.

Une fois écrit, il faut que votre texte soit transporté en conservant
ces caractères spécifiques. C'est l'encodage des articles qui va le
permettre, il doit se faire sur 8bit. Le Quoted-Printable (QP), la
base64 et tout codage MIME ne conviennent pas (si vous ne pouvez
encoder en 8bit, optez pour 7bit et écrivez sans accent, mais ne
choisissez surtout pas le Quoted Printable).
--------------Fin de copie---------------

--
Cordialement,

Luc Burnouf

adresse de réponse invalide
pour me joindre --> http://cerbermail.com/?1bU8V4YO3y

Avatar
Luc
Fred nous a déclaré...

Laisse tomber pour la page de lecture. Ce n'est pas ce que l'on
attend. Je ferai des recherches plus tard.
Cela dit, je pense que tu as raison. Mieux vaut que le charset
apparaisse en clair, et c'est le cas avec MIME.
Par contre j'ai souvent remarqué des messages postés avec OE sans
charset de spécifié. Alors ??


Bon, j'étais parti dans une autre direction de recherche. Il semble qu'il y
ait des choses très intéressantes à lire ici
http://www.usenet-fr.news.eu.org/fr.usenet.reponses/accents.html.

Pour ce soir j'arrête.
Tu as vu que dans tout cela on n'avait pas répondu à la qestion
initiale ;-)


Ouaip !!! LOL

Trouvetout, avec un pseudo comme ça, n'aura pas manqué de relever mon
paramétrage que j'ai donné un peu plus haut et vérifiera que son OE est bien
paramétré pour *tout* lire. ;-)

Bonne fin de soirée.


Pareil

--
Cordialement,

Luc Burnouf

adresse de réponse invalide
pour me joindre --> http://cerbermail.com/?1bU8V4YO3y

Avatar
scraper
Bonjour Fred, dans le message
news:%
tu disais :


D'accord avec ton analyse. Quand il y a *hiéroglyphes* c'est que le
mal est fait et que le post est déjà en ISO ! ou alors c'est qu'on
visualise le post avec MN ;-)


oui
mais pour le même mail original, certains y répondent et on voit des
hiéroglyphes, et d'autres répondent au premier (l'original, pas la réponse)
et c'est correctement représenté ....

peut être le terme "codage" n'est il pas adéquat ? ;-)

mais le fait demeure ;-)



--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper

Avatar
scraper
Bonjour , dans le message
news:
tu disais :


Re' :-D Sur son post :,
Fred épuisé, nous avoue ds un dernier souffle:
:
Quel souk ce problème de codage !!!!
non, mais que c'est rigollo lol rofl



Mais non, c'est intéressant, et puis semble apprécier qu'on
*se batte*. Au passage nous venons de décrocher nos galons d'expert
(galons ou gallons ?) :-)
Cela tombe bien, c'est l'heure de l'Apéro :o) mais avec modération ;-)

PS/ il me semblait qu'il existe un forum spécial-test rofl lol rofl


je ne suis pas certain que ce soient vraiment des tests ? ;-)


--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper



Avatar
scraper
Bonjour Luc, dans le message
news:
tu disais :


Eh non ! ce paramètre décoché ne fonctionne que pour html / texte brut


outils/options/envois/paramètres internationaux ?

ah bon ...


Personnellement, lorsque je réponds à un message en Utf-8, pour
éviter de réexpédier en Utf-8, je recode mon message en latin 9
(quand je n'oublie pas ! ;-) ).


Tu n'auras plus besoin de ne pas oublier ;-)


Ben oui mais non ! ;-)


--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper



Avatar
scraper
Bonjour Fred, dans le message
news:
tu disais :


- onglet 'Envois :
- Format d'envoi des news : texte brut
Paramètres de texte brut :
- MIME, aucun codage, permettre les caractères 8 bits
dans les en-têtes
- Idem pour le format d'envoi du courrier.


C'est là la différence, je ne l'avais pas vue. Je ne suis pas en
MIME. Mais alors qu'est-ce que cela à voir, je ne comprends pas trop.
Je viens de tester et j'ai maintenant exactement le même comportement
que ton OE.
Par contre je repasse en UUENCODE, je préfère *systématiquement*
poster en ISO :-)


j'ai sensiblement pareil que Luc, sauf que je n'autorise pas les en têtes 8
bits
j'avais cru déceler un temps que c'était cela qui mettait la pagaïe dans
certaines réponses à des utf-8 ??
maintenant, je ne suis plus certain de rien



--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper


Avatar
scraper
Bonjour Trouvetout, dans le message
news:uFL017$
tu disais :


Bonjour,


Lorsque l'un de mes destinataires m'envoi un message, celui-ci se
présente comme ceci :

''services rendus liés a l'usage des différents éléments de la
chose louée ''

Donc avec des caractères étranges, s'agit-il d'un virus ? mon
Anti-virus à jour ne détecte rien.

Que puis je lui conseiller ?


essaie, sur ta bécane :

outils/options/lecture/paramètres internationaux
décoche utiliser le codage par défaut pour tous les messages entrants

au fait, quel est il, ton codage par défaut ?



--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper

Avatar
scraper
Bonjour Luc, dans le message
news:
tu disais :


Bon, je me mets en utf-8... voilà !


donc, ma réponse sera aussi en utf-8 ;-)



Voilà mon paramétrage actuel (OE + OE QuoteFix)

- onglet 'Lecture' :
- 'Police...' : Europe occidentale , Latin 9 (iso)
- 'Paramètres internationaux' : Paramètres par défaut 'Latin 9
(iso), 'Utiliser les paramètres par défaut pour tous les messages
entrants' décoché

- onglet 'Envois :
- Format d'envoi des news : texte brut
Paramètres de texte brut :
- MIME, aucun codage, permettre les caractères 8 bits
dans les en-têtes


j'ai zappé les 8 bits
(note que je fréquente pas usenet lol


- Idem pour le format d'envoi du courrier.

Remarque : si je coche ''Utiliser les paramètres par défaut pour tous
les messages entrants', les hiéroglyphes apparaissent dans les
messages en Utf-8


oui
(tiens, j'avais zappé cette partie de ta réponse, et j'ai donné le même
conseil - un peu beaucoup plus tard - à trouvetout

:-(




--

Adresse invalide
Merci de répondre sur le forum ...
http://scraper.chez.tiscali.fr

scraper

Avatar
Fred
Dans le message:,
Fred nous a déclaré...

[...]
Je ne sais pas encore mais je suis en train de lire ceci :
http://www.ietf.org/rfc/rfc2646.txt?number&46


Tiens, sur fr.bienvenue, voilà un extrait de la doc "les bons usages -
quelques données techniques" (je sais, ici on n'est pas sur Usenet
mais bon !) qui confirme le bon usage de l'iso latin 9 et d'aucun
codage MIME. C'est d'ailleurs confirmé ici
http://usenetfr.free.fr/faqoe.htm#Format qui dit de cocher MIME sans
codage.... mais rien n'est dit sur UUENCODE !
------------Début de copie------------
Le format et l'encodage des articles

Les articles doivent pouvoir être lus par tout le monde. Parce qu'il
existe de nombreux logiciels et de nombreuses langues, des normes
définissant les jeux de caractères ont été établies.

Pour le français (ainsi que des langues de l'Europe de l'ouest),
afin de lire et d'écrire correctement les caractères spécifiques à
la langue française (voyelles accentuées, ç mais aussi ceux des
autres langues occidentales comme le ß allemand, le ø scandinave ou
le ¿ espagnol), ce jeu de caractères s'appelle l'ISO-8859-1 dit
aussi latin1 (ou son petit frère : ISO-8859-15 dit latin9 mais sans
utiliser les caractères qui ne sont pas dans l'ISO-8859-1).
Dans l'état actuel des choses, les autres normes, en particulier
l'UTF8 ou 7 (dit aussi Unicode ou « alphabet universel ») ne
conviennent pas.

Une fois écrit, il faut que votre texte soit transporté en conservant
ces caractères spécifiques. C'est l'encodage des articles qui va le
permettre, il doit se faire sur 8bit. Le Quoted-Printable (QP), la
base64 et tout codage MIME ne conviennent pas (si vous ne pouvez
encoder en 8bit, optez pour 7bit et écrivez sans accent, mais ne
choisissez surtout pas le Quoted Printable).
--------------Fin de copie---------------


Bonjour :-)
Très intéressant. C'est ce qui me manquait pour faire le lien entre toutes
les spécifications que j'avais trouvées.
Donc, à l'origine, il n'est pas question de charset dans les en-têtes et le
codage sur 7 bits.
Par extension, le codage sur 8 bits est accepté ce qui permet l'utilisation
(sans le spécifier) de charsets 8 bits comme l'ISO-8859-1 ou ISO-8859-15
mais cela nécessite une entente pour que tout le monde utilise le même.
Par tolérance, le type MIME (qui permet les bêtises comme ils disent) est
aceptée mais n'est pas conforme à l'usage initial de USENET.
Là où je suis surpris, c'est qu'il est recommandé de ne pas utiliser
Quoted-Printable qui est quand même la panacée pour faire passer des
encodages 8 bits (ou plus) sur un support 7 bits (c'est ce qui génère les
séquences de caractères commançant par = et que l'on peut voir dans la
source de certains messages). Mais enfin, comme le support 7 bits n'est plus
très courant, inutile de chercher la petite bête.
Rien n'est dit sur UUENCODE puisque cela concerne le codage des pièces
jointes et non pas du texte. Souviens toi des essais que nous avions faits
suite à un post de Paskal.
Le MIME permet la même chose (relativement aux pièces jointes et html) et en
plus, permet l'encodage des caractères dont le code est supérieur à 127 en
QP ou en base64.
Si j'essaie de positionner les différents éléments cela donne ceci :
un caractère correspond à un code numérique : sur 2 (voir 4) octets pour
l'unicode. Sur un octet pour les jeux ISO et ASCII. L'UTF-8 est une
"compression" de l'unicode sur 1 à 4 octets.
Si le support de transmission supporte le 8 bits, le seul problème que l'on
peut avoir c'est qu'une séquence UTF soit vue comme une séquence de
caractères ISO ou ASCII selon le paramétrage du lecteur, d'où les
hiéroglyphes.
Si le support de transmission ne supporte que le 7 bits (en voie de
disparition), les octets sont tronqués et on doit voir une autre espèce
charabia. Uniquement des caractères de base de l'ASCII-US (0-127)

Donc, en conclusion, il semble que mon paramétrage initial soit le plus
"conforme" à l'USENET (pas de MIME).
Et comme tu as pu le constater, pas de charset de spécifié dans ce cas, cela
me paraissait étrange, mais il semble que cela soit l'usage sur USENET, avec
tous les problèmes que cela peut poser si on ne respecte pas une convention.

Voila, je vais envoyer quelques petits posts sur le groupe test pour
illustrer tout ceci.

NB : pour l'instant je n'ai pas étudier les références pour étayer ce que
j'ai compris mais on doit s'approcher d'une meilleure connaissance de la
chose !
Encore merci pour ton lien :-)


--
Fred


Avatar
Fred
Dans le message:,
Bonjour Fred, dans le message
news:%
tu disais :


D'accord avec ton analyse. Quand il y a *hiéroglyphes* c'est que le
mal est fait et que le post est déjà en ISO ! ou alors c'est qu'on
visualise le post avec MN ;-)


oui
mais pour le même mail original, certains y répondent et on voit des
hiéroglyphes, et d'autres répondent au premier (l'original, pas la
réponse) et c'est correctement représenté ....

peut être le terme "codage" n'est il pas adéquat ? ;-)

mais le fait demeure ;-)


Bonjour,
Tu peux aller voir sur le groupe test. Je viens de balancer une série
d'essais qui confirment ce que j'ai dit à Luc dans mon post de ce matin.
Pour être plus précis :
Quand tu visualise un post UTF-8n deux possibilités : ton lecteur comprend
l'UTF-8 et "interprète" les séquences de caractères correpondantes (c'est le
cas de OE ou 40tude). Ou bien ton lecteur ne comprends pas l'UTF-8 et te
restitue les séquences telles qu'elles apparaissent dans la source du
message. Je n'ai pas étudié le charset utilisé pour visualiser la source des
messages, mais il peut y avoir des différences même avec le charset ISO
Latin-9, en particulier le signe euro.
Quand tu réponds, tu renvoies ce que ton lecteur à affiché, soit dans le
même encodage, soit, comme c'est mon cas, après traduction dans le jeu par
défaut de OE. OE le fait convenablement. MN non. Il renvoie la séquence
initialement UTF-8 en ISO. En d'autres termes, MN renvoie texto ce qu'il y a
dans la source, mais sans spécifier l'encodage, donc quand tu vois une telle
réponse, OE l'affiche en ISO, et cela donne les hiéroglyphes.



--
Fred


2 3 4 5 6