Le bon charset...

METIS

15/12/2008 à 10:06

Mickaël Wolff wrote:

METIS a écrit :
...Que tu es sur Linux et tant que codeur, ça m'étonne pas !!
(;o)))))

Comme s'il n'y avait que Linux dans la vie :D

Tiens salut toi ; tu viens pas nous parler de BeOS quand même?(;o))))))))

--
<|[;o)) METIS
http://www.graphM.com
Pour m'écrire en privé,
moi c'est metis15 et
je tourne à l'Oranges...

METIS

15/12/2008 à 12:15

SAM wrote:

Le 12/13/08 6:01 PM, METIS a écrit :
(je remets le lien)
http://img339.imageshack.us/my.php?image=prefdwcs3ec2.jpg

Ou bien tu le fais exprès pour nous distraire.

Ah que non coco...

- 3 à 6 mois de congès dans les îles

Avec plaisir, windsurf, 30° (Nouméa) nanas bronzées, encore quelques
potes...

Pour en revenir à ta capture-écran,
ça m'a l'air tout bon si tu veux vraiment de l'UTF-8,

Oui, quand on veut de l'UTF-8, c'est le mieux en effet.
Mais pour mon envoi de form>email, 8859 allait mieux

- je cocherais la case "no BOM"

J'ai pas ça, j'ai :
"Inclure une signature Unicode (BOM)" à cocher ou pas.
Pas coché par défaut, donc je laisse...

- je mettrais "C" à "Formulaire de normalisation"
Vu que je ne sais pas de quoi ils causent, je suis allé voir :
<http://livedocs.adobe.com/dreamweaver/8_fr/using/wwhelp/wwhimpl/common/html/wwhelp.htm?context=LiveDocs_Parts&file_pag34.htm>

OK !!!

--
<|[;o)) METIS
http://www.graphM.com
Pour m'écrire en privé,
moi c'est metis15 et
je tourne à l'Oranges...

Pascale

15/12/2008 à 12:18

Olivier Miakinen <om+ écrivait
news:49441749$:

Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le
document ci-dessus, et aussi dans la doc de ma propre page (cliquer
sur « documentation » tout en bas) :
<cit. http://www.miakinen.net/vrac/charsets/>

Hop, un signet sur cette page.

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾,
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et œ, voire Œ...

Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne
rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤
ou un ½ directement plutôt qu'avec € ou &oelig; ça risque de ne
pas marcher et tu pourrais t'arracher les cheveux pour comprendre
pourquoi.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI
- UTF8 (sans BOM) (?)
- UTF8
- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½
directement, laisse l'encodage comme il est, si ce n'est que tu peux
bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le
faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans
ton éditeur, de façon tout aussi inappropriée que le nom ANSI).

Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne
changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux
de quoi il retourne.

--
Pascale

Olivier Miakinen <om+news@miakinen.net> écrivait
news:49441749$1@neottia.net:

Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le
document ci-dessus, et aussi dans la doc de ma propre page (cliquer
sur « documentation » tout en bas) :
<cit. http://www.miakinen.net/vrac/charsets/>

Hop, un signet sur cette page.

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾,
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et œ, voire Œ...

Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne
rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤
ou un ½ directement plutôt qu'avec € ou &oelig; ça risque de ne
pas marcher et tu pourrais t'arracher les cheveux pour comprendre
pourquoi.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI
- UTF8 (sans BOM) (?)
- UTF8
- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½
directement, laisse l'encodage comme il est, si ce n'est que tu peux
bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le
faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans
ton éditeur, de façon tout aussi inappropriée que le nom ANSI).

Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne
changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux
de quoi il retourne.

--
Pascale

Vous avez filtré cet utilisateur ! Consultez son message

Olivier Miakinen <om+ écrivait
news:49441749$:

Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le
document ci-dessus, et aussi dans la doc de ma propre page (cliquer
sur « documentation » tout en bas) :
<cit. http://www.miakinen.net/vrac/charsets/>

Hop, un signet sur cette page.

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾,
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et œ, voire Œ...

Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne
rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤
ou un ½ directement plutôt qu'avec € ou &oelig; ça risque de ne
pas marcher et tu pourrais t'arracher les cheveux pour comprendre
pourquoi.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI
- UTF8 (sans BOM) (?)
- UTF8
- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½
directement, laisse l'encodage comme il est, si ce n'est que tu peux
bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le
faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans
ton éditeur, de façon tout aussi inappropriée que le nom ANSI).

Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne
changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux
de quoi il retourne.

--
Pascale

Pascale

15/12/2008 à 12:21

SAM écrivait
news:49442966$0$871$:

Un Permis de Conduire ?
Un Permis de Construire ?
Un Permis de Chasse ?
Un Permis de C...r ? (c'est en projet au Sénat)
Un Projet de Circulaire (en utf-72)
Un Pote à Charenton ?
Un Poêle à Charbon ?
Une Poêle à Crèpes ?

Un Poil au C.. ?

Non ?

Ahhhhem...
oui, bon, je sais, la sortie est par là --------> x

--
Pascale

Pascale

15/12/2008 à 12:28

"METIS" écrivait
news:49461f7f$0$892$:

Avec le captcha, la sécurité me suffit.

Je hais les captcha. Sincèrement.

--
Pascale

METIS

15/12/2008 à 12:31

Pascale wrote:

"METIS" écrivait
news:49461f7f$0$892$:

Avec le captcha, la sécurité me suffit.

Je hais les captcha. Sincèrement.

Qu'as-tu de mieux ?

--
<|[;o)) METIS
http://www.graphM.com
Pour m'écrire en privé,
moi c'est metis15 et
je tourne à l'Oranges...

Pierre Goiffon

15/12/2008 à 12:46

Olivier Miakinen wrote:

Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252.

Je ne l'ai pas compris ainsi !

Ansi semble désigner le codage utilisé par défaut dans l'interface
graphique. J'ai pu constater que sur un poste d'Europe de l'Est (je veux
dire Windows localisé), c'est Ansi correspond à Windows-1251...
Je vois que c'est ce que tu semble indiquer plus bas dans ta réponse
Olivier, mais je préfère ne pas laisser le doute...

Il y a aussi OEM, qui semble correspondre au codage utilisé en console.
Par défaut CP-850 ?

Mais ce que je ne comprends pas, ce sont les différents
niveaux de déclaration. Ce que je n'arrive pas à comprendre, c'est qui fait
quoi : mes programmes sont censés être enregistrés en ANSI, mais je mets
ISO-8859-15 dans mes en-têtes, ainsi que dans l'en-tête des mails envoyés
par la fonction mail de PHP.

Tout ira bien si tu n'utilises que la partie commune entre Windows-1252
(ANSI donc) et ISO-8859-15.

(...)

Mais tu dois savoir que si tu veux un jour écrire un € ou
un œ directement plutôt qu'avec € ou &oelig; ça risque de ne pas
marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.

On peut aussi déclarer Windows-1252... C'est un codage Microsoft et qui
a évolué au fil du temps.
Cependant, il semble très largement implémenté !

Olivier Miakinen

15/12/2008 à 12:50

Le 15/12/2008 09:57, METIS a écrit :

Actuellement, j'envoie avec ça :
http://cjoint.com/?mpkP7KIILS

http://cjoint.com/data/mpkP7KIILS_php_envoi_email.txt

L'image devient à peu près nette en UTF-16 petit-boutiste, et il
s'affiche alors :
[...] éventuellement suivis d'entętes mails [...]
et aussi :
[...] les champs ŕ vérifier [...]

???

Olivier Miakinen

15/12/2008 à 13:06

Le 15/12/2008 12:18, Pascale a écrit :

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ]
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et ½, voire ¼...

Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en
ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies
sous forme d'entités HTML, auquel cas on se fiche de savoir si tu
déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces
trois caractères ?

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI

C'est donc Windows-1252.

- UTF8 (sans BOM) (?)
- UTF8

Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte
order mark », ne sert vraiment que pour distinguer les encodages de type
UTF-16 (ou UCS-2) « big endian » ou « little endian ».

- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à
<http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais
je la trouve malgré tout facile à lire.

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

Ça, cela concerne les fins de ligne.
Format Windows : CR+LF (0D 0A)
Format Unix : LF seul (0A)
Format Mac : CR seul (0D)

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]

Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que
c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma
fille à l'école.

Le 15/12/2008 12:18, Pascale a écrit :

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ]
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et ½, voire ¼...

Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en
ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies
sous forme d'entités HTML, auquel cas on se fiche de savoir si tu
déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces
trois caractères ?

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI

C'est donc Windows-1252.

- UTF8 (sans BOM) (?)
- UTF8

Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte
order mark », ne sert vraiment que pour distinguer les encodages de type
UTF-16 (ou UCS-2) « big endian » ou « little endian ».

- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à
<http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais
je la trouve malgré tout facile à lire.

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

Ça, cela concerne les fins de ligne.
Format Windows : CR+LF (0D 0A)
Format Unix : LF seul (0A)
Format Mac : CR seul (0D)

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]

Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que
c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma
fille à l'école.

Vous avez filtré cet utilisateur ! Consultez son message

Le 15/12/2008 12:18, Pascale a écrit :

Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ]
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.

Sauf l'euro, parfois, et ½, voire ¼...

Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en
ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies
sous forme d'entités HTML, auquel cas on se fiche de savoir si tu
déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.

De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...

... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces
trois caractères ?

Je ne sais pas si Notepad++ connaît ISO-8859-15.

Non, il propose :
- ANSI

C'est donc Windows-1252.

- UTF8 (sans BOM) (?)
- UTF8

Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte
order mark », ne sert vraiment que pour distinguer les encodages de type
UTF-16 (ou UCS-2) « big endian » ou « little endian ».

- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)

Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à
<http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais
je la trouve malgré tout facile à lire.

Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac

Ça, cela concerne les fins de ligne.
Format Windows : CR+LF (0D 0A)
Format Unix : LF seul (0A)
Format Mac : CR seul (0D)

ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.

Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]

Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que
c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma
fille à l'école.

Bruno Desthuilliers

15/12/2008 à 13:13

METIS a écrit :

SAM wrote:
Le 12/13/08 6:01 PM, METIS a écrit :

(snip)

- je cocherais la case "no BOM"

J'ai pas ça, j'ai :
"Inclure une signature Unicode (BOM)" à cocher ou pas.
Pas coché par défaut, donc je laisse...

Surtout pas de BOM sur de l'utf-8. Le BOM n'a de sens que pour des
encodages UTF-16 et plus, et comme c'est un caractère (non imprimable,
et non affiché par pas mal d'éditeurs...) en tout début de fichier,
c'est une source d'emm... en PHP.

Le bon charset...

10 réponses

Veuillez sélectionner un problème