Bonjour,
comme je ne suis pas un codeur fou, j'utilise Dreamweaver pour composer mes
pages (et non pas Bloc-notes(;o))).
Par défaut, le charset est...
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
Est-ce que c'est pertinent (en général) ?
Vous allez me dire que ça dépend...?
(;o)))))))))
--
<|[;o)) METIS
http://www.graphM.com
Pour m'écrire en privé,
moi c'est metis15 et
je tourne à l'Oranges...
...Que tu es sur Linux et tant que codeur, ça m'étonne pas !! (;o)))))
Comme s'il n'y avait que Linux dans la vie :D
Tiens salut toi ; tu viens pas nous parler de BeOS quand même?(;o))))))))
-- <|[;o)) METIS http://www.graphM.com Pour m'écrire en privé, moi c'est metis15 et je tourne à l'Oranges...
METIS
SAM wrote:
Le 12/13/08 6:01 PM, METIS a écrit :
(je remets le lien) http://img339.imageshack.us/my.php?image=prefdwcs3ec2.jpg
Ou bien tu le fais exprès pour nous distraire.
Ah que non coco...
- 3 à 6 mois de congès dans les îles
Avec plaisir, windsurf, 30° (Nouméa) nanas bronzées, encore quelques potes...
Pour en revenir à ta capture-écran, ça m'a l'air tout bon si tu veux vraiment de l'UTF-8,
Oui, quand on veut de l'UTF-8, c'est le mieux en effet. Mais pour mon envoi de form>email, 8859 allait mieux
- je cocherais la case "no BOM"
J'ai pas ça, j'ai : "Inclure une signature Unicode (BOM)" à cocher ou pas. Pas coché par défaut, donc je laisse...
- je mettrais "C" à "Formulaire de normalisation" Vu que je ne sais pas de quoi ils causent, je suis allé voir : <http://livedocs.adobe.com/dreamweaver/8_fr/using/wwhelp/wwhimpl/common/html/wwhelp.htm?context=LiveDocs_Parts&file_pag34.htm>
OK !!!
-- <|[;o)) METIS http://www.graphM.com Pour m'écrire en privé, moi c'est metis15 et je tourne à l'Oranges...
SAM wrote:
Le 12/13/08 6:01 PM, METIS a écrit :
(je remets le lien)
http://img339.imageshack.us/my.php?image=prefdwcs3ec2.jpg
Ou bien tu le fais exprès pour nous distraire.
Ah que non coco...
- 3 à 6 mois de congès dans les îles
Avec plaisir, windsurf, 30° (Nouméa) nanas bronzées, encore quelques
potes...
Pour en revenir à ta capture-écran,
ça m'a l'air tout bon si tu veux vraiment de l'UTF-8,
Oui, quand on veut de l'UTF-8, c'est le mieux en effet.
Mais pour mon envoi de form>email, 8859 allait mieux
- je cocherais la case "no BOM"
J'ai pas ça, j'ai :
"Inclure une signature Unicode (BOM)" à cocher ou pas.
Pas coché par défaut, donc je laisse...
- je mettrais "C" à "Formulaire de normalisation"
Vu que je ne sais pas de quoi ils causent, je suis allé voir :
<http://livedocs.adobe.com/dreamweaver/8_fr/using/wwhelp/wwhimpl/common/html/wwhelp.htm?context=LiveDocs_Parts&file_pag34.htm>
OK !!!
--
<|[;o)) METIS
http://www.graphM.com
Pour m'écrire en privé,
moi c'est metis15 et
je tourne à l'Oranges...
(je remets le lien) http://img339.imageshack.us/my.php?image=prefdwcs3ec2.jpg
Ou bien tu le fais exprès pour nous distraire.
Ah que non coco...
- 3 à 6 mois de congès dans les îles
Avec plaisir, windsurf, 30° (Nouméa) nanas bronzées, encore quelques potes...
Pour en revenir à ta capture-écran, ça m'a l'air tout bon si tu veux vraiment de l'UTF-8,
Oui, quand on veut de l'UTF-8, c'est le mieux en effet. Mais pour mon envoi de form>email, 8859 allait mieux
- je cocherais la case "no BOM"
J'ai pas ça, j'ai : "Inclure une signature Unicode (BOM)" à cocher ou pas. Pas coché par défaut, donc je laisse...
- je mettrais "C" à "Formulaire de normalisation" Vu que je ne sais pas de quoi ils causent, je suis allé voir : <http://livedocs.adobe.com/dreamweaver/8_fr/using/wwhelp/wwhimpl/common/html/wwhelp.htm?context=LiveDocs_Parts&file_pag34.htm>
OK !!!
-- <|[;o)) METIS http://www.graphM.com Pour m'écrire en privé, moi c'est metis15 et je tourne à l'Oranges...
Pascale
Olivier Miakinen <om+ écrivait news:49441749$:
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le document ci-dessus, et aussi dans la doc de ma propre page (cliquer sur « documentation » tout en bas) : <cit. http://www.miakinen.net/vrac/charsets/>
Hop, un signet sur cette page.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾, mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et œ, voire Œ...
Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤ ou un ½ directement plutôt qu'avec € ou œ ça risque de ne pas marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.
De toutes façons, il m'est impossible de passer comme ça, à la volée en UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose : - ANSI - UTF8 (sans BOM) (?) - UTF8 - UCS-2 Big Endian (?) - UCS-2 Little Endian (?)
Il propose aussi : - Convertir en format UNIX - Convertir en format Mac
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½ directement, laisse l'encodage comme il est, si ce n'est que tu peux bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans ton éditeur, de façon tout aussi inappropriée que le nom ANSI).
Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux de quoi il retourne.
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le
document ci-dessus, et aussi dans la doc de ma propre page (cliquer
sur « documentation » tout en bas) :
<cit. http://www.miakinen.net/vrac/charsets/>
Hop, un signet sur cette page.
Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾,
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et œ, voire Œ...
Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne
rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤
ou un ½ directement plutôt qu'avec € ou œ ça risque de ne
pas marcher et tu pourrais t'arracher les cheveux pour comprendre
pourquoi.
De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose :
- ANSI
- UTF8 (sans BOM) (?)
- UTF8
- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)
Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½
directement, laisse l'encodage comme il est, si ce n'est que tu peux
bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le
faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans
ton éditeur, de façon tout aussi inappropriée que le nom ANSI).
Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne
changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux
de quoi il retourne.
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est une microsofterie pour désigner CP1252. C'est d'ailleurs dit dans le document ci-dessus, et aussi dans la doc de ma propre page (cliquer sur « documentation » tout en bas) : <cit. http://www.miakinen.net/vrac/charsets/>
Hop, un signet sur cette page.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les ¤, ½, ¼ et ¾, mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et œ, voire Œ...
Tout dépend de tes besoins. Tant que ça fonctionne comme ça, autant ne rien changer. Mais tu dois savoir que si tu veux un jour écrire un ¤ ou un ½ directement plutôt qu'avec € ou œ ça risque de ne pas marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.
De toutes façons, il m'est impossible de passer comme ça, à la volée en UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose : - ANSI - UTF8 (sans BOM) (?) - UTF8 - UCS-2 Big Endian (?) - UCS-2 Little Endian (?)
Il propose aussi : - Convertir en format UNIX - Convertir en format Mac
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est simple : si tu te fiches de pouvoir ou non rentrer un ¤ ou un ½ directement, laisse l'encodage comme il est, si ce n'est que tu peux bien le déclarer ISO-8859-1 ; si au contraire tu veux pouvoir le faire, alors choisis UTF-8 (qui est probablement nommé Unicode dans ton éditeur, de façon tout aussi inappropriée que le nom ANSI).
Je crois que je vais appliquer la bonne vieille devise : « Si ça marche, ne changez rien ». Mais grâce à Sam et à toi, je comprends enfin un peu mieux de quoi il retourne.
-- Pascale
Pascale
SAM écrivait news:49442966$0$871$:
Un Permis de Conduire ? Un Permis de Construire ? Un Permis de Chasse ? Un Permis de C...r ? (c'est en projet au Sénat) Un Projet de Circulaire (en utf-72) Un Pote à Charenton ? Un Poêle à Charbon ? Une Poêle à Crèpes ?
Un Poil au C.. ?
Non ?
Ahhhhem... oui, bon, je sais, la sortie est par là --------> x
-- Pascale
SAM <stephanemoriaux.NoAdmin@wanadoo.fr.invalid> écrivait
news:49442966$0$871$ba4acef3@news.orange.fr:
Un Permis de Conduire ?
Un Permis de Construire ?
Un Permis de Chasse ?
Un Permis de C...r ? (c'est en projet au Sénat)
Un Projet de Circulaire (en utf-72)
Un Pote à Charenton ?
Un Poêle à Charbon ?
Une Poêle à Crèpes ?
Un Poil au C.. ?
Non ?
Ahhhhem...
oui, bon, je sais, la sortie est par là --------> x
Un Permis de Conduire ? Un Permis de Construire ? Un Permis de Chasse ? Un Permis de C...r ? (c'est en projet au Sénat) Un Projet de Circulaire (en utf-72) Un Pote à Charenton ? Un Poêle à Charbon ? Une Poêle à Crèpes ?
Un Poil au C.. ?
Non ?
Ahhhhem... oui, bon, je sais, la sortie est par là --------> x
-- <|[;o)) METIS http://www.graphM.com Pour m'écrire en privé, moi c'est metis15 et je tourne à l'Oranges...
Pierre Goiffon
Olivier Miakinen wrote:
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est une microsofterie pour désigner CP1252.
Je ne l'ai pas compris ainsi !
Ansi semble désigner le codage utilisé par défaut dans l'interface graphique. J'ai pu constater que sur un poste d'Europe de l'Est (je veux dire Windows localisé), c'est Ansi correspond à Windows-1251... Je vois que c'est ce que tu semble indiquer plus bas dans ta réponse Olivier, mais je préfère ne pas laisser le doute...
Il y a aussi OEM, qui semble correspondre au codage utilisé en console. Par défaut CP-850 ?
Mais ce que je ne comprends pas, ce sont les différents niveaux de déclaration. Ce que je n'arrive pas à comprendre, c'est qui fait quoi : mes programmes sont censés être enregistrés en ANSI, mais je mets ISO-8859-15 dans mes en-têtes, ainsi que dans l'en-tête des mails envoyés par la fonction mail de PHP.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15.
(...)
Mais tu dois savoir que si tu veux un jour écrire un € ou un œ directement plutôt qu'avec € ou œ ça risque de ne pas marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.
On peut aussi déclarer Windows-1252... C'est un codage Microsoft et qui a évolué au fil du temps. Cependant, il semble très largement implémenté !
Olivier Miakinen wrote:
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est
une microsofterie pour désigner CP1252.
Je ne l'ai pas compris ainsi !
Ansi semble désigner le codage utilisé par défaut dans l'interface
graphique. J'ai pu constater que sur un poste d'Europe de l'Est (je veux
dire Windows localisé), c'est Ansi correspond à Windows-1251...
Je vois que c'est ce que tu semble indiquer plus bas dans ta réponse
Olivier, mais je préfère ne pas laisser le doute...
Il y a aussi OEM, qui semble correspondre au codage utilisé en console.
Par défaut CP-850 ?
Mais ce que je ne comprends pas, ce sont les différents
niveaux de déclaration. Ce que je n'arrive pas à comprendre, c'est qui fait
quoi : mes programmes sont censés être enregistrés en ANSI, mais je mets
ISO-8859-15 dans mes en-têtes, ainsi que dans l'en-tête des mails envoyés
par la fonction mail de PHP.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252
(ANSI donc) et ISO-8859-15.
(...)
Mais tu dois savoir que si tu veux un jour écrire un € ou
un œ directement plutôt qu'avec € ou œ ça risque de ne pas
marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.
On peut aussi déclarer Windows-1252... C'est un codage Microsoft et qui
a évolué au fil du temps.
Cependant, il semble très largement implémenté !
Note que, comme le supposait Stéphane (SAM), la dénomination ANSI est une microsofterie pour désigner CP1252.
Je ne l'ai pas compris ainsi !
Ansi semble désigner le codage utilisé par défaut dans l'interface graphique. J'ai pu constater que sur un poste d'Europe de l'Est (je veux dire Windows localisé), c'est Ansi correspond à Windows-1251... Je vois que c'est ce que tu semble indiquer plus bas dans ta réponse Olivier, mais je préfère ne pas laisser le doute...
Il y a aussi OEM, qui semble correspondre au codage utilisé en console. Par défaut CP-850 ?
Mais ce que je ne comprends pas, ce sont les différents niveaux de déclaration. Ce que je n'arrive pas à comprendre, c'est qui fait quoi : mes programmes sont censés être enregistrés en ANSI, mais je mets ISO-8859-15 dans mes en-têtes, ainsi que dans l'en-tête des mails envoyés par la fonction mail de PHP.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15.
(...)
Mais tu dois savoir que si tu veux un jour écrire un € ou un œ directement plutôt qu'avec € ou œ ça risque de ne pas marcher et tu pourrais t'arracher les cheveux pour comprendre pourquoi.
On peut aussi déclarer Windows-1252... C'est un codage Microsoft et qui a évolué au fil du temps. Cependant, il semble très largement implémenté !
Olivier Miakinen
Le 15/12/2008 09:57, METIS a écrit :
Actuellement, j'envoie avec ça : http://cjoint.com/?mpkP7KIILS
L'image devient à peu près nette en UTF-16 petit-boutiste, et il s'affiche alors : [...] éventuellement suivis d'entętes mails [...] et aussi : [...] les champs ŕ vérifier [...]
???
Le 15/12/2008 09:57, METIS a écrit :
Actuellement, j'envoie avec ça :
http://cjoint.com/?mpkP7KIILS
L'image devient à peu près nette en UTF-16 petit-boutiste, et il
s'affiche alors :
[...] éventuellement suivis d'entętes mails [...]
et aussi :
[...] les champs ŕ vérifier [...]
L'image devient à peu près nette en UTF-16 petit-boutiste, et il s'affiche alors : [...] éventuellement suivis d'entętes mails [...] et aussi : [...] les champs ŕ vérifier [...]
???
Olivier Miakinen
Le 15/12/2008 12:18, Pascale a écrit :
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ] mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et ½, voire ¼...
Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies sous forme d'entités HTML, auquel cas on se fiche de savoir si tu déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.
De toutes façons, il m'est impossible de passer comme ça, à la volée en UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces trois caractères ?
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose : - ANSI
C'est donc Windows-1252.
- UTF8 (sans BOM) (?) - UTF8
Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte order mark », ne sert vraiment que pour distinguer les encodages de type UTF-16 (ou UCS-2) « big endian » ou « little endian ».
- UCS-2 Big Endian (?) - UCS-2 Little Endian (?)
Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à <http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais je la trouve malgré tout facile à lire.
Il propose aussi : - Convertir en format UNIX - Convertir en format Mac
Ça, cela concerne les fins de ligne. Format Windows : CR+LF (0D 0A) Format Unix : LF seul (0A) Format Mac : CR seul (0D)
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]
Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma fille à l'école.
Le 15/12/2008 12:18, Pascale a écrit :
Tout ira bien si tu n'utilises que la partie commune entre
Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ]
mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce
message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu
ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises
aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et ½, voire ¼...
Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en
ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies
sous forme d'entités HTML, auquel cas on se fiche de savoir si tu
déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.
De toutes façons, il m'est impossible de passer comme ça, à la volée en
UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces
trois caractères ?
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose :
- ANSI
C'est donc Windows-1252.
- UTF8 (sans BOM) (?)
- UTF8
Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte
order mark », ne sert vraiment que pour distinguer les encodages de type
UTF-16 (ou UCS-2) « big endian » ou « little endian ».
- UCS-2 Big Endian (?)
- UCS-2 Little Endian (?)
Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à
<http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais
je la trouve malgré tout facile à lire.
Il propose aussi :
- Convertir en format UNIX
- Convertir en format Mac
Ça, cela concerne les fins de ligne.
Format Windows : CR+LF (0D 0A)
Format Unix : LF seul (0A)
Format Mac : CR seul (0D)
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est
simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]
Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que
c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma
fille à l'école.
Tout ira bien si tu n'utilises que la partie commune entre Windows-1252 (ANSI donc) et ISO-8859-15. Exit donc les [ XX bouzillés XX ] mais aussi les fractions 1/4, 1/2 et 3/4 (que je n'inclus pas dans ce message pour ne pas avoir besoin de passer en UTF-8). Du coup, tu ferais tout aussi bien de déclarer ISO-8859-1 puisque tu n'utilises aucun caractère spécifique à ISO-8859-15.
Sauf l'euro, parfois, et ½, voire ¼...
Ce n'est pas possible. Un ¤ n'a pas le même code en windows-1252 et en ISO-8859-15, et il en va de même pour ½ et ¼. Ou alors tu les envoies sous forme d'entités HTML, auquel cas on se fiche de savoir si tu déclares de l'ISO-8859-15, du Windows-1250, du Big5, voire de l'ASCII.
De toutes façons, il m'est impossible de passer comme ça, à la volée en UTF-8, vu que mes programmes sont pleins de é, è, à, ç,...
... et de ¤, ½ et ¼ ? Je veux voir ! Tu as une URL avec l'un de ces trois caractères ?
Je ne sais pas si Notepad++ connaît ISO-8859-15.
Non, il propose : - ANSI
C'est donc Windows-1252.
- UTF8 (sans BOM) (?) - UTF8
Le *vrai* UTF-8, c'est celui sans BOM. Ce machin, acronyme de « byte order mark », ne sert vraiment que pour distinguer les encodages de type UTF-16 (ou UCS-2) « big endian » ou « little endian ».
- UCS-2 Big Endian (?) - UCS-2 Little Endian (?)
Tiens, justement les voilà. Une excellente doc sur le sujet se trouve à <http://www.cl.cam.ac.uk/~mgk25/unicode.html>. Elle est en anglais, mais je la trouve malgré tout facile à lire.
Il propose aussi : - Convertir en format UNIX - Convertir en format Mac
Ça, cela concerne les fins de ligne. Format Windows : CR+LF (0D 0A) Format Unix : LF seul (0A) Format Mac : CR seul (0D)
ISO 8859-15, je le mets tout bêtement dans les headers de mes programmes.
Alors le choix est simple : si tu te fiches de pouvoir ou non rentrer un [ XX bouzillés XX ]
Il n'y a aucun charset déclaré dans ton article, mais je soupçonne que c'est aussi Windows-1252. Je vérifierai plus tard, après avoir amené ma fille à l'école.
Bruno Desthuilliers
METIS a écrit :
SAM wrote:
Le 12/13/08 6:01 PM, METIS a écrit :
(snip)
- je cocherais la case "no BOM"
J'ai pas ça, j'ai : "Inclure une signature Unicode (BOM)" à cocher ou pas. Pas coché par défaut, donc je laisse...
Surtout pas de BOM sur de l'utf-8. Le BOM n'a de sens que pour des encodages UTF-16 et plus, et comme c'est un caractère (non imprimable, et non affiché par pas mal d'éditeurs...) en tout début de fichier, c'est une source d'emm... en PHP.
METIS a écrit :
SAM wrote:
Le 12/13/08 6:01 PM, METIS a écrit :
(snip)
- je cocherais la case "no BOM"
J'ai pas ça, j'ai :
"Inclure une signature Unicode (BOM)" à cocher ou pas.
Pas coché par défaut, donc je laisse...
Surtout pas de BOM sur de l'utf-8. Le BOM n'a de sens que pour des
encodages UTF-16 et plus, et comme c'est un caractère (non imprimable,
et non affiché par pas mal d'éditeurs...) en tout début de fichier,
c'est une source d'emm... en PHP.
J'ai pas ça, j'ai : "Inclure une signature Unicode (BOM)" à cocher ou pas. Pas coché par défaut, donc je laisse...
Surtout pas de BOM sur de l'utf-8. Le BOM n'a de sens que pour des encodages UTF-16 et plus, et comme c'est un caractère (non imprimable, et non affiché par pas mal d'éditeurs...) en tout début de fichier, c'est une source d'emm... en PHP.