Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

utf-8

18 réponses
Avatar
Thomas
bonjour :-)


je m'apprête à passer http://biocer.fr/ en utf-8

si je me souviens bien, il ne faut pas que je transforme la 1ere ligne :
<?xml version="1.0" encoding="macintosh"?>
mais il faut que je la supprime
(je sais plus pour quelle raison)

c'est bien ça ?

--
Téléassistance / Télémaintenance
http://www.portparallele.com/ThomasDECONTES/

8 réponses

1 2
Avatar
Pierre Goiffon
TJ wrote:
j'ai "AddDefaultCharset macintosh"

j'avais ça en tête, et j'ai pas posé de question dessus parce que je
sais ce qu'il faut faire :
"AddDefaultCharset utf-8"

mais puisque t'en parles, peux tu me confirmer que je ne me trompe pas
stp ? :-)



Ça me semble bon !

j'ai tjr peur de me tromper d'un rien, par exemple pour la casse, pour
un tiret, ... (je crois que la casse n'a pas d'importance, c'est ça ?)



L'idéal c'est de trouver le texte de référence je dirai (RFC, W3C…) et
après de vérifier par la pratique et les tests que personne n'a de
soucis avec la théorie (IE au hasard), après on avise.

Concernant ce cas précis je n'ai pas vérifié ce que dit la RFC, mais
dans la pratique on rencontre tous les cas de casse, et ça ne semble
poser problème à personne.



Ce n'est pas une RFC qui documentera la directive AddDefaultCharset mais
la documentation du serveur ! S'il s'agit d'Apache, c'est par là :
http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
(et encore un lien qui était accessible dans les documents que j'ai cité
dans mes différentes réponses dans ce fil... sisi :) )
Avatar
TJ
On 2008-08-12, Pierre Goiffon wrote:
L'idéal c'est de trouver le texte de référence je dirai (RFC, W3C…) et
après de vérifier par la pratique et les tests que personne n'a de



Ce n'est pas une RFC qui documentera la directive AddDefaultCharset mais
la documentation du serveur ! S'il s'agit d'Apache, c'est par là :
http://httpd.apache.org/docs/2.0/mod/core.html#adddefaultcharset
(et encore un lien qui était accessible dans les documents que j'ai cité
dans mes différentes réponses dans ce fil... sisi :) )



Désolé je n'ai pas précisé mais mon explication était très généraliste
et ne visait pas spécifiquement ce cas. D'ailleurs quand j'ai pensé à la
question de la casse de la valeur du charset, je pensais HTTP et non à
la valeur de la directive Apache.

Il est évident qu'il faut se référer aux documentations des solutions
que l'on utilise, mais cela ne dispense pas, et c'est des fois plus
rapide, de vérifier par la pratique que le résultat est celui attendu,
c'est ce que je voulais souligner ;-)
Avatar
Thomas
In article <48a14153$0$11134$,
Pierre Goiffon wrote:

Thomas wrote:
>>> je m'apprête à passer http://biocer.fr/ en utf-8
>>>
>>> si je me souviens bien, il ne faut pas que je transforme la 1ere ligne :
>>> <?xml version="1.0" encoding="macintosh"?>
(...)
>> Enfin, la ligne que vous indiquez est le prologue XML. Il peut être
>> indiqué si vous utilisez XHTML, ce que je vous déconseille très
>> fortement (voir http://pgoiffon.free.fr/info/inet/html_ou_xhtml.php)
(...)
>> Il est cependant sans doute trop tard pour revenir sur votre choix...
>
> hein ?
> mais je veux pas passer à xhtml, je veux passer à utf-8 :-/

Vos pages sont visiblement déjà en XHTML de ce que je vois sur biocer.fr
(doctype + syntaxe)



ah pardon j'avais pas compris :-)
je pensais au type mime


sinon il me semble que ton article était fait surtout pour ceux qui
voulaient "passer du html au xhtml"
alors que moi je partais de rien

et ie je m'en fiche un peu
bon il faut quand même qu'il s'affiche qqch, mais si c'est un peu bancal
c'est pas grave

--
Téléassistance / Télémaintenance
http://www.portparallele.com/ThomasDECONTES/
Avatar
Thomas
In article <48a14401$0$18187$,
Pierre Goiffon wrote:

Thomas wrote:
>>> je m'apprête à passer http://biocer.fr/ en utf-8
>>>
>>> si je me souviens bien, il ne faut pas que je transforme la 1ere
>>> ligne : <?xml version="1.0" encoding="macintosh"?> mais il faut que
>>> je la supprime (je sais plus pour quelle raison)
>
> l'idée c'est que je veux bien faire des efforts pour IE,
> à condition que le rapport "amélioration dans IE / décalage par rapport
> aux standards ou ce qui s'en rapproche" soit (très) grand :-)


> sans le prologue XML, si qqn enregistrait une page telle quelle dans un
> fichier, les logiciels suivants n'auraient plus eu de moyen de savoir
> quel était l'encodage
> avec encoding="utf-8",
> sans le prologue XML, c'est pareil qu'avec, puisque la norme xml dit que
> quand il n'y a pas de prologue la valeur par défaut est "utf-8"
>
> tout ça c'est d'après mes souvenirs, est ce que je me trompe ?

Vos propos sont un peu flous, est-ce que vous voulez bien parler du cas
où l'on enregistre une page sur un système de fichier, puis qu'on ouvre
après cette page toujours en passant par le système de fichier ?



oui c'est ça

Dans ce
cas oui, on n'a plus d'information de codage, et le navigateur n'aura
d'autre choix que de lancer son mécanisme d'auto-détection du codage, en
s'aidant de la balise meta ou du prologue xml si présents.



ok :-)


Dans le cas particulier du XHTML, je ne suis pas très sûr de ce qui va
se passer. La recommandation indique explicitement (une information qui
était présente aussi dans l'article que je vous avais indiqué et dont
j'ai rappelé l'url ci-dessus...) que pour une page XHTML servie en
text/html il faut conserver l'information de codage dans le meta ET dans
le prologue XML, et je ne saurais dire quels navigateurs vont lire
quelle information. Je suppose que les navigateurs ne sachant pas lire
des pages servies en application/xml+xhtml iront voir le meta, et les
autres le prologue XML ?



la question c'était :
un logiciel *respectant les standards* (pas forcément un navigateur, et
je me fiche d'ie) qui lit un fichier xml où il n'y a ni prologue xml ni
balise meta, il fait quoi ?

d'après mes souvenirs, je crois que la norme dit que
le logiciel doit considérer que le fichier est codé en utf-8
mais je n'en suis pas certain et je ne sais pas où vérifier ça

--
Téléassistance / Télémaintenance
http://www.portparallele.com/ThomasDECONTES/
Avatar
Pierre Goiffon
Thomas wrote:
Vos propos sont un peu flous, est-ce que vous voulez bien parler du cas
où l'on enregistre une page sur un système de fichier, puis qu'on ouvre
après cette page toujours en passant par le système de fichier ?



oui c'est ça


(...)
Dans le cas particulier du XHTML, je ne suis pas très sûr de ce qui va
se passer. La recommandation indique explicitement (une information qui
était présente aussi dans l'article que je vous avais indiqué et dont
j'ai rappelé l'url ci-dessus...) que pour une page XHTML servie en
text/html il faut conserver l'information de codage dans le meta ET dans
le prologue XML, et je ne saurais dire quels navigateurs vont lire
quelle information. Je suppose que les navigateurs ne sachant pas lire
des pages servies en application/xml+xhtml iront voir le meta, et les
autres le prologue XML ?



la question c'était :
un logiciel *respectant les standards* (pas forcément un navigateur, et
je me fiche d'ie) qui lit un fichier xml où il n'y a ni prologue xml ni
balise meta, il fait quoi ?



Vous allez un peu vite : "lire un fichier XML", qu'est-ce que ça veut
dire pour un navigateur qui ouvre une page via le système de fichier ?
Rien ne lui indique le codage d'une part... Mais surtout, rien n'indique
qu'il s'agit de HTML ou de XHTML !

Je n'ai pas d'information sur ce qui se passe dans ce cas de figure, et
je ne saurai pas où en trouver. Je ne serai pas étonné que toute page
ouverte via le système de fichier soit forcément lue comme du HTML...
Avatar
Pierre Goiffon
Thomas wrote:
http://pgoiffon.free.fr/info/inet/html_ou_xhtml.php





Vos pages sont visiblement déjà en XHTML de ce que je vois sur biocer.fr
(doctype + syntaxe)



ah pardon j'avais pas compris :-)
je pensais au type mime

sinon il me semble que ton article était fait surtout pour ceux qui
voulaient "passer du html au xhtml"
alors que moi je partais de rien

et ie je m'en fiche un peu
bon il faut quand même qu'il s'affiche qqch, mais si c'est un peu bancal
c'est pas grave



Non, j'ai rédigé ce document pour regrouper tous les points qui sont
apparus sur ce forum sur le débat "HTML vs XHTML".
On peut donc se servir de ces informations pour faire son choix lors de
la création d'un site "à partir de 0", tout comme pour un site existant.

En résumé, XHTML n'apporte aucun avantage par rapport à HTML sur le Web
aujourd'hui. Il impose par contre de très nombreuses contraintes, et ce
même si "l'affichage parfait" dans MSIE n'est pas une priorité pour vous.
Avatar
Thomas
In article <48a02958$0$32220$,
Pierre Goiffon wrote:

Thomas wrote:
> je m'apprête à passer http://biocer.fr/ en utf-8
>
> si je me souviens bien, il ne faut pas que je transforme la 1ere ligne :
> <?xml version="1.0" encoding="macintosh"?>
> mais il faut que je la supprime
> (je sais plus pour quelle raison)

la ligne que vous indiquez est le prologue XML.



pour être précis, il s'agit de la *déclaration XML*
(le prologue XML inclut le doctype)


si je l'avait su ça m'aurait raccourci un peu mes recherches, enfin bon
au final ça m'a mené à un document que j'aurais pu aller voir
directement :-D

pour info :
http://www.w3.org/TR/xhtml1/#strict
"[An XML declaration] is required when the character encoding of the
document is other than the default UTF-8 or UTF-16 and no encoding was
determined by a higher-level protocol."

voilà, donc c'est bien ce que je pensais :
si on veut être totalement conforme,
on peut se passer de la déclaration XML si le codage est UTF-8, pas sinon


(curiosité :
le w3c dit que le codage par défaut peut être UTF-8 ou UTF-16,
alors que d'autres documents disent que le codage par défaut est
uniquement UTF-8
qqn a un avis là dessus ?)

--
Téléassistance / Télémaintenance
http://www.portparallele.com/ThomasDECONTES/
Avatar
Pierre Goiffon
Thomas wrote:
si je me souviens bien, il ne faut pas que je transforme la 1ere ligne :
<?xml version="1.0" encoding="macintosh"?>
mais il faut que je la supprime
(je sais plus pour quelle raison)


la ligne que vous indiquez est le prologue XML.



pour être précis, il s'agit de la *déclaration XML*
(le prologue XML inclut le doctype)


(...)
pour info :
http://www.w3.org/TR/xhtml1/#strict
"[An XML declaration] is required when the character encoding of the
document is other than the default UTF-8 or UTF-16 and no encoding was
determined by a higher-level protocol."

voilà, donc c'est bien ce que je pensais :
si on veut être totalement conforme,
on peut se passer de la déclaration XML si le codage est UTF-8, pas sinon



Vous omettez la fin de la phrase : "and no encoding was determined by a
higher-level protocol"
Cela me fait supposer qu'un XHTML pas forcément en UTF-8 ou UTF-16
servit tel quel (application/xml+xhtml) et avec le bon codage déclaré
dans les entêtes HTTP pourra ne pas contenir de déclaration XML.
1 2