OVH Cloud OVH Cloud

Quel codage ?

64 réponses
Avatar
romer
Hi,

Après qq. surprises dans l'élaboration et le rendu de page web en html,
pourriez-vous me dire quel codage choisir pour avoir le minimum de
surprise lors de la relecture par éditeur de texte et surtout par un
navigateur ?

Par avance merci.

--
A+

Romer

4 réponses

3 4 5 6 7
Avatar
Pierre Goiffon
ASM wrote:
Je visite une(*) de mes pages z'au zazzard:
http://perso.wanadoo.fr/stephane.moriaux/truc/tables_highlight_rows_fr.htm


(...)
et où est le charset envoyé-employé par le serveur ?

autre menu FF -> information sur la page :
le charset (utf-8) semble bien avoir été vu



Le codage est bien déclaré dans le meta, et le navigateur peut s'appuyer
dessus. Mais voir le message de Patrick, qui détaille pourquoi il est
mal de ne pas spécifier le codage en entête.

Par ailleurs utf-8 contient us-ascii, on peut donc très bien renvoyer
que des choses codées en utilisant us-ascii, le reste en entités, en
spécifiant utiliser de l'UTF-8. Mais quel intérêt ?
Avatar
Pierre Goiffon
Patrick Mevzek wrote:
Il devrait être dans le Content-Type. Il n'est pas là c'est mal:
1) augmente les risques de vulnérabilité aux attaques XSS



Jamais entendu parler de ça. Pourrais-tu en dire plus ?
Avatar
Patrick Mevzek
Le Tue, 12 Jul 2005 12:14:41 +0200, Pierre Goiffon a écrit :

Patrick Mevzek wrote:
Il devrait être dans le Content-Type. Il n'est pas là c'est mal:
1) augmente les risques de vulnérabilité aux attaques XSS



Jamais entendu parler de ça. Pourrais-tu en dire plus ?



Cf http://www.cert.org/advisories/CA-2000-02.html
pour les détails et notamment le paragraphe
Web Page Developers Should Recode Dynamically Generated Pages to Validate Output
où l'on peut lire:
In addition, web pages should explicitly set a character set to an
appropriate value in all dynamically generated pages.

(que j'étend personnellement à toutes les pages, vu que le risque peut
être présent aussi ailleurs, et que cela ne fait pas de mal de toute
façon).

Ou dans http://www.cert.org/tech_tips/malicious_code_mitigation.html
le paragraphe
Explicitly Setting the Character Encoding
(mais malheureusement leur exemple utilise la balise META, grrrrr...)

Pour Apache, les explications en rapport avec cette note du CERT sont là:
http://httpd.apache.org/info/css-security/

Personnellement, un HTTP/1.2 qui contiendrait l'obligation de la présence
du charset dans le Content-Type aurait mes faveurs.

--
Patrick Mevzek . . . . . . Dot and Co (Paris, France)
<http://www.dotandco.net/> <http://www.dotandco.com/>
Dépêches sur le nommage <news://news.dotandco.net/dotandco.info.news>
Avatar
Pierre Goiffon
Patrick Mevzek wrote:
Il devrait être dans le Content-Type. Il n'est pas là c'est mal:
1) augmente les risques de vulnérabilité aux attaques XSS



Jamais entendu parler de ça. Pourrais-tu en dire plus ?



Cf http://www.cert.org/advisories/CA-2000-02.html


(...)
Ou dans http://www.cert.org/tech_tips/malicious_code_mitigation.html


(...)
Pour Apache, les explications en rapport avec cette note du CERT sont là:
http://httpd.apache.org/info/css-security/



Ok, vu dans le 2eme document :
"Some 16-bit character-encoding schemes have additional multi-byte
representations for special characters such as "<". Some browsers
recognize this alternative encoding and act on it"

Je crois me souvenir avoir lu qu'en UTF-8 certains caractères peuvent
être codés sous plusieurs formes mais je ne retrouve plus comment ?? Un
pointeur quelqu'un ??
3 4 5 6 7