forumlaires et encodages

Le
mpg
Bonjour,

Quand on récupère du texte d'un formulaire via GET ou POST, qu'est-ce
qui détermine l'encodage du texte reçu ? Je viens de faire un petit
essai en regardant une requête POST envoyée par Firefox, elle ne
contient aucune information d'encodage.

Du coup, comment, côté serveur, savoir quel encodage a été utilisé ?
(Le langage utilisé pour traiter les données est PHP 5.2, si ça a la moindre
importance.)

Je lis via google que le client est censé envoyer le texte dans le même
encodage que celui annoncé par le serveur dans l'en-tête 'Content-Type'
quand il envoie la page, mais je n'ai aucune idée de la fiabilité de
cette information.

Je lis aussi dans la spec HTML 4.01, paragraphe 17.3 que la balise form
admet un attribut accept-charset définissant une liste d'encodages
acceptés. Est-ce que les navigateurs courants honorent cet attribut ? Si
je mets <form accept-charset="utf-8" > (un seul élément dans la liste
de charset donc), est-ce que je peux être (raisonnablement) certain que
le contenu renvoyé par l'agent utilisateur sera bien encodé en utf-8
(avant d'être url-encodé) ?

Je lis enfin en haut de la page 15 de la RFC 3986 que quand du contenu
textuel doit être url-encodé, il doit toujours être encodé en utf-8
avant que les octets résultants soient %-encodés.

Je m'y perds un peu entre ces informations apparemment contradictoires
(ou alors il y a un ordre de précédence que j'aimerais connaître).

Je suis intéressé par des pointeurs vers les textes faisant autorité (je
me perds un peu entre les recommandations (X)HTML du W3C, les RFC
définissant HTTP, et celles définissant MIME), mais surtout par les
bonnes pratiques qui marchent « dans la vraie vie » en tenant compte des
éventuelles bizarreries des navigateurs courants.

Merci d'avance !

--
Manuel Pégourié-Gonnard Institut de mathématiques de Jussieu
http://weblog.elzevir.fr/ http://people.math.jussieu.fr/~mpg/
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Andreas Prilop
Le #22057861
On Thu, 5 Feb 2009, mpg wrote:

Je suis intéressé par des pointeurs vers les textes faisant autorité
[ ... ], mais surtout par les
bonnes pratiques qui marchent « dans la vraie vie » en tenant compte des
éventuelles bizarreries des navigateurs courants.



Voir
http://www.alanflavell.org.uk/charset/form-i18n.html
http://niwo.mnsys.org/saved/~flavell/charset/form-i18n.html

/* En français, c'est trop compliqué pour moi. ;-) */
Publicité
Poster une réponse
Anonyme