OVH Cloud OVH Cloud

deviner le charset d'un fichier html local

21 réponses
Avatar
pere.noel
j'ai une petite appli qui transforme des fichiers html locaux :

html -> xhtml -> ajout d'un menu -> publication (en xhtml mais avec
l'extension html.

bon, la conversion html -> xhtml se fait par tidy, à qui je dois donner
le charset entrant (en sortie je bascule tout en UTF-8)

là j'ai un problème de détection, je vien de faire un petit script ruby
qui détecte le charset, résultat des courses : 10 fichiers sur 26 n'ont
pas défini le charset dans une balise meta.

sur "fr.comp.infosystemes.www.auteurs" "on" me dit que cette balise
n'est qu'un pis-aller.

qu'il faut utiliser l'en-tête HTTP, ce qui n'est pas possible dans mon
cas vu que les fichiers sont locaux, sauvegardés dans un répertoire...

perso je pense attribuer "US-ASCII" à tous les fichiers qui ne déclarent
pas leur charset, par ce que c'est mieux que rien.

notes que je converti tout en UTF-8 pparce que j'ajoute de l'UTF-8 à la
page en question.

pensez-vous que ce soit uen bonne idée ???

savez vous qqc sur l'autodéttection du charset par les navigateurs ?

--
une bévue

1 réponse

1 2 3
Avatar
ASM
ASM wrote:


ben ... sur un domaine "Russe" de quoi t'étonnes-tu ?
à part les é è à ù, le reste semble OK (FireFox)



Donc le navigateur ne tient pas compte de l'info donnée par
<META ... content="text/html; charset=utf-8">
ce qui voudrait dire que c'est inutile?


Ce n'est utile que si (et seulement si et sur le web) le serveur
n'envoie pas le charset.

Si le serveur envoie un charset ce dernier prévaut sur celui du meta.

Il peut être utile de spécifier un meta-charset au cas où la page serait
sauvegardée sur son DD et revue en local.

Il est probablement possible de glisser un fichier .htaccess
dans le dossier des pages conçues avec un autre charset que celui par
défaut du serveur.
Ce fichier expliquant au serveur d'envoyer pour ce dossier tel ou tel
charset.

pistes -> google -> htaccess charset


--
Stephane Moriaux et son [moins] vieux Mac


1 2 3