j'ai une petite appli qui transforme des fichiers html locaux :
html -> xhtml -> ajout d'un menu -> publication (en xhtml mais avec
l'extension html.
bon, la conversion html -> xhtml se fait par tidy, à qui je dois donner
le charset entrant (en sortie je bascule tout en UTF-8)
là j'ai un problème de détection, je vien de faire un petit script ruby
qui détecte le charset, résultat des courses : 10 fichiers sur 26 n'ont
pas défini le charset dans une balise meta.
sur "fr.comp.infosystemes.www.auteurs" "on" me dit que cette balise
n'est qu'un pis-aller.
qu'il faut utiliser l'en-tête HTTP, ce qui n'est pas possible dans mon
cas vu que les fichiers sont locaux, sauvegardés dans un répertoire...
perso je pense attribuer "US-ASCII" à tous les fichiers qui ne déclarent
pas leur charset, par ce que c'est mieux que rien.
notes que je converti tout en UTF-8 pparce que j'ajoute de l'UTF-8 à la
page en question.
pensez-vous que ce soit uen bonne idée ???
savez vous qqc sur l'autodéttection du charset par les navigateurs ?
ben ... sur un domaine "Russe" de quoi t'étonnes-tu ? à part les é è à ù, le reste semble OK (FireFox)
Donc le navigateur ne tient pas compte de l'info donnée par <META ... content="text/html; charset=utf-8"> ce qui voudrait dire que c'est inutile?
Ce n'est utile que si (et seulement si et sur le web) le serveur n'envoie pas le charset.
Si le serveur envoie un charset ce dernier prévaut sur celui du meta.
Il peut être utile de spécifier un meta-charset au cas où la page serait sauvegardée sur son DD et revue en local.
Il est probablement possible de glisser un fichier .htaccess dans le dossier des pages conçues avec un autre charset que celui par défaut du serveur. Ce fichier expliquant au serveur d'envoyer pour ce dossier tel ou tel charset.
ben ... sur un domaine "Russe" de quoi t'étonnes-tu ?
à part les é è à ù, le reste semble OK (FireFox)
Donc le navigateur ne tient pas compte de l'info donnée par
<META ... content="text/html; charset=utf-8">
ce qui voudrait dire que c'est inutile?
Ce n'est utile que si (et seulement si et sur le web) le serveur
n'envoie pas le charset.
Si le serveur envoie un charset ce dernier prévaut sur celui du meta.
Il peut être utile de spécifier un meta-charset au cas où la page serait
sauvegardée sur son DD et revue en local.
Il est probablement possible de glisser un fichier .htaccess
dans le dossier des pages conçues avec un autre charset que celui par
défaut du serveur.
Ce fichier expliquant au serveur d'envoyer pour ce dossier tel ou tel
charset.
ben ... sur un domaine "Russe" de quoi t'étonnes-tu ? à part les é è à ù, le reste semble OK (FireFox)
Donc le navigateur ne tient pas compte de l'info donnée par <META ... content="text/html; charset=utf-8"> ce qui voudrait dire que c'est inutile?
Ce n'est utile que si (et seulement si et sur le web) le serveur n'envoie pas le charset.
Si le serveur envoie un charset ce dernier prévaut sur celui du meta.
Il peut être utile de spécifier un meta-charset au cas où la page serait sauvegardée sur son DD et revue en local.
Il est probablement possible de glisser un fichier .htaccess dans le dossier des pages conçues avec un autre charset que celui par défaut du serveur. Ce fichier expliquant au serveur d'envoyer pour ce dossier tel ou tel charset.