Encodage automatique

Le
Denis Beauregard
Bonjour,


Est-ce que Seamonkey est devenu fou en abandonnant la détection du
jeu de caractère passé dans une méta et en ayant du UTF par défaut ?

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php

page qui commence avec

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html lang="en"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">

J'utilise Gecko/20110420 SeaMonkey/2.0.14 et Firefox 4.0.1.

J'ai 90000 pages à modifier si je dois changer mes en-têtes et je
n'ai plus accès à mon générateur de pages (il roulait sous Windows
98 en DOS, ce que Windows 7 familial n'autorise pas).


Denis
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 4
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Denis Beauregard
Le #23539541
Le Wed, 06 Jul 2011 19:48:03 -0400, Denis Beauregard
fr.comp.infosystemes.www.navigateurs:

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php




Mais la situation est encore plus confuse !!!!

Soit une page générée automatiquement et située sur mon ordi :

<html lang="fr"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">
<meta name="Author" content="Denis Beauregard">
<meta name="KeyWords" content="g&eacute;n&eacute;alogie, genealogie,
france, qu&eacute;bec, canadien, fran&ccedil;ais, acadie">
<META NAME="ROBOTS" content="NOINDEX">
</head><body>
<h1>Généalogie des Français d'Amérique du Nord</h1>
<h1>Index principal</h1>


et la même page située sur mon site web :

http://www.francogene.com/genealogie--quebec/999/index.php

<html lang="fr"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">
<meta name="Author" content="Denis Beauregard">
<meta name="KeyWords" content="g&eacute;n&eacute;alogie, genealogie,
france, qu&eacute;bec, canadien, fran&ccedil;ais, acadie">
<META NAME="ROBOTS" content="NOINDEX">
</head><body>
<h1>G?n?alogie des Fran?ais d'Am?rique du Nord</h1>
<h1>Index principal</h1>


la 2e est détectée comme étant du UTF8 alors que la première est lue
correctement en 8859-1 !!!

Même comportement avec Gecko/20110420 SeaMonkey/2.0.14 et Firefox
4.0.1 ainsi que IE 8. Testé après redémarrage de Windows 7.

Dans Seamonkey, j'ai la détection automatique universelle (menu
Affichage). Dans les Préférences, j'ai Navigateur - Langues -
Encodage par défaut ISO-8859-1.



Denis
Denis Beauregard
Le #23539671
Le Wed, 06 Jul 2011 19:48:03 -0400, Denis Beauregard
fr.comp.infosystemes.www.navigateurs:

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php

page qui commence avec

<html lang="en"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">

J'utilise Gecko/20110420 SeaMonkey/2.0.14 et Firefox 4.0.1.



Problème corrigé pour le moment. J'ai ajouté la ligne suivante
au début de chacun de mes fichiers (en fait, ils font tous un
include du même fichier).

<?php header("Content-Type: text/html; charset=iso-8859-1"); ?>

Mais je suis surpris que le problème soit apparu sur 3 navigateurs
en même temps. C'est dans la config de Apache ou de PHP ou une
valeur par défaut de PHP 5 ?


Denis
Sergio
Le #23539781
Le 07/07/2011 03:40, Denis Beauregard a écrit :

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php

page qui commence avec

<html lang="en"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">

J'utilise Gecko/20110420 SeaMonkey/2.0.14 et Firefox 4.0.1.



Problème corrigé pour le moment. J'ai ajouté la ligne suivante
au début de chacun de mes fichiers (en fait, ils font tous un
include du même fichier).

<?php header("Content-Type: text/html; charset=iso-8859-1"); ?>

Mais je suis surpris que le problème soit apparu sur 3 navigateurs
en même temps. C'est dans la config de Apache ou de PHP ou une
valeur par défaut de PHP 5 ?



Config d'Apache. (ta ligne PHP ne fait que surcharger la configuration d'Apache).

Jamais compris d'ailleurs pourquoi le
--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
yamo'
Le #23540291
Salut,

Sergio a tapoté, le 07/07/2011 07:43:

Jamais compris d'ailleurs pourquoi le



J'ai l'impression qu'il sert surtout pour les consultations en dehors
d'un serveur http.

--
Stéphane


Vérité dans un temps, erreur dans l'autre.
-+- Montesquieu -+-
Jean-Marc Desperrier
Le #23540521
Sergio wrote:
Jamais compris d'ailleurs pourquoi le priorité sur la config du serveur.



Parceque le principe est que le serveur a pu recoder à la volée la page
en autre chose, et donc que c'est lui qui sait mieux que la page, et
qu'il *devrait* ne rien dire s'il ne *sait* pas.
Pierre Goiffon
Le #23544571
On 07/07/2011 11:40, Jean-Marc Desperrier wrote:
Sergio wrote:
Jamais compris d'ailleurs pourquoi le priorité sur la config du serveur.



Parceque le principe est que le serveur a pu recoder à la volée la page
en autre chose, et donc que c'est lui qui sait mieux que la page, et
qu'il *devrait* ne rien dire s'il ne *sait* pas.



Je pense surtout que c'est parce que si l'information du codage est
contenue dans le flux texte, il faut lire celui-ci... et donc, avec quel
codage est-ce que l'on va l'interpréter ? Un navigateur reçois une page,
pour lire la balise meta il doit trouver dans quel charset est le contenu...

Le codage est typiquement une meta information, que l'on met à côté du
contenu texte lui-même.
Denis Beauregard
Le #23544961
Le Fri, 08 Jul 2011 15:34:25 +0200, Pierre Goiffon
fr.comp.infosystemes.www.navigateurs:

On 07/07/2011 11:40, Jean-Marc Desperrier wrote:
Sergio wrote:
Jamais compris d'ailleurs pourquoi le priorité sur la config du serveur.



Parceque le principe est que le serveur a pu recoder à la volée la page
en autre chose, et donc que c'est lui qui sait mieux que la page, et
qu'il *devrait* ne rien dire s'il ne *sait* pas.



Je pense surtout que c'est parce que si l'information du codage est
contenue dans le flux texte, il faut lire celui-ci... et donc, avec quel
codage est-ce que l'on va l'interpréter ? Un navigateur reçois une page,
pour lire la balise meta il doit trouver dans quel charset est le contenu...



Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.

Le codage est typiquement une meta information, que l'on met à côté du
contenu texte lui-même.




Denis
Pierre Goiffon
Le #23545071
On 08/07/2011 17:25, Denis Beauregard wrote:
Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.



Si la page est livrée avec l'information de codage en entête http, quel
intérêt pour le navigateur d'aller lire le codage indiqué en meta et de
le rendre prioritaire ? Quels seraient les cas d'utilisations ??!???
Denis Beauregard
Le #23546101
Le Fri, 08 Jul 2011 18:16:52 +0200, Pierre Goiffon
fr.comp.infosystemes.www.navigateurs:

On 08/07/2011 17:25, Denis Beauregard wrote:
Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.



Si la page est livrée avec l'information de codage en entête http, quel
intérêt pour le navigateur d'aller lire le codage indiqué en meta et de
le rendre prioritaire ? Quels seraient les cas d'utilisations ??!???



Dans le 1er cas, c'est une décision de l'hébergeur et dans le 2e, du
propriétaire du site.


Denis
SAM
Le #23551811
Le 07/07/11 02:13, Denis Beauregard a écrit :
Le Wed, 06 Jul 2011 19:48:03 -0400, Denis Beauregard
fr.comp.infosystemes.www.navigateurs:

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php





oui, de même avec Firefox

c'est ton serveur qui envoie la commande/indication de l'UTF-8
(non, le meta ne sert alors plus à rien, le serveur prédomine)

voici les headers reçus lors de mon essai

Date: Sun, 10 Jul 2011 23:51:54 GMT
Server: Apache/2.0.63 (Unix) mod_ssl/2.0.63 OpenSSL/0.9.8e-fips-rhel5
mod_auth_passthrough/2.1 mod_bwlimited/1.4 FrontPage/5.0.2.2635
X-Powered-By: PHP/5.2.9
Keep-Alive: timeout, max0
Connection: Keep-Alive
Transfer-Encoding: chunked
Content-Type: text/html; charset=utf-8

200 OK

Dans Seamonkey, j'ai la détection automatique universelle (menu
Affichage). Dans les Préférences, j'ai Navigateur - Langues -
Encodage par défaut ISO-8859-1.



Ouais mais ... c'est le serveur qui commande ! ! !
l'automatisme n'a plus lieu d'être,
les préférences non plus.


--
Stéphane Moriaux avec/with iMac-intel
Publicité
Poster une réponse
Anonyme