Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Encodage automatique

39 réponses
Avatar
Denis Beauregard
Bonjour,


Est-ce que Seamonkey est devenu fou en abandonnant la détection du
jeu de caractère passé dans une méta et en ayant du UTF par défaut ?

Alors que mon site affichait toujours le bon jeu de caractères, voilà
qu'il est devenu illisible avec Seamonkey qui détecte du UTF8 au lieu
de 8859-1 ou WIndows 1252.

Par exemple

http://www.francogene.com/quebec--genealogy/115/115877.php

page qui commence avec

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html lang="en"><head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">

J'utilise Gecko/20110420 SeaMonkey/2.0.14 et Firefox 4.0.1.

J'ai 90000 pages à modifier si je dois changer mes en-têtes et je
n'ai plus accès à mon générateur de pages (il roulait sous Windows
98 en DOS, ce que Windows 7 familial n'autorise pas...).


Denis

10 réponses

1 2 3 4
Avatar
SAM
Le 07/07/11 07:43, Sergio a écrit :

Jamais compris d'ailleurs pourquoi le <META HTTP-EQUIV=...> n'a pas
priorité sur la config du serveur.



Ben ... ce n'est prévu que si la page est lue
- sur un ordi (y sauvegardée puis relue)
- depuis un serveur n'indiquant pas le charset
(pages perso chez Free, chez Orange, ...)
le navigateur parsant le fichier est alors mis au parfum.

Sans doute pour éviter au serveur d'interpréter (parser ?) tous les
fichiers qu'il distribue ?

--
Stéphane Moriaux avec/with iMac-intel
Avatar
SAM
Le 08/07/11 18:16, Pierre Goiffon a écrit :
On 08/07/2011 17:25, Denis Beauregard wrote:
Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.



Si la page est livrée avec l'information de codage en entête http, quel
intérêt pour le navigateur d'aller lire le codage indiqué en meta et de
le rendre prioritaire ? Quels seraient les cas d'utilisations ??!???



on a écrit dans le charset non indiqué par défaut par le serveur, le
meta serait bien utile dans les cas où :
- on n'a pas la main sur le serveur (pas de htacces, rien)
- on ne devrait pas s'enquiquiner à faire une page php avec headers
(quand du simple html suffit).

M Boreghar, par exemple, a l'habitude de coder en iso-latin (et depuis
le siècle dernier). Jusqu'alors chez son hébergeur il n'y avait pas de
problème, du moins tant que ce dernier n'a décidé recemment de pourvoir
les headers du serveur avec un charset, que bêtement ce charset ne
convient pas à Boreghar qui ne tient pas à retranscrire ses milliers de
fichiers déjà en ligne (d'autant qu'ils ont déjà tous le bon meta !).

--
Stéphane Moriaux avec/with iMac-intel
Avatar
Olivier Miakinen
Bonjour,

Le 08/07/2011 23:43, Denis Beauregard a écrit :

Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.



Si la page est livrée avec l'information de codage en entête http, quel
intérêt pour le navigateur d'aller lire le codage indiqué en meta et de
le rendre prioritaire ? Quels seraient les cas d'utilisations ??!???



Dans le 1er cas, c'est une décision de l'hébergeur



Mauvais hébergeur, changer d'hébergeur. ©

Si ton hébergeur ne met pas à ta disposition un moyen de choisir
les entêtes HTTP à envoyer avec tel ou tel document, c'est un très
mauvais hébergeur et tu devrais en changer le plus tôt possible.

D'autant plus qu'avec Apache, même si tu n'as pas accès au
httpd.conf, il est très facile de contrôler ce que tu veux
au moyens des .htaccess répertoire par répertoire.

Cordialement,
--
Olivier Miakinen
Avatar
Denis Beauregard
Le Mon, 11 Jul 2011 02:23:19 +0200, SAM
écrivait dans
fr.comp.infosystemes.www.navigateurs:

Le 08/07/11 18:16, Pierre Goiffon a écrit :
On 08/07/2011 17:25, Denis Beauregard wrote:
Justement, le serveur doit fournir le jeu de caractères utilisé pour
dire quel est le jeu de caractères de la page, donc c'est un jeu
intermédiaire qui n'a pas à être conservé s'il est redéfini.



Si la page est livrée avec l'information de codage en entête http, quel
intérêt pour le navigateur d'aller lire le codage indiqué en meta et de
le rendre prioritaire ? Quels seraient les cas d'utilisations ??!???



on a écrit dans le charset non indiqué par défaut par le serveur, le
meta serait bien utile dans les cas où :
- on n'a pas la main sur le serveur (pas de htacces, rien)



Ce qui est en général le cas pour les petits sites (dans le sens de
site personnel, site chez un hébergeur universel et non appartenant
au même propriétaire que le site, etc.). Donc, c'est le cas le plus
fréquent pour le nombre de sites même si ce n'est pas le cas pour le
volume.

Par exemple, les 500 sites les plus populaires selon Alexa sont tous
corporatifs. Voir

http://www.alexa.com/topsites

Aucun site que l'on pourrait qualifier de personnel je pense.

Mais les sites personnels développés à peu de frais parce que le
webmestre n'a tout simplement pas les moyens d'embaucher un
professionnel pour refaire son site quand la mode change (ou qu'un
gros fournisseur change d'avis et impose sa norme), ces sites sont
souvent hébergés dans qu'on puisse modifier les paramètres du
serveur Apache (sans accès au php.ini par exemple, je viens de
vérifier le nom dans le Easy PHP installé chez moi).

Par ailleurs, personne n'a dit qu'il suffirait de modifier le
.htaccess dans ce file de discussion.

- on ne devrait pas s'enquiquiner à faire une page php avec headers
(quand du simple html suffit).



Mes 90 000 pages ont un anti-aspirateur de site écrit en PHP et ne
pouvant pas fonctionner sans PHP.

M Boreghar, par exemple, a l'habitude de coder en iso-latin (et depuis
le siècle dernier). Jusqu'alors chez son hébergeur il n'y avait pas de



Par contre, il s'agit pour ce jeu de pages accessibles depuis 2004 ou
2005, générées par un logiciel écrit en DOS et relisant une base de
données formée de fichiers Excel enregistrés en texte tabulé et jeu
Windows 1252.

problème, du moins tant que ce dernier n'a décidé recemment de pourvoir
les headers du serveur avec un charset, que bêtement ce charset ne
convient pas à Boreghar qui ne tient pas à retranscrire ses milliers de
fichiers déjà en ligne (d'autant qu'ils ont déjà tous le bon meta !).



Le problème est corrigé parce que j'ai changé le fichier inclus dans
tous ces fichiers, fichier appelant l'anti-aspirateur de site et donc
inclus dans toutes ces pages et situé au tout début de chacun de ces
fichiers.

Ceci dit, il s'agit de la même en-tête placée dans la version sur
cédérom de la même base de données, version qui couvre plus d'années
et dont la mise en vente permet de compenser en partie les heures
requises pour construire la dite base de données. Cette version sur
cédérom est autonome, tout est en .htm ou .html, et ne pose pas de
problème en autant que je sache.


Denis
Avatar
Denis Beauregard
Le Mon, 11 Jul 2011 02:04:33 +0200, SAM
écrivait dans
fr.comp.infosystemes.www.navigateurs:

Le 07/07/11 07:43, Sergio a écrit :

Jamais compris d'ailleurs pourquoi le <META HTTP-EQUIV=...> n'a pas
priorité sur la config du serveur.



Ben ... ce n'est prévu que si la page est lue
- sur un ordi (y sauvegardée puis relue)
- depuis un serveur n'indiquant pas le charset
(pages perso chez Free, chez Orange, ...)
le navigateur parsant le fichier est alors mis au parfum.

Sans doute pour éviter au serveur d'interpréter (parser ?) tous les
fichiers qu'il distribue ?



Euh, primo, le serveur interprète déjà toutes les pages PHP ou ASP
qu'il distribue. Secundo, c'est au navigateur à interpréter le
charset au niveau de la META puisqu'il représente une information
produite au même niveau que le contenu de la page.


Denis
Avatar
Denis Beauregard
suivi au forum des auteurs

Le Mon, 11 Jul 2011 17:08:26 +0200, Olivier Miakinen
<om+ écrivait dans
fr.comp.infosystemes.www.navigateurs:

Dans le 1er cas, c'est une décision de l'hébergeur



Mauvais hébergeur, changer d'hébergeur. ©



Ce que je ferai peut-être dans les prochains mois (mon contrat de
4 ans expire bientôt).

Si ton hébergeur ne met pas à ta disposition un moyen de choisir
les entêtes HTTP à envoyer avec tel ou tel document, c'est un très
mauvais hébergeur et tu devrais en changer le plus tôt possible.

D'autant plus qu'avec Apache, même si tu n'as pas accès au
httpd.conf, il est très facile de contrôler ce que tu veux
au moyens des .htaccess répertoire par répertoire.



M'enfin, pourquoi personne ne suggère comme faire un .htaccess
qui résoudrait ce problème ? J'ai beaucoup de dossiers dans mon
site et j'ai pu corriger le problème pour un sous-ensemble bien
identifié. Mais il y a peut-être d'autres dossiers où je devrais
ajouter un .htaccess pour m'assurer que tout est bien lu (même si
en théorie, tout est édité avec Seamonkey qui transforme les
lettres accentuées en entités).


Denis

P.S. Je sais que la solution est donnée sur une page comme
http://www.askapache.com/htaccess/setting-charset-in-htaccess.html
mais je suis surpris que personne n'a donné par réflexe cette
solution.
Avatar
Olivier Miakinen
Le 11/07/2011 17:35, Denis Beauregard a écrit :
suivi au forum des auteurs



Bonne idée.

[quels entêtes HTTP envoyer avec un fichier donné pour préciser
le type MIME, charset compris]

Dans le 1er cas, c'est une décision de l'hébergeur



Mauvais hébergeur, changer d'hébergeur. ©



Ce que je ferai peut-être dans les prochains mois (mon contrat de
4 ans expire bientôt).



Par curiosité, quel hébergeur as-tu ? Tous ceux que j'ai utilisés
jusqu'à présent (Free, Teaser et GalacSys) permettaient de modifier
le .htaccess, et il n'y a guère que chez Wanadoo que j'ai entendu
dire que c'était impossible. Or, même dans ce dernier cas, je pense
qu'il y a moyen de dire si on envoie un fichier audio, une image
ou un document HTML -- au fait, comment font ceux qui envoient du
XHTML ?

Si ton hébergeur ne met pas à ta disposition un moyen de choisir
les entêtes HTTP à envoyer avec tel ou tel document, c'est un très
mauvais hébergeur et tu devrais en changer le plus tôt possible.

D'autant plus qu'avec Apache, même si tu n'as pas accès au
httpd.conf, il est très facile de contrôler ce que tu veux
au moyens des .htaccess répertoire par répertoire.



M'enfin, pourquoi personne ne suggère comme faire un .htaccess
qui résoudrait ce problème ?



Je vois plusieurs raisons à cela :
- tu traînes tes guêtres depuis suffisamment longtemps sur les
groupes php et infosystemes.www pour qu'on ait pensé que tu
le savais déjà ;
- la config par .htaccess est plutôt en charte sur fciw.serveurs
ou à la limite fciw.auteurs que fciw.navigateurs ;
- et bien sûr, si tes pages sont en PHP, un header() est une
solution tout aussi simple, voire plus.

J'ai beaucoup de dossiers dans mon
site et j'ai pu corriger le problème pour un sous-ensemble bien
identifié. Mais il y a peut-être d'autres dossiers où je devrais
ajouter un .htaccess pour m'assurer que tout est bien lu (même si
en théorie, tout est édité avec Seamonkey qui transforme les
lettres accentuées en entités).



Pourquoi ne pas mettre le .htaccess à la racine de ton site, si
tu n'as pas de mélange entre UTF-8 et Latin1 ? D'autant plus qu'il
suffit d'un autre .htaccess dans un sous-sous-sous-répertoire qui
contiendrait exceptionnellement des documents avec un autre jeu de
caractères.

P.S. Je sais que la solution est donnée sur une page comme
http://www.askapache.com/htaccess/setting-charset-in-htaccess.html
mais je suis surpris que personne n'a donné par réflexe cette
solution.



Cf. supra.
Avatar
Denis Beauregard
Le Mon, 11 Jul 2011 17:53:51 +0200, Olivier Miakinen
<om+ écrivait dans fr.comp.infosystemes.www.auteurs:

Le 11/07/2011 17:35, Denis Beauregard a écrit :
suivi au forum des auteurs



Bonne idée.

[quels entêtes HTTP envoyer avec un fichier donné pour préciser
le type MIME, charset compris]

Dans le 1er cas, c'est une décision de l'hébergeur



Mauvais hébergeur, changer d'hébergeur. ©



Ce que je ferai peut-être dans les prochains mois (mon contrat de
4 ans expire bientôt).



Par curiosité, quel hébergeur as-tu ? Tous ceux que j'ai utilisés
jusqu'à présent (Free, Teaser et GalacSys) permettaient de modifier
le .htaccess, et il n'y a guère que chez Wanadoo que j'ai entendu
dire que c'était impossible. Or, même dans ce dernier cas, je pense
qu'il y a moyen de dire si on envoie un fichier audio, une image
ou un document HTML -- au fait, comment font ceux qui envoient du
XHTML ?



Je vais faire des .htaccess (je me suis aperçu que mon index n'a pas
d'include initial comme les autres pages) et donc qu'il y a là le
problème d'accents, aussi présent dans d'autres pages que j'ai
modifiées directement sans Seamonkey.

Mon hébergeur est Flexi, en Australie.

Si ton hébergeur ne met pas à ta disposition un moyen de choisir
les entêtes HTTP à envoyer avec tel ou tel document, c'est un très
mauvais hébergeur et tu devrais en changer le plus tôt possible.

D'autant plus qu'avec Apache, même si tu n'as pas accès au
httpd.conf, il est très facile de contrôler ce que tu veux
au moyens des .htaccess répertoire par répertoire.



M'enfin, pourquoi personne ne suggère comme faire un .htaccess
qui résoudrait ce problème ?



Je vois plusieurs raisons à cela :
- tu traînes tes guêtres depuis suffisamment longtemps sur les
groupes php et infosystemes.www pour qu'on ait pensé que tu
le savais déjà ;



Je n'aurais pas posé la question si j'avais su cela...

- la config par .htaccess est plutôt en charte sur fciw.serveurs
ou à la limite fciw.auteurs que fciw.navigateurs ;



Initialement, j'ai pensé avoir un problème de navigateur. C'est
plus tard que j'ai vu que c'était le serveur en soit.

- et bien sûr, si tes pages sont en PHP, un header() est une
solution tout aussi simple, voire plus.



Mais je n'ai plus mon bon vieil éditeur DOS multi-fichiers. Je sais
que je devrais me mettre à emacs ou vim (mon 1er choix étant emacs)
mais pour le moment, je devrais éditer les fichiers un à la fois...

J'ai beaucoup de dossiers dans mon
site et j'ai pu corriger le problème pour un sous-ensemble bien
identifié. Mais il y a peut-être d'autres dossiers où je devrais
ajouter un .htaccess pour m'assurer que tout est bien lu (même si
en théorie, tout est édité avec Seamonkey qui transforme les
lettres accentuées en entités).



Pourquoi ne pas mettre le .htaccess à la racine de ton site, si
tu n'as pas de mélange entre UTF-8 et Latin1 ? D'autant plus qu'il
suffit d'un autre .htaccess dans un sous-sous-sous-répertoire qui
contiendrait exceptionnellement des documents avec un autre jeu de
caractères.



Tout est en latin-1 ou windows 1252.

P.S. Je sais que la solution est donnée sur une page comme
http://www.askapache.com/htaccess/setting-charset-in-htaccess.html
mais je suis surpris que personne n'a donné par réflexe cette
solution.



Cf. supra.



Je devrais pouvoir faire la correction pour l'ensemble du site
cette semaine.


Denis
Avatar
SAM
Le 11/07/11 17:26, Denis Beauregard a écrit :

le fichier inclus dans
tous ces fichiers appelle l'anti-aspirateur de site



je ne sais pas trop ce qu'est un anti-aspirateur de site

cependant ... ne vaudrait-il pas mieux l'avoir dans le .htaccess ?

ne surchargeant dont pas ni les pages ni les accès serveur
te libérant de ce soucis lors de la rédaction de nouvelles pages

<http://www.tutoriaux-excalibur.com/anti-aspirateur.htm>

--
Stéphane Moriaux avec/with iMac-intel
Avatar
Jean-Francois Ortolo
Le 12/07/2011 11:03, SAM a écrit :

je ne sais pas trop ce qu'est un anti-aspirateur de site

cependant ... ne vaudrait-il pas mieux l'avoir dans le .htaccess ?

ne surchargeant dont pas ni les pages ni les accès serveur
te libérant de ce soucis lors de la rédaction de nouvelles pages

<http://www.tutoriaux-excalibur.com/anti-aspirateur.htm>





Bonjour Monsieur

Et... Qu'est-ce que donne un anti-aspirateur de site, avec les
visites des bots des moteurs de recherche, qui sont répétitives ?

Celà ne gêne-t-il pas l'indexation des sites ?

Merci beaucoup de votre réponse.

Bien à vous.

Amicalement.

Jean-François Ortolo

--
Visitez mon site gratuit donnant des Statistiques,
Pronostics et Historiques Graphiques
sur les Courses de Chevaux:
http://www.pronostics-courses.fr
1 2 3 4