Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Test de page Windows 1252 (lecture sous Mac ou Linux)

11 réponses
Avatar
Denis Beauregard
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.

======

Départements disparus ou renommés
Les pays indiqués sont ceux d’aujourd’hui. À l’époque du changement,
la carte de l’Europe était très différente de celle d’aujourd’hui et
plusieurs pays étaient morcelés. Les changements récents se font en
deux temps: un vote et un changement réel des frontières ou du nom.

======

Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer
progressivement à du UTF8 mais cela demandera beaucoup de temps...
Seamonkey a au moins l'effet secondaire de transformer en entités les
lettres accentuées, ce qui rend le charset non critique.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).


Denis

10 réponses

1 2
Avatar
Dominique Ottello
Denis Beauregard
écrivait :

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.



Utiliser un éditeur de texte capable d'effectuer des recherches
multicritères sur des fichiers multiples.
J'utilise UltraEdit et je viens de faire un essai :
il est capable de retrouver les apostrophes typographiques CP-1252
ouvrantes ‘ (Alt-0145) ou fermantes ’ (Alt-0146) dans 12193 fichiers en
moins de quinze secondes.

D'ailleurs, merci ; ça m'a permis de voir qu'il m'en restait encore dans
trois fichiers.

UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.
--
Ce n'est pas parce qu'ils sont nombreux à avoir tort
qu'ils ont forcément raison. Coluche
Avatar
Anne G
Le 13/07/11 10:47, Denis Beauregard a écrit :
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propre s
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Parfait sous OSX 10.6.7 avec SeaMonkey ou Safari.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).



Pas compris. Éditer comment ?
Avatar
Denis Beauregard
Le Wed, 13 Jul 2011 11:54:01 -0600, Anne G
écrivait dans
fr.comp.infosystemes.www.auteurs:

Le 13/07/11 10:47, Denis Beauregard a écrit :
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Parfait sous OSX 10.6.7 avec SeaMonkey ou Safari.



Merci !

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).



Pas compris. Éditer comment ?



Avec Seamonkey, on peut afficher (c'est le même engin, Gecko, que
Firefox) et aussi modifier ou éditer une page web, avec ctrl-E.

Par défaut, Seamonkey affiche la page et je suppose qu'on peut ajouter
une commande pour que Seamonkey édite directement une page.

Ceci dit, j'ai fini par trouver comment faire...

Dans regedit (Windows 7), il faut modifier au moins la ligne suivante
(et peut-être d'autres):

HKEY_LOCAL_MACHINESOFTWAREClientsStartMenuInternetSEAMONKEY.EXEshelleditcommand

"C:Program Files (x86)SeaMonkeyseamonkey.exe" -edit "%1"

(valeurs par défaut dans les deux cas). Cela ajoute un menu
"modifier".


Denis
Avatar
SAM
Le 13/07/11 19:30, Dominique Ottello a écrit :
Denis Beauregard
écrivait :

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.





Bon, on a vu qu'elle passait bien maintenant ...

Utiliser un éditeur de texte capable d'effectuer des recherches
multicritères sur des fichiers multiples.


(...)
UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.



BBEdit (sur Mac) devrait pouvoir le faire directement sur le serveur.
Mébon ... c'est un soft payant et ... pas prévu pour Windows.

--
Stéphane Moriaux avec/with iMac-intel
Avatar
Sergio
Le 13/07/2011 18:47, Denis Beauregard a écrit :


Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer



FINDSTR en ligne de commande :

FINDSTR /S "’" *.php

progressivement à du UTF8 mais cela demandera beaucoup de temps...
Seamonkey a au moins l'effet secondaire de transformer en entités les
lettres accentuées, ce qui rend le charset non critique.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).




--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Denis Beauregard
Le Thu, 14 Jul 2011 08:52:18 +0200, Sergio
écrivait dans
fr.comp.infosystemes.www.auteurs:

Le 13/07/2011 18:47, Denis Beauregard a écrit :




Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer



FINDSTR en ligne de commande :

FINDSTR /S "’" *.php



Merci beaucoup !

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.


Denis
Avatar
Lea Gris
Le 14/07/2011 15:08, Denis Beauregard a écrit :

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.



Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php

--
Lea Gris
Avatar
Denis Beauregard
Le Thu, 14 Jul 2011 22:06:01 +0200, Lea Gris
écrivait dans fr.comp.infosystemes.www.auteurs:

Le 14/07/2011 15:08, Denis Beauregard a écrit :

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.



Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php



Malheureusement, je n'arrive pas à faire communiquer mon PC avec
Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
(et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).


Denis
Avatar
Olivier Miakinen
Bonjour,

Le 13/07/2011 18:47, Denis Beauregard a écrit :

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php



http://validator.w3.org/check?uri=http%3A%2F%2Fwww.francogene.com%2Frech-fr%2Fdep-fr.php&charset=(detect+automatically)&doctype=Inline&group=0

<cit.>
Line 1031, Column 37: non SGML character number 146

Les pays indiqu&eacute;s sont ceux d’aujourd’hui. &Agrave; l’&eacute;poque
</cit.>

Rigolo : les caractères accentués « é » et « À » sont encodés alors
qu'ils n'en auraient pas besoin, tandis que l'apostrophe typographique
ne l'est pas alors qu'elle le devrait.

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Mon SeaMonkey sur Linux contourne le bug, et l'affiche comme si c'était
du cp1252 bien qu'il s'agisse d'iso-8859-1. Il n'en reste pas moins que
la page est incorrecte (et pas seulement à cause du charset : voir le
doctype).

Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques.



Je ne connais pas cet outil de recherche de Windows 7, mais j'ai déjà
eu de mauvaises expériences avec des outils de recherche sur Windows.
As-tu déjà envisagé d'installer des outils de type Unix (GNU) sur ton
Windows ? <http://www.cygwin.com/&gt;.

Cordialement,
--
Olivier Miakinen
Avatar
Olivier Miakinen
Le 14/07/2011 22:19, Denis Beauregard a écrit :

Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php



Malheureusement, je n'arrive pas à faire communiquer mon PC avec
Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
(et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).



http://www.cygwin.com/
1 2