Test de page Windows 1252 (lecture sous Mac ou Linux)

Le
Denis Beauregard
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Départements disparus ou renommés
Les pays indiqués sont ceux d’aujourd’hui. À l’époque du changement,
la carte de l’Europe était très différente de celle d’aujourd’hui et
plusieurs pays étaient morcelés. Les changements récents se font en
deux temps: un vote et un changement réel des frontières ou du nom.



Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer
progressivement à du UTF8 mais cela demandera beaucoup de temps
Seamonkey a au moins l'effet secondaire de transformer en entités les
lettres accentuées, ce qui rend le charset non critique.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).


Denis
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Dominique Ottello
Le #23560771
Denis Beauregard écrivait :

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.



Utiliser un éditeur de texte capable d'effectuer des recherches
multicritères sur des fichiers multiples.
J'utilise UltraEdit et je viens de faire un essai :
il est capable de retrouver les apostrophes typographiques CP-1252
ouvrantes ‘ (Alt-0145) ou fermantes ’ (Alt-0146) dans 12193 fichiers en
moins de quinze secondes.

D'ailleurs, merci ; ça m'a permis de voir qu'il m'en restait encore dans
trois fichiers.

UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.
--
Ce n'est pas parce qu'ils sont nombreux à avoir tort
qu'ils ont forcément raison. Coluche
Anne G
Le #23560881
Le 13/07/11 10:47, Denis Beauregard a écrit :
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propre s
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Parfait sous OSX 10.6.7 avec SeaMonkey ou Safari.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).



Pas compris. Éditer comment ?
Denis Beauregard
Le #23561021
Le Wed, 13 Jul 2011 11:54:01 -0600, Anne G
fr.comp.infosystemes.www.auteurs:

Le 13/07/11 10:47, Denis Beauregard a écrit :
Bonjour,

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Parfait sous OSX 10.6.7 avec SeaMonkey ou Safari.



Merci !

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).



Pas compris. Éditer comment ?



Avec Seamonkey, on peut afficher (c'est le même engin, Gecko, que
Firefox) et aussi modifier ou éditer une page web, avec ctrl-E.

Par défaut, Seamonkey affiche la page et je suppose qu'on peut ajouter
une commande pour que Seamonkey édite directement une page.

Ceci dit, j'ai fini par trouver comment faire...

Dans regedit (Windows 7), il faut modifier au moins la ligne suivante
(et peut-être d'autres):

HKEY_LOCAL_MACHINESOFTWAREClientsStartMenuInternetSEAMONKEY.EXEshelleditcommand

"C:Program Files (x86)SeaMonkeyseamonkey.exe" -edit "%1"

(valeurs par défaut dans les deux cas). Cela ajoute un menu
"modifier".


Denis
SAM
Le #23561211
Le 13/07/11 19:30, Dominique Ottello a écrit :
Denis Beauregard écrivait :

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.





Bon, on a vu qu'elle passait bien maintenant ...

Utiliser un éditeur de texte capable d'effectuer des recherches
multicritères sur des fichiers multiples.


(...)
UltraEdit est payant, mais Notepad++ devrait pouvoir le faire.



BBEdit (sur Mac) devrait pouvoir le faire directement sur le serveur.
Mébon ... c'est un soft payant et ... pas prévu pour Windows.

--
Stéphane Moriaux avec/with iMac-intel
Sergio
Le #23562441
Le 13/07/2011 18:47, Denis Beauregard a écrit :


Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer



FINDSTR en ligne de commande :

FINDSTR /S "’" *.php

progressivement à du UTF8 mais cela demandera beaucoup de temps...
Seamonkey a au moins l'effet secondaire de transformer en entités les
lettres accentuées, ce qui rend le charset non critique.

En passant, j'aimerais bien savoir comment configurer Windows 7 pour
que Seamonkey édite un fichier directement (sans faire le ctrl-E).




--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Denis Beauregard
Le #23563481
Le Thu, 14 Jul 2011 08:52:18 +0200, Sergio
fr.comp.infosystemes.www.auteurs:

Le 13/07/2011 18:47, Denis Beauregard a écrit :




Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques. Je pourrais sans doute passer



FINDSTR en ligne de commande :

FINDSTR /S "’" *.php



Merci beaucoup !

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.


Denis
Lea Gris
Le #23565031
Le 14/07/2011 15:08, Denis Beauregard a écrit :

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.



Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php

--
Lea Gris
Denis Beauregard
Le #23565021
Le Thu, 14 Jul 2011 22:06:01 +0200, Lea Gris écrivait dans fr.comp.infosystemes.www.auteurs:

Le 14/07/2011 15:08, Denis Beauregard a écrit :

Il y a toutefois un léger problème. Cela détecte presque 16 000 lignes
mais en regardant de près (avec le bloc-notes), ce caractère ne se
trouve que 16 fois. FINDSTR ne fait pas la distinction entre les deux
caractères. Ce sera un peu plus compliqué mais comme je peux réunir en
2 étapes toutes les lignes puis identifier les bonnes lignes, je vais
pouvoir modifier mon site et passer de Windows 1252 à du vrai ISO.



Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php



Malheureusement, je n'arrive pas à faire communiquer mon PC avec
Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
(et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).


Denis
Olivier Miakinen
Le #23566651
Bonjour,

Le 13/07/2011 18:47, Denis Beauregard a écrit :

En changeant la configuration de mon site après reconfiguration
par l'hébergeur, j'ai constaté la présence de caractères propres
à Windows 1252 et qui ne sont pas rendus correctement en ISO.

J'ai identifié la page suivante par hasard et je ne sais pas comment
je pourrais trouver les autres pages avec des apostrophes françaises.

http://www.francogene.com/rech-fr/dep-fr.php



http://validator.w3.org/check?uri=http%3A%2F%2Fwww.francogene.com%2Frech-fr%2Fdep-fr.php&charset=(detect+automatically)&doctype=Inline&group=0

Line 1031, Column 37: non SGML character number 146

Les pays indiqués sont ceux d’aujourd’hui. À l’époque

Rigolo : les caractères accentués « é » et « À » sont encodés alors
qu'ils n'en auraient pas besoin, tandis que l'apostrophe typographique
ne l'est pas alors qu'elle le devrait.

Je voudrais savoir si le texte suivant (aux 2/3 du tableau) est bien
affiché sur un Mac ou sur Linux.



Mon SeaMonkey sur Linux contourne le bug, et l'affiche comme si c'était
du cp1252 bien qu'il s'agisse d'iso-8859-1. Il n'en reste pas moins que
la page est incorrecte (et pas seulement à cause du charset : voir le
doctype).

Si je recherche ’ avec l'outil de recherche de Windows 7, il en trouve
dans tous les fichiers, donc impossible pour le moment de trouver
quelles sont les pages problématiques.



Je ne connais pas cet outil de recherche de Windows 7, mais j'ai déjà
eu de mauvaises expériences avec des outils de recherche sur Windows.
As-tu déjà envisagé d'installer des outils de type Unix (GNU) sur ton
Windows ?
Cordialement,
--
Olivier Miakinen
Olivier Miakinen
Le #23566641
Le 14/07/2011 22:19, Denis Beauregard a écrit :

Avec un shell unix ça serait vite réglé :

perl -pi -e 's/’/'' *.php
find . -type -f -name *.php -exec recode iso-8859-1...UTF-8
perl -pi -e 's/iso-8859-1/utf-8/' *.php



Malheureusement, je n'arrive pas à faire communiquer mon PC avec
Windows 7 avec mon autre PC qui a un Linux Debian mal configuré
(et que je n'ai pas pu remplacé par un Kubuntu l'an dernier).



http://www.cygwin.com/
Publicité
Poster une réponse
Anonyme