é ou é avec 8859-15 ou utf-8 ?

Le
Guy Gruais
Bonjour,

Le site en signature est déclaré "charset=iso-8859-15" mais comporte sur
certaines pages des é è et consorts.
Aucun problème pour la lecture du moins, je le croyais jusqu'à ce
jour où je viens de découvrir le contraire sur le nouveau moteur de
recherche "cuil" !
Or d'autres sites se comportent correctement mais sont en "utf-8".

La solution serait de passer mes pages en utf-8 pour résoudre mon drame.
Oui mais, erreur de jeunesse oblige, à côté de mes "é" figurent
parfois sur les mêmes pages des "é" et consorts qui, eux, ne passent plus en
utf-8.

Et j'ai environ 400 pages à vérifier.
Le jeu en vaut-il la chandelle ?

Merci.

--
Cordialement

guy.siaurg@free.invalid (inverser siaurg pour retrouver gruais)
http://paysderetz.free.fr/
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses Page 1 / 2
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Pierre Goiffon
Le #22071811
Guy Gruais wrote:
Le site en signature est déclaré "charset=iso-8859-15" mais comporte sur
certaines pages des é è et consorts.
Aucun problème pour la lecture ... ... du moins, je le croyais jusqu'à
ce jour où je viens de découvrir le contraire sur le nouveau moteur de
recherche "cuil" !
Or d'autres sites se comportent correctement mais sont en "utf-8".

La solution serait de passer mes pages en utf-8 pour résoudre mon drame.
Oui mais, erreur de jeunesse oblige, à côté de mes "é" figurent
parfois sur les mêmes pages des "é" et consorts qui, eux, ne passent
plus en utf-8.

Et j'ai environ 400 pages à vérifier.
Le jeu en vaut-il la chandelle ?



Je n'ai pas bien compris quel était votre problème ? Vos entités
apparaissent telles quelles sur les pages de résultats du moteur Cuil ?

En ce qui concerne le passage d'entité à "vrai caractère", je pense que
des outils font ça (Tidy ?). Pour le choix du codage, é
correspond au caractère U+00E9 et fait bien partit de ISO Latin-9
(ISO-8859-15).

Plus de détails sont les bienvenus pour mieux vous répondre...
Guy Gruais
Le #22071801
Bonjour,

Vous allez être infiniment heureux d'apprendre que Pierre Goiffon vient
d'écrire :

Je n'ai pas bien compris quel était votre problème ? Vos entités
apparaissent telles quelles sur les pages de résultats du moteur Cuil



Exemple obtenu avec des "é"
Le Pays de Retz (de Rais ou encore de Rays, suivant certaines &critures),
situ& aux confins historiques de la Bretagne et du Poitou entre Nantes et
l'oc&an, au Sud-Loire, avait besoin d'une soci&t& qui puisse faire conna&tre
son pass& et les diff&rents soubresauts qui l'ont agit&. Cr&&e en 1981, la
Société des...

Ainsi les "é" sont traduits par des "&" alors que les "é"
apparaissent correctement "la Société des ..."

Alors que si je passe tout en "utf-8" la même phrase donne :

Le Pays de Retz (de Rais ou encore de Rays, suivant certaines écritures
anciennes), situé aux confins historiques de la Bretagne et du Poitou entre
Nantes et l'océan, au Sud-Loire, avait besoin d'une société qui puisse faire
connaître son passé et les différents soubresauts qui l'ont agité. Créée en
1981, la Soci?t?

les "é" deviennent des "?"

... Pour le choix du codage, é
correspond au caractère U+00E9 et fait bien partit de ISO Latin-9
(ISO-8859-15).



Oui

Plus de détails sont les bienvenus pour mieux vous répondre...



Si je veux être cohérent, je dois donc tout passer en utf-8 *ET* remplacer
mes "é" par des "é"
Le jeu en vaut-il la chandelle vu le nombre de pages et le fait que le site
est essentiellement destiné à des français.

--
Cordialement

(inverser siaurg pour retrouver gruais)
http://paysderetz.free.fr/
Sergio
Le #22071791
Guy Gruais a couché sur son écran :
Bonjour,

Le site en signature est déclaré "charset=iso-8859-15" mais comporte sur
certaines pages des é è et consorts.



Rien à dire...

Aucun problème pour la lecture ... ... du moins, je le croyais jusqu'à ce
jour où je viens de découvrir le contraire sur le nouveau moteur de recherche
"cuil" !



Site en alpha-test et américano-centré (du moins aujourd'hui). Donc,
pour l'instant, la gestion du charset est le cadet de leurs soucis...

Or d'autres sites se comportent correctement mais sont en "utf-8".

Et j'ai environ 400 pages à vérifier.
Le jeu en vaut-il la chandelle ?



Non. Attendre que les programmeurs du moteurs aient corrigé le tir (tu
ne dois pas être le seul...).

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Denis Beauregard
Le #22071781
Le Wed, 30 Jul 2008 12:15:57 +0200, "Guy Gruais"
fr.comp.infosystemes.www.auteurs:

Bonjour,

Le site en signature est déclaré "charset=iso-8859-15" mais comporte sur
certaines pages des é è et consorts.
Aucun problème pour la lecture ... ... du moins, je le croyais jusqu'à ce
jour où je viens de découvrir le contraire sur le nouveau moteur de
recherche "cuil" !



Moi je leur écrirais pour leur décrire le problème. Il y a une
adresse feedback@ sur le site pour ce type de commentaire.

J'ai vu autre chose d'étrange chez eux. En recherchant mon nom,
les trois premières pages donnent toutes des résultats me
concernant (mon site et d'autres sites ou messages usenet) mais il
y a aussi la photo d'un inconnu (et je connais beaucoup de gens dans
mon milieu) associée à un lien sur mon site. J'ai fait la même
recherche avec un ancien premier ministre du Québec bien connu et
dans son cas, c'est sa photo qui sortait en général.

D'après Alexa, le trafic débute au début de juillet. Donc, c'est
vraiment en période de lancement. Certains disent que ce sont des
anciens employés de google qui l'ont lancé. À 1re vue, c'est très
possible mais Google pourrait facilement reprendre les concepts
qu'ils ajoutent, alors je me demande si un nouveau moteur pourrait
survivre économiquement !


Denis
Guy Gruais
Le #22071771
Bonjour,

Vous allez être infiniment heureux d'apprendre que Sergio vient d'écrire :


Non. Attendre que les programmeurs du moteurs aient corrigé le tir


C'est bien ce que je me disais

(tu
ne dois pas être le seul...).


Non, j'ai remarqué.

--
Cordialement

(inverser siaurg pour retrouver gruais)
http://paysderetz.free.fr/
Guy Gruais
Le #22071761
Bonjour,

Vous allez être infiniment heureux d'apprendre que Denis Beauregard vient
d'écrire :


Moi je leur écrirais pour leur décrire le problème.



A vrai dire, pas trop envie.
Je crois qu'ils ont d'autres priorités pour l'instant
.
J'ai vu autre chose d'étrange chez eux.



Moi aussi. Le site en signature traite de l'histoire du Pays de Retz et
n'apparaît qu'en 6ème page sur leur moteur alors que Google le mentionne en
4ème position de la 1ère page.

... Certains disent que ce sont des
anciens employés de google qui l'ont lancé. À 1re vue, c'est très
possible



Voir :
http://www.generation-nt.com/cuil-moteur-recherche-concurrent-google-indexation-actualite-129501.html

mais Google pourrait facilement reprendre les concepts
qu'ils ajoutent, alors je me demande si un nouveau moteur pourrait
survivre économiquement !



Tiens pour une fois je vais faire de l'anglais : Wait and see

--
Cordialement

(inverser siaurg pour retrouver gruais)
http://paysderetz.free.fr/
Pierre Goiffon
Le #22071751
Denis Beauregard wrote:
J'ai vu autre chose d'étrange chez eux. En recherchant mon nom,
les trois premières pages donnent toutes des résultats me
concernant (mon site et d'autres sites ou messages usenet) mais il
y a aussi la photo d'un inconnu (et je connais beaucoup de gens dans
mon milieu) associée à un lien sur mon site. J'ai fait la même
recherche avec un ancien premier ministre du Québec bien connu et
dans son cas, c'est sa photo qui sortait en général.



Voir cet article de Techcrunch, qui a rencontré le mm prb :
http://feeds.feedburner.com/~r/francaistechcrunch/~3/350146875/story01.htm
Pierre Goiffon
Le #22071741
Guy Gruais wrote:
Je n'ai pas bien compris quel était votre problème ? Vos entités
apparaissent telles quelles sur les pages de résultats du moteur Cuil



Exemple obtenu avec des "é"



Mais votre exemple a été obtenu où nom de Zeus ??
Soyez gentil de donner un minimum d'informations... Est-ce bien sur les
pages de résultats de recherche du moteur Cuil comme je l'imaginais ?
Guy Gruais
Le #22071691
Bonjour,

Vous allez être infiniment heureux d'apprendre que Pierre Goiffon vient
d'écrire :


Mais votre exemple a été obtenu où nom de Zeus ??
Soyez gentil de donner un minimum d'informations... Est-ce bien sur
les pages de résultats de recherche du moteur Cuil comme je
l'imaginais ?



A mon tour de m'étonner de votre réaction. :-)

J'ai bien écrit dans mon premier message :

Aucun problème pour la lecture ... ... du moins, je le croyais jusqu'à ce




jour où je viens de découvrir le contraire sur le nouveau moteur de
recherche "cuil" !

Ce site a commencé à être mis en ligne il y a plus de 4 ans et je n'avais
jamais constaté de problème de lecture, personne ne m'a signalé non plus le
moindre problème.
C'est en consultant le moteur de recherche "cuil" que j'ai vu sur *SES pages
de résultats* l'anomalie.
A ce jour, il n'y a que *LA* que j'ai pu constater ce phénomène.

--
Cordialement

(inverser siaurg pour retrouver gruais)
http://paysderetz.free.fr/
Laurent vilday
Le #22071681
Guy Gruais a écrit :
Ce site a commencé à être mis en ligne il y a plus de 4 ans et je
n'avais jamais constaté de problème de lecture, personne ne m'a signalé
non plus le moindre problème.



Hurm, que personne ne signale un problème n'est en rien un indicatif
fiable de la qualité technique du site. Parce que des problèmes, y'en a
un sacré paquet, de plus si c'est reproduit sur 400 documents statiques
(entendre non dynamiques, en .html des grand mères quoi), t'es pas sorti
des problèmes.


Ligne 0 (Hors code) * Aspect repoussant, web de 1995
*********************

"Actualités", écrit verticalement dans des couleurs pas top lisisibles,
mais surtout, il clignote. Ca pique les yeux.

Ligne 1 * DTD en mode de rendu quirks (IE)
*********
<!DOCTYPE HTML PUBLIC
"-//W3C//DTD HTML 4.01 Transitional//EN">

-> lire (entre autre) quirksBlog

-> passer en DTD avec mode de rendu standard
<!DOCTYPE HTML PUBLIC
"-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">


Ligne 7 * Format de date litigieux
*********
<meta name="creation_date" content="Janvier 2004">

-> au dela du fait que je ne connaissais pas "creation_date" (d'ailleurs
qui l'utilise à quelle fin ?), je doute *très* fortement qu'une date
française incomplète soit valide. Alors comme ça, sans me renseigner sur
ce meta, je dirais :

<meta name="creation_date" content="01/01/2004">

Lignes 15 à 31 * Javascript inefficace, suspicions de copié/collé sans
**************** comprendre.

-> lire
Lignes 32 à 76 * CSS qui ferait bien mieux d'être sans son fichier.css
****************

-> pas vraiment une erreur, mais pourquoi lier le fichier shpr.css en
ligne 7 et ne pas le faire ici ?

Ligne 78 * Commentaire mensongé à enlever
**********

<!--valide w3qc sous réserve de l'attribut noscript de Xiti-->

W3QC ? C'est mignon tout plein mais c'est quoi ? :D

-> Ne pas ajouter des commentaires HTML, ça ne sert à rien, à plus forte
raison quand le commentaire est faux ! J'aimerais bien voir ça que le
W3C valide un tel document. Ah ben non, bien comme je le pensais, le
validator HTML en veux pas du tout : 67 erreurs

Lignes 79 à 82 * Syndrome de Divitis aigüe
****************

<body><p>&nbsp;</p>

<div align="center">
<div class="boite">
<div class="left">

-> Les DIV c'est gentil, mais il y a un moment faut arrêter de mettre
des DIV dans des DIV dans des DIV, etc.

Lignes 94 à 98 * Obfuscation inutile d'un email
****************
<script type="text/javascript">
//<![CDATA[
var d="";
for( var i = 0 ; i < 338 ; i++ )
d += String.fromCharCode(("X...X".charCodeAt(i)+59)%95+32);
eval(d)
//]]>
</script>

Déjà, c'est du HTML 4.01 (mode quirks), donc que viennent faire les
saloperies XHTML dans l'histoire ?

(//<![CDATA[ et //]]>

Ce sont des trucs XHTML, rien à faire dans du HTML 4.01.

TOUT ça juste pour créer un bête lien mailto ??? Lien dans une forme
PLUS que douteuse.

<a
href=""
onmouseover="this.href='mailto:XXX'"
onmouseout="this.href=''">Contactez-nous</a>

Donc,
-> abandonner le javascript foireux à base de eval() qui génère du
HTML <a href="mailto:"> tout pourri,
-> créer un page "contact" et gérer soit même les contacts avec les
visiteurs

Ligne 101 * <div class="cadre"><br><br><br><br>
***********

C'est pas sérieux tous ces BR ? Si ?

-> enlever les <BR>, il ne servent pas et ne serviront jamais à
modifier l'aspect des autres éléments.
-> Utiliser CSS à la place.

Ligne 103 * Et c'est parti pour un <TABLE> de mise en page
***********

-> Là ça devient ridicule, quand la mise en forme est hyper chiadée je
veux bien ignorer les mises en page par <TABLE> d'un designer un peu
hésitant sur les CSS, à la limite.
Mais là ? Je ne vois aucune raison à une mise en forme par tableau, on
peut pas dire que le layout soit compliqué. Tout est les uns sous les
autres, pas de colonnage, pas de problèmes de hauteurs identiques de
tous les éléments, etc.
-> Enlever la mise en forme par <TABLE>

Lignes 150 à 200 * <map><area></map> N'est plus vraiment d'actualité
****************** mais bon, pourquoi pas.

<area nohref="#"> x 50 fois

-> nohref est booléen, # n'est pas une valeur valide

<area href="d_accam.html" shape="polygon" coords="....

-> "polygon" n'est pas une valeur valide, c'est "poly"


-> pourquoi faire le "this.blur()" ?

Lignes 220 à 238 * Code Xiti tout foireux
******************

-> abandonner Xiti, ça ne sert à rien et c'est pas fiable. Lui préférer
une analyse de log sur serveur, ça au moins c'est fiable.

-> au pire écrire du joli code javascript, pas une horreur telle que
celle là.

-> au moins restructurer pour faire sortir l'élément de type "block" de
l'élément de type "inline".

A est inline
NOSCRIPT est block

Impossible donc d'écrire ceci :
<a href="#"><noscript></noscript></a>



Enfin bref, comme tu peux le constater, des problèmes il y en a. Et
encore, j'ai regardé que la page d'accueil, j'imagine même pas les
horreurs qui doivent se cacher sur le reste des pages.

Y'a bien un window.open qui doit se cacher quelque part :)

--
laurent
Publicité
Poster une réponse
Anonyme