Charset utf-8 et entités HTML

Le
Otomatic
Bonjour,

Je viens de passer la totalité de mon site en utf-8 (1)
(Était iso-8859-1, sauf le forum déjà en utf-8)
Avant, pour afficher certains caractères ne faisant pas partie de
iso-8859-1, j'utilisait des entités html comme œ

Avec utf-8, ces entités sont restées et, a priori, ça ne pose pas de
problème d'affichage.

Pour la « beauté du geste » ou la conformité W3C, est-il nécessaire de
remplacer ces entités (sauf &) par leurs caractères en utf-8 ?

-
(1) C'est là que je béni mon éditeur de texte UltraEdit qui, avec un
script (ConvertAllFilesInDirectoryToUTF8.js) a converti 3122 fichiers
(php, txt, html) dans 1064 dossiers sur quatre niveaux de iso-8859-1
vers utf-8 en 44 minutes ; tout en vérifiant que les fichiers n'étaient
pas déjà en utf-8.
--
Un ordinateur résout des problèmes que nous n'aurions pas sans lui
Technique aéronautique : http://aviatechno.net
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Guy
Le #25546532
Le 16/07/2013 11:27, Otomatic a écrit :
Bonjour,

Je viens de passer la totalité de mon site en utf-8 (1)
(Était iso-8859-1, sauf le forum déjà en utf-8)
Avant, pour afficher certains caractères ne faisant pas partie de
iso-8859-1, j'utilisait des entités html comme œ

Avec utf-8, ces entités sont restées et, a priori, ça ne pose pas de
problème d'affichage.

Pour la « beauté du geste » ou la conformité W3C, est-il nécessaire de
remplacer ces entités (sauf &) par leurs caractères en utf-8 ?

-------------------
(1) C'est là que je béni mon éditeur de texte UltraEdit qui, avec un
script (ConvertAllFilesInDirectoryToUTF8.js) a converti 3122 fichiers
(php, txt, html) dans 1064 dossiers sur quatre niveaux de iso-8859-1
vers utf-8 en 44 minutes ; tout en vérifiant que les fichiers n'étaient
pas déjà en utf-8.




Je ne crois pas. En tout cas, je ne l'ai pas fait...

--
Loisirs et Passions
http://www.grenault.net
Sergio
Le #25546582
Le Tue, 16 Jul 2013 11:27:35 +0200, Otomatic a écrit :

Je viens de passer la totalité de mon site en utf-8 (1)
(Était iso-8859-1, sauf le forum déjà en utf-8)
Avant, pour afficher certains caractères ne faisant pas partie de
iso-8859-1, j'utilisait des entités html comme œ

Avec utf-8, ces entités sont restées et, a priori, ça ne pose pas de
problème d'affichage.

Pour la « beauté du geste » ou la conformité W3C, est-il nécessaire de
remplacer ces entités (sauf &) par leurs caractères en utf-8 ?



Non. Un des avantages des entités HTML est de pouvoir taper des
caractères impossibles ou difficiles à taper avec ton clavier.

Imagine-toi, dans un cybercafé (impossible de bricoler le pilote
clavier...), et que tu dois insérer ce fameux caractère *œ* : Il te sera
plus simple de taper "œ" que de chercher le code binaire
correspondant...
Olivier Miakinen
Le #25546642
Bonjour,

Le 16/07/2013 11:27, Otomatic a écrit :

Je viens de passer la totalité de mon site en utf-8 (1)
(Était iso-8859-1, sauf le forum déjà en utf-8)
Avant, pour afficher certains caractères ne faisant pas partie de
iso-8859-1, j'utilisait des entités html comme œ

Avec utf-8, ces entités sont restées et, a priori, ça ne pose pas de
problème d'affichage.

Pour la « beauté du geste » ou la conformité W3C, est-il nécessaire de
remplacer ces entités (sauf &) par leurs caractères en utf-8 ?



Je confirme ce que t'ont répondu Guy et Sergio : il n'y a strictement
aucune obligation à remplacer ces entités par leurs caractères en
UTF-8. Tu peux le faire si tu veux que ton fichier source soit plus
lisible mais c'est juste une question de confort pour le développeur :
pour le visiteur ça ne fera aucune différence.

-------------------
(1) C'est là que je béni mon éditeur de texte UltraEdit qui, avec un
script (ConvertAllFilesInDirectoryToUTF8.js) a converti 3122 fichiers
(php, txt, html) dans 1064 dossiers sur quatre niveaux de iso-8859-1
vers utf-8 en 44 minutes ; tout en vérifiant que les fichiers n'étaient
pas déjà en utf-8.



Voilà qui aurait intéressé Denis Beauregard... et qui pourrait peut-être
encore l'intéresser si jamais il n'était pas sûr d'avoir migré tous ses
fichiers ! (cf. la discussion Hebdogiciel etc.)
Denis Beauregard
Le #25557442
Le Tue, 16 Jul 2013 14:33:56 +0200, Olivier Miakinen

Bonjour,

Le 16/07/2013 11:27, Otomatic a écrit :

(1) C'est là que je béni mon éditeur de texte UltraEdit qui, avec un
script (ConvertAllFilesInDirectoryToUTF8.js) a converti 3122 fichiers
(php, txt, html) dans 1064 dossiers sur quatre niveaux de iso-8859-1
vers utf-8 en 44 minutes ; tout en vérifiant que les fichiers n'étaient
pas déjà en utf-8.



Voilà qui aurait intéressé Denis Beauregard... et qui pourrait peut-être
encore l'intéresser si jamais il n'était pas sûr d'avoir migré tous ses
fichiers ! (cf. la discussion Hebdogiciel etc.)



En théorie, mon site est maintenant 100% UTF-8. Il me reste à valider
ce que j'ai fait et aussi à vérifier si tout est bien conforme. Mais
je prévois de toutes façons refaire tout mon site, ou du moins les
2000 pages qui datent un peu, avec surtout une ré-écriture du contenu,
dans certains cas le passage à des vraies bases de données pour ce
contenu, et une uniformisation de la présentation. Je ne crois pas que
mon site contienne des pages datant de sa création en 1995 mais il y a
beaucoup de contenu qui doit tenir compte des bases de données et
autres ressources maintenant accessibles.

En pratique, j'aimerais bien avoir une façon simple de valider tout
mon contenu, sachant que la vieille partie fait 2000 pages dans 95
dossiers et la nouvelle base de données a dans les 200 000 pages
(c'est une base de données présentée sous forme de pages web et le
contenu est généré d'avance). Pour la vérification, je veux que cela
ne se fasse qu'avec les 2000 vieilles pages et pas les 200 000 !


Denis
Otomatic
Le #25561182
Denis Beauregard écrivait :

En théorie, mon site est maintenant 100% UTF-8. Il me reste à valider
ce que j'ai fait et aussi à vérifier si tout est bien conforme.


Bonjour,

Profitons de cette enfilade pour dire que j'avais oublié de passer en
utf-8 les rares scripts javascript de mon site, sans oublier de
préciser, là aussi, le charset utilisé, par exemple :



--
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant
Technologie aéronautique - http://aviatechno.net - Les anciens de Vilgénis
Publicité
Poster une réponse
Anonyme