Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Charset en HTML 5

41 réponses
Avatar
GR
Bonjour,

Le charset pour HTML 5 est changé pour l'Europe ?

"Warning: Legacy encoding windows-1252 used. Documents should use UTF-8"

C'est un avertissement mais je n'aime pas ça !

Pas envie d'écrire ainsi écrire...

Des avis ?

Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm

10 réponses

1 2 3 4 5
Avatar
Olivier Miakinen
Bonjour,

Le 19/04/2013 10:08, Jean Francois Ortolo a écrit :

J'ai mis toutes mes lettres accentuées ( ascii étendu )



Je ne peux pas m'empêcher de réagir à chaque fois que je lis « ascii
étendu », tant cette expression est inutile et peu informative.

En effet, parmi les extensions d'ascii on trouve aussi bien MacRoman
(qui définit un caractère pomme croquée à la position 240) que CP437
(avec tout un tas de caractères pour dessiner des cadres, et qui a
même des smileys aux positions 1 et 2), ISO-2022 (où les caractères
étendus sont du japonais), et UTF-8 (qui définit tout ça, sauf la
pomme croquée qui est dans la zone privée).

de mes textes
affichés, en mode lettre html, à part les noms des courses, que
théoriquement je peux convertir automatiquement à la volée avec
utf8encode ( ou bien iconv() ).



Si tu peux les convertir avec utf8encode, c'est que tous ces caractères
appartiennent à ISO-8859-1.

[...]

Ce qui me gêne, c'est surtout les strlen et substr() de mes scripts... ;)



http://fr2.php.net/mb_strlen
http://fr2.php.net/mb_substr


Cordialement,
--
Olivier Miakinen
Avatar
GR
Le 19/04/2013 17:23, Eric Demeester a écrit :


Et une bonne pratique est de systématiquement indiquer le jeu de
caractères utilisé dans les en-têtes des pages HTML.




Le charset, c'est ça ?

--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
Avatar
Otomatic
Jean Francois Ortolo
écrivait :

Mais... IL y a toujours le problème de la database, également à
migrer. ;(

Je ne pourrai pas faire l'économie de scripts ad hoc, de
lecture/écriture/conversion de mes tables MySQL.



Bonjour,

Requête SQL sur chacune des tables :

ALTER TABLE `ma_table` CONVERT TO CHARSET utf8 COLLATE utf8_general_ci

ne transforme en codage utf-8 QUE ce qui est nécessaire.

Avec un très simple script PHP, pour 212 tables et un total de
32 785 215 enregistrements, c'est l'affaire de deux minutes.

Néanmoins, effectuer une sauvegarde de la base avant.

Nota : pour certaines tables, il peut être nécessaire d'avoir COLLATE
utf8_bin à la place de utf8_general_ci
--
Les gens que l'on considère comme des fous de travail sont, peut-être,
tout simplement entrain de s'amuser. Einstein
Avatar
Eric Demeester
GR (Fri, 19 Apr 2013 18:47:45 +0200 -
fr.comp.infosystemes.www.auteurs) :

Le 19/04/2013 17:23, Eric Demeester a écrit :
> Et une bonne pratique est de systématiquement indiquer le jeu de
> caractères utilisé dans les en-têtes des pages HTML.
Le charset, c'est ça ?



Pile-poil. En HTML5 :

<!DOCTYPE html>
<html lang="fr">
<head>
<meta charset="utf-8" />
...
</head>

--
Eric
Avatar
GR
Le 19/04/2013 23:25, Eric Demeester a écrit :
GR (Fri, 19 Apr 2013 18:47:45 +0200 -
fr.comp.infosystemes.www.auteurs) :

Le 19/04/2013 17:23, Eric Demeester a écrit :
Et une bonne pratique est de systématiquement indiquer le jeu de
caractères utilisé dans les en-têtes des pages HTML.


Le charset, c'est ça ?



Pile-poil. En HTML5 :

<!DOCTYPE html>
<html lang="fr">
<head>
<meta charset="utf-8" />
...
</head>




Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.

--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
Avatar
BertrandB
Le 19/04/2013 14:34, SAM a écrit :

Il parait surtout que c'est plus encombrant ...


pas tant que ça puisque seuls les caractères spéciaux sont sur plusieurs
octets ..
en tout cas moins encombrant que des entités HTML

Cordialement,


Tout autant
Avatar
Otomatic
GR écrivait :

Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.


Mais si, il peut y avoir erreur d'interprétation.

Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...

Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1

vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.
--
Ce n'est pas parce qu'ils sont nombreux à avoir tort
qu'ils ont forcément raison. Coluche
Avatar
GR
Le 20/04/2013 09:40, Otomatic a écrit :
GR écrivait :

Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.


Mais si, il peut y avoir erreur d'interprétation.

Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...

Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1

vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.




Oui mais comment intervenir sur le serveur ?

--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
Avatar
Sergio
Le Sat, 20 Apr 2013 11:43:13 +0200, GR a écrit :

vous aurez beau mettre une balise html <meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.





(belle absurdité, en passant)

Oui mais comment intervenir sur le serveur ?



Soit dans le .htaccess avec la directive "CharsetDefault", soit en
balançant le header adhoc en PHP.
Avatar
GR
Le 20/04/2013 09:40, Otomatic a écrit :
GR écrivait :

Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.


Mais si, il peut y avoir erreur d'interprétation.

Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...

Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1

vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.




Tu veux dire qu'une page comportant un Doctype valide et un Charset
explicite et ne comportant aucune erreur détectée par le w3c peut être
mal interprétée alors que c'est le but du w3c ? C'est grave ça !

La plupart de mes pages (très nombreuses) sont en HTML 4.01 Transitional
ou Strict ou en HTML 5 (pages récentes), toutes sans aucune erreur
détectée. Maintenant, s'il faut tout reprendre...

--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
1 2 3 4 5