Le 19/04/2013 10:08, Jean Francois Ortolo a écrit :
J'ai mis toutes mes lettres accentuées ( ascii étendu )
Je ne peux pas m'empêcher de réagir à chaque fois que je lis « ascii étendu », tant cette expression est inutile et peu informative.
En effet, parmi les extensions d'ascii on trouve aussi bien MacRoman (qui définit un caractère pomme croquée à la position 240) que CP437 (avec tout un tas de caractères pour dessiner des cadres, et qui a même des smileys aux positions 1 et 2), ISO-2022 (où les caractères étendus sont du japonais), et UTF-8 (qui définit tout ça, sauf la pomme croquée qui est dans la zone privée).
de mes textes affichés, en mode lettre html, à part les noms des courses, que théoriquement je peux convertir automatiquement à la volée avec utf8encode ( ou bien iconv() ).
Si tu peux les convertir avec utf8encode, c'est que tous ces caractères appartiennent à ISO-8859-1.
[...]
Ce qui me gêne, c'est surtout les strlen et substr() de mes scripts... ;)
Le 19/04/2013 10:08, Jean Francois Ortolo a écrit :
J'ai mis toutes mes lettres accentuées ( ascii étendu )
Je ne peux pas m'empêcher de réagir à chaque fois que je lis « ascii
étendu », tant cette expression est inutile et peu informative.
En effet, parmi les extensions d'ascii on trouve aussi bien MacRoman
(qui définit un caractère pomme croquée à la position 240) que CP437
(avec tout un tas de caractères pour dessiner des cadres, et qui a
même des smileys aux positions 1 et 2), ISO-2022 (où les caractères
étendus sont du japonais), et UTF-8 (qui définit tout ça, sauf la
pomme croquée qui est dans la zone privée).
de mes textes
affichés, en mode lettre html, à part les noms des courses, que
théoriquement je peux convertir automatiquement à la volée avec
utf8encode ( ou bien iconv() ).
Si tu peux les convertir avec utf8encode, c'est que tous ces caractères
appartiennent à ISO-8859-1.
[...]
Ce qui me gêne, c'est surtout les strlen et substr() de mes scripts... ;)
Le 19/04/2013 10:08, Jean Francois Ortolo a écrit :
J'ai mis toutes mes lettres accentuées ( ascii étendu )
Je ne peux pas m'empêcher de réagir à chaque fois que je lis « ascii étendu », tant cette expression est inutile et peu informative.
En effet, parmi les extensions d'ascii on trouve aussi bien MacRoman (qui définit un caractère pomme croquée à la position 240) que CP437 (avec tout un tas de caractères pour dessiner des cadres, et qui a même des smileys aux positions 1 et 2), ISO-2022 (où les caractères étendus sont du japonais), et UTF-8 (qui définit tout ça, sauf la pomme croquée qui est dans la zone privée).
de mes textes affichés, en mode lettre html, à part les noms des courses, que théoriquement je peux convertir automatiquement à la volée avec utf8encode ( ou bien iconv() ).
Si tu peux les convertir avec utf8encode, c'est que tous ces caractères appartiennent à ISO-8859-1.
[...]
Ce qui me gêne, c'est surtout les strlen et substr() de mes scripts... ;)
Et une bonne pratique est de systématiquement indiquer le jeu de caractères utilisé dans les en-têtes des pages HTML.
Le charset, c'est ça ?
-- Site : http://www.grenault.net Cours photo : http://www.grenault.net/tech.htm Home cinéma : http://www.grenault.net/homecine.htm
Otomatic
Jean Francois Ortolo écrivait :
Mais... IL y a toujours le problème de la database, également à migrer. ;(
Je ne pourrai pas faire l'économie de scripts ad hoc, de lecture/écriture/conversion de mes tables MySQL.
Bonjour,
Requête SQL sur chacune des tables :
ALTER TABLE `ma_table` CONVERT TO CHARSET utf8 COLLATE utf8_general_ci
ne transforme en codage utf-8 QUE ce qui est nécessaire.
Avec un très simple script PHP, pour 212 tables et un total de 32 785 215 enregistrements, c'est l'affaire de deux minutes.
Néanmoins, effectuer une sauvegarde de la base avant.
Nota : pour certaines tables, il peut être nécessaire d'avoir COLLATE utf8_bin à la place de utf8_general_ci -- Les gens que l'on considère comme des fous de travail sont, peut-être, tout simplement entrain de s'amuser. Einstein
Jean Francois Ortolo <ortolo.jeanfrancois_nospam@free.fr.invalid>
écrivait :
Mais... IL y a toujours le problème de la database, également à
migrer. ;(
Je ne pourrai pas faire l'économie de scripts ad hoc, de
lecture/écriture/conversion de mes tables MySQL.
Bonjour,
Requête SQL sur chacune des tables :
ALTER TABLE `ma_table` CONVERT TO CHARSET utf8 COLLATE utf8_general_ci
ne transforme en codage utf-8 QUE ce qui est nécessaire.
Avec un très simple script PHP, pour 212 tables et un total de
32 785 215 enregistrements, c'est l'affaire de deux minutes.
Néanmoins, effectuer une sauvegarde de la base avant.
Nota : pour certaines tables, il peut être nécessaire d'avoir COLLATE
utf8_bin à la place de utf8_general_ci
--
Les gens que l'on considère comme des fous de travail sont, peut-être,
tout simplement entrain de s'amuser. Einstein
Mais... IL y a toujours le problème de la database, également à migrer. ;(
Je ne pourrai pas faire l'économie de scripts ad hoc, de lecture/écriture/conversion de mes tables MySQL.
Bonjour,
Requête SQL sur chacune des tables :
ALTER TABLE `ma_table` CONVERT TO CHARSET utf8 COLLATE utf8_general_ci
ne transforme en codage utf-8 QUE ce qui est nécessaire.
Avec un très simple script PHP, pour 212 tables et un total de 32 785 215 enregistrements, c'est l'affaire de deux minutes.
Néanmoins, effectuer une sauvegarde de la base avant.
Nota : pour certaines tables, il peut être nécessaire d'avoir COLLATE utf8_bin à la place de utf8_general_ci -- Les gens que l'on considère comme des fous de travail sont, peut-être, tout simplement entrain de s'amuser. Einstein
Eric Demeester
GR (Fri, 19 Apr 2013 18:47:45 +0200 - fr.comp.infosystemes.www.auteurs) :
Le 19/04/2013 17:23, Eric Demeester a écrit : > Et une bonne pratique est de systématiquement indiquer le jeu de > caractères utilisé dans les en-têtes des pages HTML. Le charset, c'est ça ?
GR (Fri, 19 Apr 2013 18:47:45 +0200 -
fr.comp.infosystemes.www.auteurs) :
Le 19/04/2013 17:23, Eric Demeester a écrit :
> Et une bonne pratique est de systématiquement indiquer le jeu de
> caractères utilisé dans les en-têtes des pages HTML.
Le charset, c'est ça ?
GR (Fri, 19 Apr 2013 18:47:45 +0200 - fr.comp.infosystemes.www.auteurs) :
Le 19/04/2013 17:23, Eric Demeester a écrit : > Et une bonne pratique est de systématiquement indiquer le jeu de > caractères utilisé dans les en-têtes des pages HTML. Le charset, c'est ça ?
pas tant que ça puisque seuls les caractères spéciaux sont sur plusieurs octets .. en tout cas moins encombrant que des entités HTML
Cordialement,
Tout autant
Otomatic
GR écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra. -- Ce n'est pas parce qu'ils sont nombreux à avoir tort qu'ils ont forcément raison. Coluche
GR <contact@guy-renault.com> écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...
Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.
--
Ce n'est pas parce qu'ils sont nombreux à avoir tort
qu'ils ont forcément raison. Coluche
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra. -- Ce n'est pas parce qu'ils sont nombreux à avoir tort qu'ils ont forcément raison. Coluche
GR
Le 20/04/2013 09:40, Otomatic a écrit :
GR écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
Oui mais comment intervenir sur le serveur ?
-- Site : http://www.grenault.net Cours photo : http://www.grenault.net/tech.htm Home cinéma : http://www.grenault.net/homecine.htm
Le 20/04/2013 09:40, Otomatic a écrit :
GR <contact@guy-renault.com> écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...
Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.
Oui mais comment intervenir sur le serveur ?
--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
Oui mais comment intervenir sur le serveur ?
-- Site : http://www.grenault.net Cours photo : http://www.grenault.net/tech.htm Home cinéma : http://www.grenault.net/homecine.htm
Sergio
Le Sat, 20 Apr 2013 11:43:13 +0200, GR a écrit :
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
(belle absurdité, en passant)
Oui mais comment intervenir sur le serveur ?
Soit dans le .htaccess avec la directive "CharsetDefault", soit en balançant le header adhoc en PHP.
Le Sat, 20 Apr 2013 11:43:13 +0200, GR a écrit :
vous aurez beau mettre une balise html <meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.
(belle absurdité, en passant)
Oui mais comment intervenir sur le serveur ?
Soit dans le .htaccess avec la directive "CharsetDefault", soit en
balançant le header adhoc en PHP.
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
(belle absurdité, en passant)
Oui mais comment intervenir sur le serveur ?
Soit dans le .htaccess avec la directive "CharsetDefault", soit en balançant le header adhoc en PHP.
GR
Le 20/04/2013 09:40, Otomatic a écrit :
GR écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
Tu veux dire qu'une page comportant un Doctype valide et un Charset explicite et ne comportant aucune erreur détectée par le w3c peut être mal interprétée alors que c'est le but du w3c ? C'est grave ça !
La plupart de mes pages (très nombreuses) sont en HTML 4.01 Transitional ou Strict ou en HTML 5 (pages récentes), toutes sans aucune erreur détectée. Maintenant, s'il faut tout reprendre...
-- Site : http://www.grenault.net Cours photo : http://www.grenault.net/tech.htm Home cinéma : http://www.grenault.net/homecine.htm
Le 20/04/2013 09:40, Otomatic a écrit :
GR <contact@guy-renault.com> écrivait :
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne
peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas
suffisant.
Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci
étant prioritaires sur les balises html <meta...
Si le serveur envoie :
Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html
<meta charset="utf-8" />
c'est la déclaration du serveur qui prévaudra.
Tu veux dire qu'une page comportant un Doctype valide et un Charset
explicite et ne comportant aucune erreur détectée par le w3c peut être
mal interprétée alors que c'est le but du w3c ? C'est grave ça !
La plupart de mes pages (très nombreuses) sont en HTML 4.01 Transitional
ou Strict ou en HTML 5 (pages récentes), toutes sans aucune erreur
détectée. Maintenant, s'il faut tout reprendre...
--
Site : http://www.grenault.net
Cours photo : http://www.grenault.net/tech.htm
Home cinéma : http://www.grenault.net/homecine.htm
Oui, je le précise toujours même si ce n'est pas utf-8... Donc il ne peut pas y avoir d'erreur d'interprétation.
Mais si, il peut y avoir erreur d'interprétation.
Déclarer le charset utilisé dans une balise <meta... n'est pas suffisant. Il faut aussi être maître des entêtes envoyées par le serveur, celles-ci étant prioritaires sur les balises html <meta...
Si le serveur envoie : Content-Type: text/html; charset=iso-8859-1
vous aurez beau mettre une balise html <meta charset="utf-8" /> c'est la déclaration du serveur qui prévaudra.
Tu veux dire qu'une page comportant un Doctype valide et un Charset explicite et ne comportant aucune erreur détectée par le w3c peut être mal interprétée alors que c'est le but du w3c ? C'est grave ça !
La plupart de mes pages (très nombreuses) sont en HTML 4.01 Transitional ou Strict ou en HTML 5 (pages récentes), toutes sans aucune erreur détectée. Maintenant, s'il faut tout reprendre...
-- Site : http://www.grenault.net Cours photo : http://www.grenault.net/tech.htm Home cinéma : http://www.grenault.net/homecine.htm