Caractères grec utf-8 non visible en local sur Mozilla avec EasyPHP

loufoque

26/07/2004 à 20:56

Dominique Ottello a dit le 26/07/2004 20:06:

Aurais-je oublié un paramètre dans php.ini ? où dans Apache ? ou alors
simplement dans Mozilla ?

C'est du côté de PHP.
Par défaut, PHP envoie en ISO-8859-1.

Donc en php, fais header('Content-Type: text/html; charset=UTF-8'); au
début de tes scripts en UTF-8.

Pierre Goiffon

26/07/2004 à 22:05

loufoque wrote:

Aurais-je oublié un paramètre dans php.ini ? où dans Apache ? ou
alors simplement dans Mozilla ?

C'est du côté de PHP.
Par défaut, PHP envoie en ISO-8859-1.

Donc en php, fais header('Content-Type: text/html; charset=UTF-8'); au
début de tes scripts en UTF-8.

Car le charset peut être déclaré de 2 façons : par le meta ou dans les
entêtes HTTP. Et c'est al 2eme solution qui est prioritaire :

http://www.w3.org/TR/html401/charset.html#h-5.2.2

TOUJOURS indiquer le bon codage dans les entêtes HTTP...

Dominique Ottello

27/07/2004 à 17:09

"Pierre Goiffon" écrivait :

http://www.w3.org/TR/html401/charset.html#h-5.2.2

TOUJOURS indiquer le bon codage dans les entêtes HTTP...

Merci.
C'était bien ça, il fallait que je surpasse le codage par défaut envoyé
dans les entêtes HTTP.
--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Dominique Ottello

28/07/2004 à 16:34

Dominique Ottello écrivait :

"Pierre Goiffon" écrivait :

> http://www.w3.org/TR/html401/charset.html#h-5.2.2
>
> TOUJOURS indiquer le bon codage dans les entêtes HTTP...

Merci.
C'était bien ça, il fallait que je surpasse le codage par défaut envoyé
dans les entêtes HTTP.

Bonjour,

Si tout semble bien se passer tant en local qu'en distant, il y a quand
même un problème de validation par le w3c, problème que l'on peut voir
en regardant le source d'une page dont le header contient un
charset=utf-8 et qui donne l'erreur suivante :

 
Warning:
Cannot modify header information - headers already sent by (output
started at /var/www/free.fr/3/4/aviatechno/unites/alphagrec.php:1) in
/var/www/free.fr/3/4/aviatechno/inc/entete.php on line
2 

Cela n'a lieu QUE pour les header avec charset utf-8 et pas pour le
charset iso-8859-1, alors que TOUTES les entêtes de mes pages sont
identiques, à l'exception du charset et du title :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>
<div class="fl80pc">
etc...

et voici le fichier include entete.php :

<?php
header("content-type:text/html; charset=$charset");
echo "<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN"
"http://www.w3.org/TR/html4/strict.dtd">n";
echo "<html>n";
echo "<head>n";
echo "<META http-equiv="content-type" content="text/html;
charset=$charset">n";
echo "<META http-equiv="Content-Language" content="fr">n";
echo "<TITLE>$titre</TITLE>n";
echo "<META name="GENERATOR" content="A la main avec UltraEdit">n";
echo "<META name="author" content="Dominique Ottello">n";
echo "<META name="identifier-URL"
content="http://www.ottello.net">n";
echo "<META name="robots" content="index, follow">n";
echo "<META name="date-creation-yyyymmdd" content="20031115">n";
echo "<META name="date-revision-yyyymmdd" content="20040727">n";
echo "<META name="revisit-after" content="1 month">n";
echo "<META name="keywords" lang="fr" content="....">n";
echo "<META name="description" content="....">n";
foreach($style as $filecss)
{echo "<liNK rel="StyleSheet" type="text/css"
href="$dossier$filecss.css">n";}
?>

Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
unique fois dans le fichier entete.php.

Donc, je ne comprends absolument pas d'où peut provenir cette erreur.

Auriez-vous quelque voie de recherche ?

Merci.
--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Dominique Ottello <air.intakes@fra.fr.invalid> écrivait :

"Pierre Goiffon" <pgoiffon@fr.invalid> écrivait :

> http://www.w3.org/TR/html401/charset.html#h-5.2.2
>
> TOUJOURS indiquer le bon codage dans les entêtes HTTP...

Merci.
C'était bien ça, il fallait que je surpasse le codage par défaut envoyé
dans les entêtes HTTP.

Bonjour,

Si tout semble bien se passer tant en local qu'en distant, il y a quand
même un problème de validation par le w3c, problème que l'on peut voir
en regardant le source d'une page dont le header contient un
charset=utf-8 et qui donne l'erreur suivante :

 
Warning:
Cannot modify header information - headers already sent by (output
started at /var/www/free.fr/3/4/aviatechno/unites/alphagrec.php:1) in
/var/www/free.fr/3/4/aviatechno/inc/entete.php on line
2 

Cela n'a lieu QUE pour les header avec charset utf-8 et pas pour le
charset iso-8859-1, alors que TOUTES les entêtes de mes pages sont
identiques, à l'exception du charset et du title :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>
<div class="fl80pc">
etc...

et voici le fichier include entete.php :

<?php
header("content-type:text/html; charset=$charset");
echo "<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN"
"http://www.w3.org/TR/html4/strict.dtd">n";
echo "<html>n";
echo "<head>n";
echo "<META http-equiv="content-type" content="text/html;
charset=$charset">n";
echo "<META http-equiv="Content-Language" content="fr">n";
echo "<TITLE>$titre</TITLE>n";
echo "<META name="GENERATOR" content="A la main avec UltraEdit">n";
echo "<META name="author" content="Dominique Ottello">n";
echo "<META name="identifier-URL"
content="http://www.ottello.net">n";
echo "<META name="robots" content="index, follow">n";
echo "<META name="date-creation-yyyymmdd" content="20031115">n";
echo "<META name="date-revision-yyyymmdd" content="20040727">n";
echo "<META name="revisit-after" content="1 month">n";
echo "<META name="keywords" lang="fr" content="....">n";
echo "<META name="description" content="....">n";
foreach($style as $filecss)
{echo "<liNK rel="StyleSheet" type="text/css"
href="$dossier$filecss.css">n";}
?>

Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
unique fois dans le fichier entete.php.

Donc, je ne comprends absolument pas d'où peut provenir cette erreur.

Auriez-vous quelque voie de recherche ?

Merci.
--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Vous avez filtré cet utilisateur ! Consultez son message

Dominique Ottello écrivait :

"Pierre Goiffon" écrivait :

> http://www.w3.org/TR/html401/charset.html#h-5.2.2
>
> TOUJOURS indiquer le bon codage dans les entêtes HTTP...

Merci.
C'était bien ça, il fallait que je surpasse le codage par défaut envoyé
dans les entêtes HTTP.

Bonjour,

Si tout semble bien se passer tant en local qu'en distant, il y a quand
même un problème de validation par le w3c, problème que l'on peut voir
en regardant le source d'une page dont le header contient un
charset=utf-8 et qui donne l'erreur suivante :

 
Warning:
Cannot modify header information - headers already sent by (output
started at /var/www/free.fr/3/4/aviatechno/unites/alphagrec.php:1) in
/var/www/free.fr/3/4/aviatechno/inc/entete.php on line
2 

Cela n'a lieu QUE pour les header avec charset utf-8 et pas pour le
charset iso-8859-1, alors que TOUTES les entêtes de mes pages sont
identiques, à l'exception du charset et du title :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>
<div class="fl80pc">
etc...

et voici le fichier include entete.php :

<?php
header("content-type:text/html; charset=$charset");
echo "<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN"
"http://www.w3.org/TR/html4/strict.dtd">n";
echo "<html>n";
echo "<head>n";
echo "<META http-equiv="content-type" content="text/html;
charset=$charset">n";
echo "<META http-equiv="Content-Language" content="fr">n";
echo "<TITLE>$titre</TITLE>n";
echo "<META name="GENERATOR" content="A la main avec UltraEdit">n";
echo "<META name="author" content="Dominique Ottello">n";
echo "<META name="identifier-URL"
content="http://www.ottello.net">n";
echo "<META name="robots" content="index, follow">n";
echo "<META name="date-creation-yyyymmdd" content="20031115">n";
echo "<META name="date-revision-yyyymmdd" content="20040727">n";
echo "<META name="revisit-after" content="1 month">n";
echo "<META name="keywords" lang="fr" content="....">n";
echo "<META name="description" content="....">n";
foreach($style as $filecss)
{echo "<liNK rel="StyleSheet" type="text/css"
href="$dossier$filecss.css">n";}
?>

Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
unique fois dans le fichier entete.php.

Donc, je ne comprends absolument pas d'où peut provenir cette erreur.

Auriez-vous quelque voie de recherche ?

Merci.
--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Thibaut Allender

28/07/2004 à 16:53

on 28/07/2004 16:34, Dominique Ottello wrote :

Si tout semble bien se passer tant en local qu'en distant, il y a quand
même un problème de validation par le w3c, problème que l'on peut voir
en regardant le source d'une page dont le header contient un
charset=utf-8 et qui donne l'erreur suivante :

 
Warning:
Cannot modify header information - headers already sent by (output
started at /var/www/free.fr/3/4/aviatechno/unites/alphagrec.php:1) in
/var/www/free.fr/3/4/aviatechno/inc/entete.php on line
2

moi je vois cette erreur directement en allant sur
http://aviatechno.free.fr/unites/alphagrec.php

Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
unique fois dans le fichier entete.php.

Donc, je ne comprends absolument pas d'où peut provenir cette erreur.
Auriez-vous quelque voie de recherche ?

il y a un retour chariot qui doit trainer avant les variables dans cette
page

es-tu certain qu'il n'y a absolument *rien* avant ceci :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>

??

--
thibaut allender | freelance | web|system developer|designer
+32 496 26 75 76 | http://capsule.org *new version*

Dominique Ottello

28/07/2004 à 18:02

Thibaut Allender
écrivait :

moi je vois cette erreur directement en allant sur
http://aviatechno.free.fr/unites/alphagrec.php

> Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
> unique fois dans le fichier entete.php.
>
> Donc, je ne comprends absolument pas d'où peut provenir cette erreur.
> Auriez-vous quelque voie de recherche ?

il y a un retour chariot qui doit trainer avant les variables dans cette
page

es-tu certain qu'il n'y a absolument *rien* avant ceci :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>

Je vais re-re-re-vérifier, mais je suis sûr que non.

Quelques temps après.....

Trouvé !

C'est là que le mode hexadécimal d'UltraEdit est vraiment utile.

Le fichier contenant l'entête sus-mentionnée et déclarant un
charset=utf-8 est un fichier qui, bien sûr, pour supporter ce type de
codage est écrit en unicode, donc avec des caractères codés sur 16 bits.

Un fichier "normal", codé 8 bits ascii commence par <? soit, en hexa :
3C 3F et, le même fichier mais codé unicode commence par : FFFE 3C00
3F00 ; il y a donc bien deux octets qui sont envoyés avant <?php.

J'ai donc séparé mes fichiers codés unicode en deux parties :
Une partie entête codée en ascii 8bits et appelant en include la
deuxième partie qui, elle, est bien codée en unicode.

Et c'est là que les conversions de transcodage incluses dans UltraEdit
font merveille.

Les deux fichiers incriminés : alphabet grec et unités mécaniques
viennent d'être scindés en deux parties (transparent pour l'utilisateur)
et ne donnent plus d'erreur.

CQFD et merci à UltraEdit.

--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Thibaut Allender <use_contact_form_on_website@n.o.s.p.a.m.capsule.org>
écrivait :

moi je vois cette erreur directement en allant sur
http://aviatechno.free.fr/unites/alphagrec.php

> Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
> unique fois dans le fichier entete.php.
>
> Donc, je ne comprends absolument pas d'où peut provenir cette erreur.
> Auriez-vous quelque voie de recherche ?

il y a un retour chariot qui doit trainer avant les variables dans cette
page

es-tu certain qu'il n'y a absolument *rien* avant ceci :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>

Je vais re-re-re-vérifier, mais je suis sûr que non.

Quelques temps après.....

Trouvé !

C'est là que le mode hexadécimal d'UltraEdit est vraiment utile.

Le fichier contenant l'entête sus-mentionnée et déclarant un
charset=utf-8 est un fichier qui, bien sûr, pour supporter ce type de
codage est écrit en unicode, donc avec des caractères codés sur 16 bits.

Un fichier "normal", codé 8 bits ascii commence par <? soit, en hexa :
3C 3F et, le même fichier mais codé unicode commence par : FFFE 3C00
3F00 ; il y a donc bien deux octets qui sont envoyés avant <?php.

J'ai donc séparé mes fichiers codés unicode en deux parties :
Une partie entête codée en ascii 8bits et appelant en include la
deuxième partie qui, elle, est bien codée en unicode.

Et c'est là que les conversions de transcodage incluses dans UltraEdit
font merveille.

Les deux fichiers incriminés : alphabet grec et unités mécaniques
viennent d'être scindés en deux parties (transparent pour l'utilisateur)
et ne donnent plus d'erreur.

CQFD et merci à UltraEdit.

--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Vous avez filtré cet utilisateur ! Consultez son message

Thibaut Allender
écrivait :

moi je vois cette erreur directement en allant sur
http://aviatechno.free.fr/unites/alphagrec.php

> Dans TOUTES mes pages l'instruction header() n'existe qu'une seule et
> unique fois dans le fichier entete.php.
>
> Donc, je ne comprends absolument pas d'où peut provenir cette erreur.
> Auriez-vous quelque voie de recherche ?

il y a un retour chariot qui doit trainer avant les variables dans cette
page

es-tu certain qu'il n'y a absolument *rien* avant ceci :

<?php
$titre="Les Unités - Alphabet Grec";
$charset="utf-8";
$dossier="../";
$style[0]="general";
$style[1]="unites";
include('../inc/entete.php');
echo "</head>n";
echo "<body>n";
include('../inc/tablemat_unites.php');
?>

Je vais re-re-re-vérifier, mais je suis sûr que non.

Quelques temps après.....

Trouvé !

C'est là que le mode hexadécimal d'UltraEdit est vraiment utile.

Le fichier contenant l'entête sus-mentionnée et déclarant un
charset=utf-8 est un fichier qui, bien sûr, pour supporter ce type de
codage est écrit en unicode, donc avec des caractères codés sur 16 bits.

Un fichier "normal", codé 8 bits ascii commence par <? soit, en hexa :
3C 3F et, le même fichier mais codé unicode commence par : FFFE 3C00
3F00 ; il y a donc bien deux octets qui sont envoyés avant <?php.

J'ai donc séparé mes fichiers codés unicode en deux parties :
Une partie entête codée en ascii 8bits et appelant en include la
deuxième partie qui, elle, est bien codée en unicode.

Et c'est là que les conversions de transcodage incluses dans UltraEdit
font merveille.

Les deux fichiers incriminés : alphabet grec et unités mécaniques
viennent d'être scindés en deux parties (transparent pour l'utilisateur)
et ne donnent plus d'erreur.

CQFD et merci à UltraEdit.

--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Dominique Ottello

28/07/2004 à 18:57

Dominique Ottello écrivait :

Les deux fichiers incriminés : alphabet grec et unités mécaniques
viennent d'être scindés en deux parties (transparent pour l'utilisateur)
et ne donnent plus d'erreur.

Plus d'erreur sur les navigateurs, mais erreur sur le validateur w3c,
juste à la "jointure" des deux fichiers :

Line 108, column 0: character data is not allowed here

???<div class="fl80pc">

Alors, j'ai rusé en incluant ces caractères "non autorisés ici" dans un
commentaire html qui commence avant l'include codé unicode par
echo ".

Et maintenant, c'est valide HTML 4.01 Strict.
--
Ce n'est pas parce que l'erreur se propage qu'elle devient vérité. Gandhi
Site aéronautique :http://dominique.ottello.free.fr (Avec frames)
http://aviatechno.free.fr (Sans frames et en PHP)
Concorde dans la presse de 1965 à 2003 : http://le.pointu.free.fr

Pierre Goiffon

29/07/2004 à 10:14

"Dominique Ottello" a écrit dans le
message de news:

Le fichier contenant l'entête sus-mentionnée et déclarant un
charset=utf-8 est un fichier qui, bien sûr, pour supporter ce type de
codage est écrit en unicode, donc avec des caractères codés sur 16
bits.

Non, on ne code pas un fichier en Unicode. On utilise UTF-8, UTF-16 ou
autre... Il y a différence entre character set et encoding scheme en
Unicode.

Un fichier "normal", codé 8 bits ascii commence par <? soit, en hexa :
3C 3F et, le même fichier mais codé unicode commence par : FFFE 3C00
3F00 ; il y a donc bien deux octets qui sont envoyés avant <?php.

Ca ressemble à un BOM. Si vous êtes en UTF-8, vous pouvez le supprimer... Si
vous êtes en UTF-16... Utilisez plutôt UTF-8 :)

J'ai donc séparé mes fichiers codés unicode en deux parties :
Une partie entête codée en ascii 8bits et appelant en include la
deuxième partie qui, elle, est bien codée en unicode.

Si c'est de l'us-ascii, et donc le jeux de caractères 7 bits universel,
alors pas de prb pour l'UTF-8.

Marc Mongenet

29/07/2004 à 11:48

Pierre Goiffon wrote:

"Dominique Ottello" a écrit dans le
message de news:

Un fichier "normal", codé 8 bits ascii commence par <? soit, en hexa :
3C 3F et, le même fichier mais codé unicode commence par : FFFE 3C00
3F00 ; il y a donc bien deux octets qui sont envoyés avant <?php.

Ca ressemble à un BOM. Si vous êtes en UTF-8, vous pouvez le supprimer... Si
vous êtes en UTF-16... Utilisez plutôt UTF-8 :)

Manifestement en UTF-16 puisqu'il y a 16 bits par caractère.

Marc Mongenet

Dominique Ottello

29/07/2004 à 18:19

"Pierre Goiffon" écrivait :

Ca ressemble à un BOM. Si vous êtes en UTF-8, vous pouvez le supprimer... Si
vous êtes en UTF-16... Utilisez plutôt UTF-8 :)

C'est bien un BOM (Byte order Mark).

> J'ai donc séparé mes fichiers codés unicode en deux parties :
> Une partie entête codée en ascii 8bits et appelant en include la
> deuxième partie qui, elle, est bien codée en unicode.

Si c'est de l'us-ascii, et donc le jeux de caractères 7 bits universel,
alors pas de prb pour l'UTF-8.

En fin de compte, tous en archivant les fichiers Unicode (on ne sait
jamais ...), j'ai recodé en 8 bits, remis un charset iso-8859-1 et
déclaré tous les caractères "litigieux" sous forme de chaîne ampersand :
&Apha; Β, Γ Δ .... Ω...

Cela semble fonctionner correctement, tout du moins sur ma machine
Windows XP Home, avec Mozilla 1.6 fr, Opera 7.23 et IE6, tant en local
qu'en distant.

Si le coeur vous en dis, merci de vérifier, par exemple sur :
http://aviatechno.free.fr/unites/alphagrec.php

--
= Dominique Ottello = http://www.ottello.net
Aujourd'hui, l'idéal du progrès est remplacé par l'idéal de l'innovation :
il ne s'agit pas que ce soit mieux, il s'agit seulement que ce soit nouveau,
même si c'est pire qu'avant et cela de toute évidence. Montherlant

Caractères grec utf-8 non visible en local sur Mozilla avec EasyPHP

10 réponses

Veuillez sélectionner un problème