validite d'un document HTML

6 réponses

22/01/2007 à 15:26

Bonjour,

Est ce qu'un document présentant un telle structure, où `...' représente
soit du texte, soit d'autres balises

------------------------------------------------------------
<html><head><title></title>

...

</head>
<body>
<html>

...
</html>
</body></html>
------------------------------------------------------------

peut-être considéré comme valide ou doit il être mis directement à la
poubelle ?

Merci,

--

Guy Decoux

6 réponses

Olivier Miakinen

22/01/2007 à 15:38

Le 22/01/2007 15:26, ts a écrit :

Est ce qu'un document présentant une telle structure
... <body><html> ... </html></body></html>
peut-être considéré comme valide

Non.

ou doit il être mis directement à la poubelle ?

Tout dépend de ton degré de tolérance vis-à-vis du code HTML invalide.

22/01/2007 à 15:45

"O" == Olivier Miakinen <om+ writes:

O> Tout dépend de ton degré de tolérance vis-à-vis du code HTML invalide.

Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?

Si oui, ce générateur pourrait il être considéré comme une pure hérésie ?

--

Guy Decoux

Pierre Goiffon

22/01/2007 à 16:09

ts wrote:

Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?

Grand nombre d'éditeurs proposent des templates, ainsi lorsque l'on fais
fichier / nouveau on obtient une page HTML ou XHTML vierge qui va bien.
Souvent ces templates sont malheureusement de mauvaise qualité (soupirs)

Ce que vous avez indiqué, sans les ... est un excellent début, au
doctype près qui ne contient pas l'URL.

Pour la liste des doctype possibles, vous pouvez la trouver ici :
http://www.w3.org/QA/2002/04/valid-dtd-list.html

22/01/2007 à 16:18

"P" == Pierre Goiffon writes:

P> Grand nombre d'éditeurs proposent des templates, ainsi lorsque l'on
P> fais fichier / nouveau on obtient une page HTML ou XHTML vierge qui va
P> bien. Souvent ces templates sont malheureusement de mauvaise qualité
P> (soupirs)

Bon, je vais donner l'explication : ce sont les SPAM que je suis en train
de recevoir. Ils ont tous la même structure

------------------------------------------------------------
Content-Type: text/html; charset=us-ascii
Content-Transfer-Encoding: quoted-printable

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title>

déclarations META ici

</head><body><html>

Du texte quelconque pour tromper les filtres anti-spam

<head>

déclarations de style

</head><body>

C'est là qu'est l'astuce : thunderbird ne va afficher *que cette* partie
et c'est celle qui contient le SPAM

</body>

Du texte quelconque pour tromper les filtres anti-spam

</html>
</body></html>
------------------------------------------------------------

Je me demandais si je pouvais les détecter comme document invalides.

--

Guy Decoux

Sergio

22/01/2007 à 16:33

Il se trouve que ts a formulé :

Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?

Si oui, ce générateur pourrait il être considéré comme une pure hérésie ?

Moi je connais un truc très ch*ant : L'inclusion en PHP de la fonction
phpinfo()

<html>
<head>
</head>
<body>
<p>Le php ici tolère :</p>
<?php phpinfo() ?>
</body>
</htlm>

Va te générer une telle purée de HTML !

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org

Pierre Goiffon

22/01/2007 à 17:38

ts wrote:

Bon, je vais donner l'explication : ce sont les SPAM que je suis en train
de recevoir. Ils ont tous la même structure

------------------------------------------------------------
Content-Type: text/html; charset=us-ascii
Content-Transfer-Encoding: quoted-printable

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title>

déclarations META ici

</head><body><html>

Du texte quelconque pour tromper les filtres anti-spam

<head>

déclarations de style

</head><body>

C'est là qu'est l'astuce : thunderbird ne va afficher *que cette* partie
et c'est celle qui contient le SPAM

</body>

Du texte quelconque pour tromper les filtres anti-spam

</html>
</body></html>
------------------------------------------------------------

Je me demandais si je pouvais les détecter comme document invalides.

Vu que la question mérite des réponses très spécifiques, je place le
suivi plus une copie vers fr.comp.mail

validite d'un document HTML

6 réponses

Veuillez sélectionner un problème