OVH Cloud OVH Cloud

validite d'un document HTML

6 réponses
Avatar
ts
Bonjour,

Est ce qu'un document présentant un telle structure, où `...' représente
soit du texte, soit d'autres balises

------------------------------------------------------------
<html><head><title></title>

...

</head>
<body>
<html>

...
</html>
</body></html>
------------------------------------------------------------

peut-être considéré comme valide ou doit il être mis directement à la
poubelle ?

Merci,


--

Guy Decoux

6 réponses

Avatar
Olivier Miakinen
Le 22/01/2007 15:26, ts a écrit :

Est ce qu'un document présentant une telle structure
... <body><html> ... </html></body></html>
peut-être considéré comme valide



Non.

ou doit il être mis directement à la poubelle ?



Tout dépend de ton degré de tolérance vis-à-vis du code HTML invalide.
Avatar
ts
"O" == Olivier Miakinen <om+ writes:











O> Tout dépend de ton degré de tolérance vis-à-vis du code HTML invalide.

Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?

Si oui, ce générateur pourrait il être considéré comme une pure hérésie ?


--

Guy Decoux
Avatar
Pierre Goiffon
ts wrote:
Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?



Grand nombre d'éditeurs proposent des templates, ainsi lorsque l'on fais
fichier / nouveau on obtient une page HTML ou XHTML vierge qui va bien.
Souvent ces templates sont malheureusement de mauvaise qualité (soupirs)

Ce que vous avez indiqué, sans les ... est un excellent début, au
doctype près qui ne contient pas l'URL.

Pour la liste des doctype possibles, vous pouvez la trouver ici :
http://www.w3.org/QA/2002/04/valid-dtd-list.html
Avatar
ts
"P" == Pierre Goiffon writes:











P> Grand nombre d'éditeurs proposent des templates, ainsi lorsque l'on
P> fais fichier / nouveau on obtient une page HTML ou XHTML vierge qui va
P> bien. Souvent ces templates sont malheureusement de mauvaise qualité
P> (soupirs)

Bon, je vais donner l'explication : ce sont les SPAM que je suis en train
de recevoir. Ils ont tous la même structure

------------------------------------------------------------
Content-Type: text/html; charset=us-ascii
Content-Transfer-Encoding: quoted-printable

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title>

déclarations META ici

</head><body><html>

Du texte quelconque pour tromper les filtres anti-spam

<head>

déclarations de style

</head><body>

C'est là qu'est l'astuce : thunderbird ne va afficher *que cette* partie
et c'est celle qui contient le SPAM

</body>

Du texte quelconque pour tromper les filtres anti-spam

</html>
</body></html>
------------------------------------------------------------

Je me demandais si je pouvais les détecter comme document invalides.




--

Guy Decoux
Avatar
Sergio
Il se trouve que ts a formulé :

Bon d'une façon différente : Existe t'il un générateur de code HTML
pouvant donner les séquences

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title> ... </head><body><html>

dans un document ?

Si oui, ce générateur pourrait il être considéré comme une pure hérésie ?



Moi je connais un truc très ch*ant : L'inclusion en PHP de la fonction
phpinfo()

<html>
<head>
</head>
<body>
<p>Le php ici tolère :</p>
<?php phpinfo() ?>
</body>
</htlm>

Va te générer une telle purée de HTML !

--
Serge http://leserged.online.fr/
Mon blog: http://cahierdesergio.free.fr/
Soutenez le libre: http://www.framasoft.org
Avatar
Pierre Goiffon
ts wrote:
Bon, je vais donner l'explication : ce sont les SPAM que je suis en train
de recevoir. Ils ont tous la même structure

------------------------------------------------------------
Content-Type: text/html; charset=us-ascii
Content-Transfer-Encoding: quoted-printable

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html><head><title></title>

déclarations META ici

</head><body><html>

Du texte quelconque pour tromper les filtres anti-spam

<head>

déclarations de style

</head><body>

C'est là qu'est l'astuce : thunderbird ne va afficher *que cette* partie
et c'est celle qui contient le SPAM

</body>

Du texte quelconque pour tromper les filtres anti-spam

</html>
</body></html>
------------------------------------------------------------

Je me demandais si je pouvais les détecter comme document invalides.



Vu que la question mérite des réponses très spécifiques, je place le
suivi plus une copie vers fr.comp.mail