OVH Cloud OVH Cloud

Recuperer de a

6 réponses
Avatar
Machaon
Bonjour à tous,

connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur ne
l'a pas) qui permette de parser une page html pour récupérer de <body> à
</body> ?

Merci pour vos réponses.

Machaon

6 réponses

Avatar
P'tit Marcel
connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur ne
l'a pas) qui permette de parser une page html pour récupérer de <body> à
</body> ?


un truc genre :

$masque = '`<body[^>]*>(.+)</body>`is'
if(preg_match($masque, $page, $trouve)) {
$contenu_incluant_les_body = $trouve[0];
$intérieur_du_body = $trouve[1];
}

(non testé)


eça
--
P'tit Marcel

Avatar
Jean-Charles Gibier
Bonjour à tous,

connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur ne
l'a pas) qui permette de parser une page html pour récupérer de <body> à
</body> ?

Merci pour vos réponses.




Une méthode pratique sûre mais un peu lourde est d'utiliser un parseur
xml (si la page récupérée est conforme HTML4).
Sur PHP5 utiliser simplexml est enfantin.

Avatar
Jahjah92
Bonjour,

connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur
ne l'a pas) qui permette de parser une page html pour récupérer de <body>
à </body> ?


Je suis pas un pro des regex , mais en voilà un qui fonctionne
<?
$cible = "<html> <head> </head> <body dfg > <table><td>content</td></table>
</body> </html>";
$motif = '`<body .* >.*</body>`';
preg_match($motif,$cible,$values);
print_r($values);
?>
renvoie :
Array
(
[0] => <body dfg > <table><td>content</td></table> </body>
)

Attention si tu execute via un navigateur ça affiche
Array ( [0] =>
content

)
Normal le <table> est interpreté..

+ d'info sur http://www.expreg.com

@+

Avatar
Jahjah92
Suite de mon post précedent ...
Plus élégant ce qui suit :
<?
$cible = "<html> <head> </head> <body onload='anyfunction()' >
<table><td>content</td></table> </body> </html>";
$motif = '`.*<body[^>]*>(.+)</body>.*`';
preg_match($motif,$cible,$values);
print_r($values);
?>

@+
Avatar
Machaon
Merci beaucoup pour vos réponses.


"Machaon" a écrit dans le message de news:
44984727$0$13027$
Bonjour à tous,

connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur
ne l'a pas) qui permette de parser une page html pour récupérer de <body>
à </body> ?

Merci pour vos réponses.

Machaon


Avatar
FB
Merci beaucoup pour vos réponses.


"Machaon" a écrit dans le message de news:
44984727$0$13027$
Bonjour à tous,

connaissez vous une fonction (autre que tidy_get_body() car mon hébergeur
ne l'a pas) qui permette de parser une page html pour récupérer de <body>
à </body> ?

Merci pour vos réponses.

Machaon



Bonjour,

Avec PHP, je pense que l'utilisation des RegEx (Expressions Régulières)
pourrait faire cela.
Ce n'est pas une réponse précise, mais plus une voie d'investigation.
Désolé, je ne suis pas un spécialiste en regexp.

François