OVH Cloud OVH Cloud

Traiter du HTML en PHP

1 réponse
Avatar
Yoann Levet
Dans le cadre d'un petit moteur de recherche, je voudrais savoir s'il existe
des fonctions ou librairies PHP permettant de traiter du HTML. Par exemple
classer dans un tableau toutes les balises d'images, tout les liens, etc...

J'ai vraiment cherché dans toute la doc PHP et je n'ai rien trouvé.

Merci a tous
Yoann

1 réponse

Avatar
Guillaume Bouchard
Yoann Levet wrote:
Dans le cadre d'un petit moteur de recherche, je voudrais savoir s'il existe
des fonctions ou librairies PHP permettant de traiter du HTML. Par exemple
classer dans un tableau toutes les balises d'images, tout les liens, etc...


A ma conaissence il n'en existe pas.
D'un autre coté ce n'est aps trés compliqué (si tenté que le html
recuperer est un peut pres correct)

<?php

$str = file_get_contents('http://guillaume.apinc.org/');
preg_match_all('`<a(.*?)>(.*?)</a>`',$str,$match,PREG_SET_ORDER);


foreach( $match as $line){

// $line[1] content le contenu des attributs de a,
// $line[2] le contenu de la balise a

preg_match_all('`([a-z]+)="(.*?)"`',$line[1],$match2);

echo $line[2];
var_dump($match2);
}
?>

A toi d'ameliorer le retour ainsi que le traitement de plus de balises.

--
Guillaume.