J'ai besoin de parser une page web afin de garder les URL contenues dans
cette page.
Je récupère le source de la page sous la forme d'une variable, mais je ne
sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Paul Delannoy
Thomas V. a écrit:
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Faire un boucle qui cherche les <a href=" , récupère ce qui suit jusqu'au "> suivant ?
Thomas V. a écrit:
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans
cette page.
Je récupère le source de la page sous la forme d'une variable, mais je ne
sais pas trop comment la parser pour n'en garder que les URL http.
Faire un boucle qui cherche les <a href=" , récupère ce qui suit
jusqu'au "> suivant ?
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Faire un boucle qui cherche les <a href=" , récupère ce qui suit jusqu'au "> suivant ?
marc.quinton-PAS-DE-
Paul Delannoy wrote:
Faire un boucle qui cherche les <a href=" , récupère ce qui suit jusqu'au "> suivant ?
pour ma part, je pense que cette demande est tres hypothétique !
Frederic PANES
Thomas V. écrivit :
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Bonjour,
faire une boucle avec une expression régulière. Utiliser eregi() par exemple.
J'ai besoin de parser une page web afin de garder les URL contenues
dans cette page.
Je récupère le source de la page sous la forme d'une variable, mais
je ne sais pas trop comment la parser pour n'en garder que les URL
http.
Bonjour,
faire une boucle avec une expression régulière. Utiliser eregi() par
exemple.
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Bonjour,
faire une boucle avec une expression régulière. Utiliser eregi() par exemple.
désolé je suis hors sujet, j'avais lu "parser du php" ...
P'tit Marcel
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
tu peux faire ça avec une expression régulière. c'est un exemple classique fréquemment appliqué dans des scripts disponibles ici ou la, genre:
J'ai besoin de parser une page web afin de garder les URL contenues dans
cette page.
Je récupère le source de la page sous la forme d'une variable, mais je ne
sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
tu peux faire ça avec une expression régulière. c'est un exemple
classique fréquemment appliqué dans des scripts disponibles ici ou la,
genre:
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
tu peux faire ça avec une expression régulière. c'est un exemple classique fréquemment appliqué dans des scripts disponibles ici ou la, genre:
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
Merci.
-- Thomas V.
tu dois transformer le source en tableau avec la fontion file. Ensuite tu parcours ce tableau avec un foreach et là tu utilises des expressions rationnelles pour récupérer les champs souhaités. C'est à dire ce qui se trouve entre <a class="url"> ..... </a> (e.g) Il va falloir de taper les expressions rationnelles. Tu n'as pas le choix.
Thomas V. wrote:
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans
cette page.
Je récupère le source de la page sous la forme d'une variable, mais je ne
sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
Merci.
--
Thomas V.
tu dois transformer le source en tableau avec la fontion file.
Ensuite tu parcours ce tableau avec un foreach et là tu utilises
des expressions rationnelles pour récupérer les champs souhaités.
C'est à dire ce qui se trouve entre <a class="url"> ..... </a> (e.g)
Il va falloir de taper les expressions rationnelles.
Tu n'as pas le choix.
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page. Je récupère le source de la page sous la forme d'une variable, mais je ne sais pas trop comment la parser pour n'en garder que les URL http.
Si vous avez une idée pour me mettre sur la voie, ou plus...
Merci.
-- Thomas V.
tu dois transformer le source en tableau avec la fontion file. Ensuite tu parcours ce tableau avec un foreach et là tu utilises des expressions rationnelles pour récupérer les champs souhaités. C'est à dire ce qui se trouve entre <a class="url"> ..... </a> (e.g) Il va falloir de taper les expressions rationnelles. Tu n'as pas le choix.
pollux
Thomas V. wrote:
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans cette page.
$image2 = preg_replace("/b([^s]+)s*=s*("|')([s]*?)("|')s/","", "$href"); preg_match_all("/b([^s]+)s*=s*([^s]*?)s/", " $image2",$attribut); // l'ordre du merge est important : on ecrase les valeurs trouvees sans guillemets // par celle trouvee avec. $details = array_merge(arrays2hash($attribut[1],$attribut[2]),$details); array_push($retour, $details); } return $retour; }
-- Pollux was here ____________________________________________ http://www.pollen-online.com La seule boutique en ligne de vente de pollen frais Percie du Sert...
Thomas V. wrote:
Bonjour,
J'ai besoin de parser une page web afin de garder les URL contenues dans
cette page.
$image2 =
preg_replace("/b([^s]+)s*=s*("|')([s]*?)("|')s/","", "$href");
preg_match_all("/b([^s]+)s*=s*([^s]*?)s/", " $image2",$attribut);
// l'ordre du merge est important : on ecrase les valeurs trouvees
sans guillemets
// par celle trouvee avec.
$details = array_merge(arrays2hash($attribut[1],$attribut[2]),$details);
array_push($retour, $details);
}
return $retour;
}
--
Pollux was here
____________________________________________
http://www.pollen-online.com
La seule boutique en ligne
de vente de pollen frais Percie du Sert...
$image2 = preg_replace("/b([^s]+)s*=s*("|')([s]*?)("|')s/","", "$href"); preg_match_all("/b([^s]+)s*=s*([^s]*?)s/", " $image2",$attribut); // l'ordre du merge est important : on ecrase les valeurs trouvees sans guillemets // par celle trouvee avec. $details = array_merge(arrays2hash($attribut[1],$attribut[2]),$details); array_push($retour, $details); } return $retour; }
-- Pollux was here ____________________________________________ http://www.pollen-online.com La seule boutique en ligne de vente de pollen frais Percie du Sert...