Parser un page web

9 réponses

VooDoo

17/01/2006 à 12:06

Bonjour,
je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info, comme par exemple la date de livraison
Quelqu'un peut il me donner quelques guides sur comment s'y prendre?
Merci d'avance.
A+
Voodoo

9 réponses

Olivier Miakinen

17/01/2006 à 12:45

je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info, comme par exemple la date de livraison

---------- extrait de la page ---------------------------------
<td class="gridCell" width="85">Date de livraison:</td><td
class="gridCell">21/08/2002</td>
---------- extrait de la page ---------------------------------

Je suppose que le contenu de la page est dans $page. Tu peux faire par
exemple :

$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);

Attention, mon exemple n'est certainement pas le plus efficace, surtout
si tu veux récupérer aussi d'autres infos, mais tu as l'idée de base et
la doc se trouve aux pages suivantes :
- http://fr.php.net/manual/fr/function.preg-replace.php ;
- http://fr.php.net/manual/fr/reference.pcre.pattern.modifiers.php ;
- http://fr.php.net/manual/fr/reference.pcre.pattern.syntax.php ;
- etc.

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

VooDoo

17/01/2006 à 15:02

ok merci, j'ai compris le principe...
je vais ajuster ca car apparement ca marche pas trop...
avec ca devant:
$str_url_dell =
'http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag='.$row[Serial];
$page = file_get_contents($str_url_dell);
$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);

si je fais un echo de $date_livraison il affiche toute la page...

je vais voir ce qu'il cloche....
merci encore!
A+
VooDoo

Marc

17/01/2006 à 15:02

Olivier Miakinen wrote:

Attention, mon exemple n'est certainement pas le plus efficace, surtout
si tu veux récupérer aussi d'autres infos, mais tu as l'idée de base et

perso, j'utilise toujours

preg_match('/ blabla (une valeur) ... (et une autre) ... /', $str, $matches);

Demosthene

17/01/2006 à 16:21

VooDoo wrote:

Bonjour,
je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info,

Bonjour,

Si c'est à usage personnel, celà ne pose pas de problèmes. Si c'est à
usage professionnel, tu as peut-être intérét à demander l'avis du
webmaster de Dell.

Cordialement

Démosthène

Mike Massonnet

17/01/2006 à 23:26

VooDoo wrote:

Bonjour,
je souhaiterai parser cette page web:

http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J

et recuperer quelques info, comme par exemple la date de livraison
Quelqu'un peut il me donner quelques guides sur comment s'y prendre?
Merci d'avance.
A+
Voodoo

J'ai une petite trouvaille :
http://www.zend.com/php5/articles/php5-xmlphp.php#Heading12

L'exemple donné est:

$dom = new DomDocument();
$dom->loadHTMLFile("http://www.php.net/");
$title = $dom->getElementsByTagName("title");
print $title->item(0)->textContent;

--
~#{[^_^]}#~

Frederic Rouchouze

17/01/2006 à 23:26

Je suppose que le contenu de la page est dans $page. Tu peux faire par
exemple :
$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);

Est-ce qu'il existe des fonctions (autres que les fonctions basées sur les
expressions régulières) qui permettent de parser du HTML ? Par exemple, de
transformer une page HTML en arbre ou en tableau ?

Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?

Merci,
--
Frédéric Rouchouze
mailto:

ASM

18/01/2006 à 13:57

Est-ce qu'il existe des fonctions (autres que les fonctions basées sur les
expressions régulières) qui permettent de parser du HTML ? Par exemple, de
transformer une page HTML en arbre ou en tableau ?

Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?

Il faudrait essayer ?

De mon côté j'avais essayé en javascript
et le DOM n'était pas content du tout qu'on l'interroge
à propos de balises HTML alors qu'on s'adresse à du XML.

Ou bien j'avais cafouillé,
ou bien ces navigateurs et leur DOM sont très susceptibles ... ?

--
Stephane Moriaux et son [moins] vieux Mac

ftc

18/01/2006 à 22:48

Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?

Les fonctions XML fonctionneront uniquement lorsque le HTML est du XML
valide.

Par contre, il y a un analyseur HTML sur PEAR : HTML_SAX3 qui réagit
comme l'interface SAX pour XML.

Frederic Rouchouze

18/01/2006 à 23:23

J'ai une petite trouvaille :
http://www.zend.com/php5/articles/php5-xmlphp.php#Heading12

C'est exactement ça que je cherchais !

Merci,
--
Frédéric Rouchouze
mailto:

Parser un page web

9 réponses

Veuillez sélectionner un problème