Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Parser un page web

9 réponses
Avatar
VooDoo
Bonjour,
je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info, comme par exemple la date de livraison
Quelqu'un peut il me donner quelques guides sur comment s'y prendre?
Merci d'avance.
A+
Voodoo

9 réponses

Avatar
Olivier Miakinen

je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info, comme par exemple la date de livraison


---------- extrait de la page ---------------------------------
<td class="gridCell" width="85">Date de livraison:</td><td
class="gridCell">21/08/2002</td>
---------- extrait de la page ---------------------------------

Je suppose que le contenu de la page est dans $page. Tu peux faire par
exemple :

$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);

Attention, mon exemple n'est certainement pas le plus efficace, surtout
si tu veux récupérer aussi d'autres infos, mais tu as l'idée de base et
la doc se trouve aux pages suivantes :
- http://fr.php.net/manual/fr/function.preg-replace.php ;
- http://fr.php.net/manual/fr/reference.pcre.pattern.modifiers.php ;
- http://fr.php.net/manual/fr/reference.pcre.pattern.syntax.php ;
- etc.

--
Olivier Miakinen
Troll du plus sage chez les conviviaux : le nouveau venu, avec
son clan, s'infiltre dans les groupes de nouvelles. (3 c.)

Avatar
VooDoo
ok merci, j'ai compris le principe...
je vais ajuster ca car apparement ca marche pas trop...
avec ca devant:
$str_url_dell =
'http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag='.$row[Serial];
$page = file_get_contents($str_url_dell);
$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);

si je fais un echo de $date_livraison il affiche toute la page...

je vais voir ce qu'il cloche....
merci encore!
A+
VooDoo
Avatar
Marc
Olivier Miakinen wrote:

Attention, mon exemple n'est certainement pas le plus efficace, surtout
si tu veux récupérer aussi d'autres infos, mais tu as l'idée de base et



perso, j'utilise toujours

preg_match('/ blabla (une valeur) ... (et une autre) ... /', $str, $matches);

Avatar
Demosthene
VooDoo wrote:
Bonjour,
je souhaiterai parser cette page web:
http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J
et recuperer quelques info,


Bonjour,

Si c'est à usage personnel, celà ne pose pas de problèmes. Si c'est à
usage professionnel, tu as peut-être intérét à demander l'avis du
webmaster de Dell.

Cordialement

Démosthène

Avatar
Mike Massonnet
VooDoo wrote:

Bonjour,
je souhaiterai parser cette page web:

http://support.euro.dell.com/support/topics/topic.aspx/emea/shared/support/my_systems_info/fr/details?c=fr&cs=frbsdt1&l=fr&s=bsd&ServiceTag=6Q67H0J

et recuperer quelques info, comme par exemple la date de livraison
Quelqu'un peut il me donner quelques guides sur comment s'y prendre?
Merci d'avance.
A+
Voodoo


J'ai une petite trouvaille :
http://www.zend.com/php5/articles/php5-xmlphp.php#Heading12

L'exemple donné est:


$dom = new DomDocument();
$dom->loadHTMLFile("http://www.php.net/");
$title = $dom->getElementsByTagName("title");
print $title->item(0)->textContent;

--
~#{[^_^]}#~

Avatar
Frederic Rouchouze
Je suppose que le contenu de la page est dans $page. Tu peux faire par
exemple :
$pattern = '|^.*Date de livraison:</td><td [^>]*>(../../....).*$|';
$replace = '1';
$date_livraison = preg_replace($pattern, $replace, $page);


Est-ce qu'il existe des fonctions (autres que les fonctions basées sur les
expressions régulières) qui permettent de parser du HTML ? Par exemple, de
transformer une page HTML en arbre ou en tableau ?

Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?

Merci,
--
Frédéric Rouchouze
mailto:

Avatar
ASM

Est-ce qu'il existe des fonctions (autres que les fonctions basées sur les
expressions régulières) qui permettent de parser du HTML ? Par exemple, de
transformer une page HTML en arbre ou en tableau ?

Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?


Il faudrait essayer ?

De mon côté j'avais essayé en javascript
et le DOM n'était pas content du tout qu'on l'interroge
à propos de balises HTML alors qu'on s'adresse à du XML.

Ou bien j'avais cafouillé,
ou bien ces navigateurs et leur DOM sont très susceptibles ... ?

--
Stephane Moriaux et son [moins] vieux Mac

Avatar
ftc
Est-ce que les fonctions XML, bien que le HTML ne soit pas du XML valide, ne
pourraient pas servir à ça ?


Les fonctions XML fonctionneront uniquement lorsque le HTML est du XML
valide.

Par contre, il y a un analyseur HTML sur PEAR : HTML_SAX3 qui réagit
comme l'interface SAX pour XML.

Avatar
Frederic Rouchouze
J'ai une petite trouvaille :
http://www.zend.com/php5/articles/php5-xmlphp.php#Heading12



C'est exactement ça que je cherchais !

Merci,
--
Frédéric Rouchouze
mailto: