bonjour a tous
je cree un webrequest pour recuperer des pages html .ca se passe bien, je
recupere effectivement TOUT (le InnerHtml)
de la facon suivante que j'enregistre dans "FileName"
<<
HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse();
Stream streamResponse = Reponse.GetResponseStream();
StreamReader sr = new StreamReader(streamResponse);
StreamWriter fs = File.CreateText(FileName);
String line;
while ((line = sr.ReadLine()) != null)
{
fs.WriteLine(line);
}
>>
********************
Seulement , la seule chose qui m'interesse serait un equivalent a ce que
l'on obtient a partir
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Gilles TOURREAU
Le Sun, 02 Dec 2007 17:05:23 +0100, philippe doulet a écrit:
bonjour a tous je cree un webrequest pour recuperer des pages html .ca se passe bien, je recupere effectivement TOUT (le InnerHtml) de la facon suivante que j'enregistre dans "FileName" << HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse(); Stream streamResponse = Reponse.GetResponseStream(); StreamReader sr = new StreamReader(streamResponse); StreamWriter fs = File.CreateText(FileName); String line; while ((line = sr.ReadLine()) != null) { fs.WriteLine(line); }
******************** Seulement , la seule chose qui m'interesse serait un equivalent a ce que l'on obtient a partir
Si les pages que vous obtenez sont normalisées XHTML, vous pouvez très simplement utiliser toutes les fonctionnalités XML de .NET pour prendre ce qui vous interesse (via XPath par exemple)...
Dans le cas contraire il faudra faire un bon vieux IndexOf("<body>") et IndexOf("</body>") pour rechercher dans une chaine l'emplacement de ces balises et extraire le contenu via Substring()
Cordialement
-- Gilles TOURREAU
S.A.R.L. P.O.S Le spécialiste en motoculture depuis + de 30 ans ! http://www.pos.fr
Le Sun, 02 Dec 2007 17:05:23 +0100, philippe doulet
<philippe.doulet@wanadoo.fr> a écrit:
bonjour a tous
je cree un webrequest pour recuperer des pages html .ca se passe bien, je
recupere effectivement TOUT (le InnerHtml)
de la facon suivante que j'enregistre dans "FileName"
<<
HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse();
Stream streamResponse = Reponse.GetResponseStream();
StreamReader sr = new StreamReader(streamResponse);
StreamWriter fs = File.CreateText(FileName);
String line;
while ((line = sr.ReadLine()) != null)
{
fs.WriteLine(line);
}
********************
Seulement , la seule chose qui m'interesse serait un equivalent a ce que
l'on obtient a partir
Si les pages que vous obtenez sont normalisées XHTML, vous pouvez très
simplement utiliser toutes les fonctionnalités XML de .NET pour prendre ce
qui vous interesse (via XPath par exemple)...
Dans le cas contraire il faudra faire un bon vieux IndexOf("<body>") et
IndexOf("</body>") pour rechercher dans une chaine l'emplacement de ces
balises et extraire le contenu via Substring()
Cordialement
--
Gilles TOURREAU
gilles.tourreau@pos.fr
S.A.R.L. P.O.S
Le spécialiste en motoculture depuis + de 30 ans !
http://www.pos.fr
Le Sun, 02 Dec 2007 17:05:23 +0100, philippe doulet a écrit:
bonjour a tous je cree un webrequest pour recuperer des pages html .ca se passe bien, je recupere effectivement TOUT (le InnerHtml) de la facon suivante que j'enregistre dans "FileName" << HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse(); Stream streamResponse = Reponse.GetResponseStream(); StreamReader sr = new StreamReader(streamResponse); StreamWriter fs = File.CreateText(FileName); String line; while ((line = sr.ReadLine()) != null) { fs.WriteLine(line); }
******************** Seulement , la seule chose qui m'interesse serait un equivalent a ce que l'on obtient a partir
Si les pages que vous obtenez sont normalisées XHTML, vous pouvez très simplement utiliser toutes les fonctionnalités XML de .NET pour prendre ce qui vous interesse (via XPath par exemple)...
Dans le cas contraire il faudra faire un bon vieux IndexOf("<body>") et IndexOf("</body>") pour rechercher dans une chaine l'emplacement de ces balises et extraire le contenu via Substring()
Cordialement
-- Gilles TOURREAU
S.A.R.L. P.O.S Le spécialiste en motoculture depuis + de 30 ans ! http://www.pos.fr