html (doc.body.Innertext)

1 réponse

philippe doulet

02/12/2007 à 17:05

bonjour a tous
je cree un webrequest pour recuperer des pages html .ca se passe bien, je
recupere effectivement TOUT (le InnerHtml)
de la facon suivante que j'enregistre dans "FileName"
<<
HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse();
Stream streamResponse = Reponse.GetResponseStream();
StreamReader sr = new StreamReader(streamResponse);
StreamWriter fs = File.CreateText(FileName);
String line;
while ((line = sr.ReadLine()) != null)
{
fs.WriteLine(line);
}
>>
********************
Seulement , la seule chose qui m'interesse serait un equivalent a ce que
l'on obtient a partir

du webBrowser du genre :
<<

WebBrowser wb = WebBrowser1;
HtmlDocument doc = wb.Document;
if (doc.Body.InnerText !=null)
{
txt = doc.Body.InnerText .ToString();
.....
}
>>
comment puis-je faire ?
Merci d'avance

1 réponse

Gilles TOURREAU

02/12/2007 à 17:31

Le Sun, 02 Dec 2007 17:05:23 +0100, philippe doulet
a écrit:

bonjour a tous
je cree un webrequest pour recuperer des pages html .ca se passe bien, je
recupere effectivement TOUT (le InnerHtml)
de la facon suivante que j'enregistre dans "FileName"
<<
HttpWebRequest Req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse Reponse = (HttpWebResponse)Req.GetResponse();
Stream streamResponse = Reponse.GetResponseStream();
StreamReader sr = new StreamReader(streamResponse);
StreamWriter fs = File.CreateText(FileName);
String line;
while ((line = sr.ReadLine()) != null)
{
fs.WriteLine(line);
}

********************
Seulement , la seule chose qui m'interesse serait un equivalent a ce que
l'on obtient a partir

du webBrowser du genre :
<<

WebBrowser wb = WebBrowser1;
HtmlDocument doc = wb.Document;
if (doc.Body.InnerText !=null)
{
txt = doc.Body.InnerText .ToString();
.....
}

comment puis-je faire ?
Merci d'avance

Si les pages que vous obtenez sont normalisées XHTML, vous pouvez très
simplement utiliser toutes les fonctionnalités XML de .NET pour prendre ce
qui vous interesse (via XPath par exemple)...

Dans le cas contraire il faudra faire un bon vieux IndexOf("<body>") et
IndexOf("</body>") pour rechercher dans une chaine l'emplacement de ces
balises et extraire le contenu via Substring()

Cordialement

--
Gilles TOURREAU

S.A.R.L. P.O.S
Le spécialiste en motoculture depuis + de 30 ans !
http://www.pos.fr

html (doc.body.Innertext)

1 réponse

Veuillez sélectionner un problème