bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:u9fwGIe8FHA.2616@TK2MSFTNGP15.phx.gbl...
bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:
>
>>bonjour
>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>partie
>>j'arrive bien à me connecter au site, il me renvoie du code mais ce code
>>contient une frame
>>et je sais pas comment la récupérer cette frame
>>car moi la connexion s'arrete apres les quelques lignes ...
>>merci
>
>
> Hello,
>
> Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
> tu récupères la page. Envoies tu un GET sur le port 80
> sur le domaine concerné?
>
> Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Jean-Marc a écrit :
> "seb-seb" <sperot51@msn.com> a écrit dans le message de
> news:u9fwGIe8FHA.2616@TK2MSFTNGP15.phx.gbl...
>
>>bonjour
>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>partie
>>j'arrive bien à me connecter au site, il me renvoie du code mais ce code
>>contient une frame
>>et je sais pas comment la récupérer cette frame
>>car moi la connexion s'arrete apres les quelques lignes ...
>>merci
>
>
> Hello,
>
> Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
> tu récupères la page. Envoies tu un GET sur le port 80
> sur le domaine concerné?
>
> Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:
>
>>bonjour
>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>partie
>>j'arrive bien à me connecter au site, il me renvoie du code mais ce code
>>contient une frame
>>et je sais pas comment la récupérer cette frame
>>car moi la connexion s'arrete apres les quelques lignes ...
>>merci
>
>
> Hello,
>
> Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
> tu récupères la page. Envoies tu un GET sur le port 80
> sur le domaine concerné?
>
> Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
"seb-seb" a écrit dans le message de
news:eJ5k$Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q > 0.8,image/png,*/*;q=0.5"& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:eJ5k$Ff8FHA.2036@TK2MSFTNGP14.phx.gbl...
Jean-Marc a écrit :
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:u9fwGIe8FHA.2616@TK2MSFTNGP15.phx.gbl...
bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q > 0.8,image/png,*/*;q=0.5"
& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
"seb-seb" a écrit dans le message de
news:eJ5k$Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q > 0.8,image/png,*/*;q=0.5"& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
> seb-seb" a écrit dans le message de
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:eJ5k$
>
>>Jean-Marc a écrit :
>>
>>>"seb-seb" a écrit dans le message de
>>>news:
>>>
>>>
>>>>bonjour
>>>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>>>partie
>>>>j'arrive bien à me connecter au site, il me renvoie du code mais ce
>>>>contient une frame
>>>>et je sais pas comment la récupérer cette frame
>>>>car moi la connexion s'arrete apres les quelques lignes ...
>>>>merci
>>>
>>>
>>>Hello,
>>>
>>>Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
>>>tu récupères la page. Envoies tu un GET sur le port 80
>>>sur le domaine concerné?
>>>
>>>Bref, avec un peu de détails on peut certainement t'aider.
>>
>>c'est vrai que j'aurais pu étoffer un peu plus
>>en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
>>ouvert mon ip
>>j'ia donc récupérer une syntaxe d'envoie
>>apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
>>
>>donc ca donne ca
>>Private Sub reso_Connect()
>>reso.SendData _
>>"GET / HTTP/1.1" & vbCrLf & _
>>"Host: www.ogame.fr" & vbCrLf & _
>>"User-Agent: moi-test " & vbCrLf & _
>>"Accept:
>>
>
>
>
>>& vbCrLf & _
>>"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
>>"Accept -Encoding: gzip , deflate" & vbCrLf & _
>>"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
>>"Keep-Alive: 300" & vbCrLf & _
>>"Connection: keep -alive" & vbCrLf & vbCrLf
>>
>>mais cet idiot de site renvoie 5 lignes dont
>><frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
>>scrolling="yes" noresize>
>>
>>donc j'imagine qu'un browser normal quand y voit ca il relance une
>>requete pour avoir la frame ...
>
>
> Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
> Un browser va générer autant de GET qu'il y a de liens à résoudre sur
> la page. C'est la même chose quand il y a des images. QUand le
> navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
> il génère un GET pour récupérer l'image. Les serveurs ne font que
> répondre à une suite de GET et ils servent "bêtement" les ressources
> qui leur sont demandées.
>
> Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
> "GET / HTTP/1/1" & vbcrlf est suffisant.
>
> Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
> dois décoder le html et générer tous les GET nécessaires. C'est pour
> cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
> qu'écrire un client :-) (je ne parle même pas de l'affichage du html
> proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
> seb-seb" <sperot51@msn.com> a écrit dans le message de
Jean-Marc a écrit :
> "seb-seb" <sperot51@msn.com> a écrit dans le message de
> news:eJ5k$Ff8FHA.2036@TK2MSFTNGP14.phx.gbl...
>
>>Jean-Marc a écrit :
>>
>>>"seb-seb" <sperot51@msn.com> a écrit dans le message de
>>>news:u9fwGIe8FHA.2616@TK2MSFTNGP15.phx.gbl...
>>>
>>>
>>>>bonjour
>>>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>>>partie
>>>>j'arrive bien à me connecter au site, il me renvoie du code mais ce
>>>>contient une frame
>>>>et je sais pas comment la récupérer cette frame
>>>>car moi la connexion s'arrete apres les quelques lignes ...
>>>>merci
>>>
>>>
>>>Hello,
>>>
>>>Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
>>>tu récupères la page. Envoies tu un GET sur le port 80
>>>sur le domaine concerné?
>>>
>>>Bref, avec un peu de détails on peut certainement t'aider.
>>
>>c'est vrai que j'aurais pu étoffer un peu plus
>>en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
>>ouvert mon ip
>>j'ia donc récupérer une syntaxe d'envoie
>>apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
>>
>>donc ca donne ca
>>Private Sub reso_Connect()
>>reso.SendData _
>>"GET / HTTP/1.1" & vbCrLf & _
>>"Host: www.ogame.fr" & vbCrLf & _
>>"User-Agent: moi-test " & vbCrLf & _
>>"Accept:
>>
>
>
>
>>& vbCrLf & _
>>"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
>>"Accept -Encoding: gzip , deflate" & vbCrLf & _
>>"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
>>"Keep-Alive: 300" & vbCrLf & _
>>"Connection: keep -alive" & vbCrLf & vbCrLf
>>
>>mais cet idiot de site renvoie 5 lignes dont
>><frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
>>scrolling="yes" noresize>
>>
>>donc j'imagine qu'un browser normal quand y voit ca il relance une
>>requete pour avoir la frame ...
>
>
> Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
> Un browser va générer autant de GET qu'il y a de liens à résoudre sur
> la page. C'est la même chose quand il y a des images. QUand le
> navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
> il génère un GET pour récupérer l'image. Les serveurs ne font que
> répondre à une suite de GET et ils servent "bêtement" les ressources
> qui leur sont demandées.
>
> Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
> "GET / HTTP/1/1" & vbcrlf est suffisant.
>
> Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
> dois décoder le html et générer tous les GET nécessaires. C'est pour
> cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
> qu'écrire un client :-) (je ne parle même pas de l'affichage du html
> proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
> seb-seb" a écrit dans le message de
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:eJ5k$
>
>>Jean-Marc a écrit :
>>
>>>"seb-seb" a écrit dans le message de
>>>news:
>>>
>>>
>>>>bonjour
>>>>je voudrais récupérer tout le code html d'un site pour en utiliser une
>>>>partie
>>>>j'arrive bien à me connecter au site, il me renvoie du code mais ce
>>>>contient une frame
>>>>et je sais pas comment la récupérer cette frame
>>>>car moi la connexion s'arrete apres les quelques lignes ...
>>>>merci
>>>
>>>
>>>Hello,
>>>
>>>Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
>>>tu récupères la page. Envoies tu un GET sur le port 80
>>>sur le domaine concerné?
>>>
>>>Bref, avec un peu de détails on peut certainement t'aider.
>>
>>c'est vrai que j'aurais pu étoffer un peu plus
>>en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
>>ouvert mon ip
>>j'ia donc récupérer une syntaxe d'envoie
>>apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
>>
>>donc ca donne ca
>>Private Sub reso_Connect()
>>reso.SendData _
>>"GET / HTTP/1.1" & vbCrLf & _
>>"Host: www.ogame.fr" & vbCrLf & _
>>"User-Agent: moi-test " & vbCrLf & _
>>"Accept:
>>
>
>
>
>>& vbCrLf & _
>>"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
>>"Accept -Encoding: gzip , deflate" & vbCrLf & _
>>"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
>>"Keep-Alive: 300" & vbCrLf & _
>>"Connection: keep -alive" & vbCrLf & vbCrLf
>>
>>mais cet idiot de site renvoie 5 lignes dont
>><frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
>>scrolling="yes" noresize>
>>
>>donc j'imagine qu'un browser normal quand y voit ca il relance une
>>requete pour avoir la frame ...
>
>
> Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
> Un browser va générer autant de GET qu'il y a de liens à résoudre sur
> la page. C'est la même chose quand il y a des images. QUand le
> navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
> il génère un GET pour récupérer l'image. Les serveurs ne font que
> répondre à une suite de GET et ils servent "bêtement" les ressources
> qui leur sont demandées.
>
> Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
> "GET / HTTP/1/1" & vbcrlf est suffisant.
>
> Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
> dois décoder le html et générer tous les GET nécessaires. C'est pour
> cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
> qu'écrire un client :-) (je ne parle même pas de l'affichage du html
> proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
seb-seb" a écrit dans le message de
news:Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:eJ5k$Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce
codecontient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q >0.8,image/png,*/*;q=0.5"& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
En fait c'est assez simple, tout en pouvant devenir un peu compliqué.
Tu fais ton premier GET, tel que tui la fais, et tu récupères ta page HTML.
Puis tu dois parser cette page, en recherchant tous les "src=""
De la tu récupères les liens pointés par les src, par exemple dans ton
exemple:
src="/index.php?frameset=1" , et bien tu récupères ce qui est entre les
guillements après le src= et tu fais le GET correspondant:
GET /index.php?frameset=1 HTTP/1/1 & vbcrlf
Tu dois faire cela pour chaque src= rencontré sur ta page.
LA ou les choses devienneent amusantes, c'est que le code HTML retourné
par les GET peuvent à leur tour contenir des src=, qu'il faut parser, etc.
Bref, 2 solutions: tu stockes dans des tableaux les src= et tu parcours
ensuite (simple, mais un peu bourrin) soit tu fais une jolie focntion
récursive (fun mais pas sans rique et nettement plus compliqué: attention
aux conditions de sortie ...)
Si ce n'est pas clair, je pourrais sans doute faire un mini exemple.
seb-seb" <sperot51@msn.com> a écrit dans le message de
news:eFs5LSf8FHA.1292@tk2msftngp13.phx.gbl...
Jean-Marc a écrit :
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:eJ5k$Ff8FHA.2036@TK2MSFTNGP14.phx.gbl...
Jean-Marc a écrit :
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:u9fwGIe8FHA.2616@TK2MSFTNGP15.phx.gbl...
bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce
code
contient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q >
0.8,image/png,*/*;q=0.5"
& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
En fait c'est assez simple, tout en pouvant devenir un peu compliqué.
Tu fais ton premier GET, tel que tui la fais, et tu récupères ta page HTML.
Puis tu dois parser cette page, en recherchant tous les "src=""
De la tu récupères les liens pointés par les src, par exemple dans ton
exemple:
src="/index.php?frameset=1" , et bien tu récupères ce qui est entre les
guillements après le src= et tu fais le GET correspondant:
GET /index.php?frameset=1 HTTP/1/1 & vbcrlf
Tu dois faire cela pour chaque src= rencontré sur ta page.
LA ou les choses devienneent amusantes, c'est que le code HTML retourné
par les GET peuvent à leur tour contenir des src=, qu'il faut parser, etc.
Bref, 2 solutions: tu stockes dans des tableaux les src= et tu parcours
ensuite (simple, mais un peu bourrin) soit tu fais une jolie focntion
récursive (fun mais pas sans rique et nettement plus compliqué: attention
aux conditions de sortie ...)
Si ce n'est pas clair, je pourrais sans doute faire un mini exemple.
seb-seb" a écrit dans le message de
news:Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:eJ5k$Jean-Marc a écrit :"seb-seb" a écrit dans le message de
news:bonjour
je voudrais récupérer tout le code html d'un site pour en utiliser une
partie
j'arrive bien à me connecter au site, il me renvoie du code mais ce
codecontient une frame
et je sais pas comment la récupérer cette frame
car moi la connexion s'arrete apres les quelques lignes ...
merci
Hello,
Il faudrait voir l'URL de ce que tu veux récupérer, et aussi comment
tu récupères la page. Envoies tu un GET sur le port 80
sur le domaine concerné?
Bref, avec un peu de détails on peut certainement t'aider.
c'est vrai que j'aurais pu étoffer un peu plus
en fait avant de commencer j'ai ouvert un port 80 et dans firefox j'ai
ouvert mon ip
j'ia donc récupérer une syntaxe d'envoie
apres j'ai repris cette syntaxe pour voir à quoi ressemblait une réponse
donc ca donne ca
Private Sub reso_Connect()
reso.SendData _
"GET / HTTP/1.1" & vbCrLf & _
"Host: www.ogame.fr" & vbCrLf & _
"User-Agent: moi-test " & vbCrLf & _
"Accept:
text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q >0.8,image/png,*/*;q=0.5"& vbCrLf & _
"Accept-Language: fr,fr-fr;q=0.8,en-us;q=0.5,en;q=0.3" & vbCrLf & _
"Accept -Encoding: gzip , deflate" & vbCrLf & _
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7" & vbCrLf & _
"Keep-Alive: 300" & vbCrLf & _
"Connection: keep -alive" & vbCrLf & vbCrLf
mais cet idiot de site renvoie 5 lignes dont
<frame name="mainframe" src="/index.php?frameset=1" frameborder="0"
scrolling="yes" noresize>
donc j'imagine qu'un browser normal quand y voit ca il relance une
requete pour avoir la frame ...
Ok je me doutais bien de qq chose comme cela. En effet, tu as raison.
Un browser va générer autant de GET qu'il y a de liens à résoudre sur
la page. C'est la même chose quand il y a des images. QUand le
navigateur trouve du code HTML du genre <img src="./truc.jpg"></img>,
il génère un GET pour récupérer l'image. Les serveurs ne font que
répondre à une suite de GET et ils servent "bêtement" les ressources
qui leur sont demandées.
Note: pour tes tests, tu n'as pas besoin d'un GET si compliqué. En fait,
"GET / HTTP/1/1" & vbcrlf est suffisant.
Si tu veux faire le boulot du navigateur (donc d'un client HTTP), tu
dois décoder le html et générer tous les GET nécessaires. C'est pour
cela qu'écrire un serveur HTTP (cf ma signature) est plus "facile"
qu'écrire un client :-) (je ne parle même pas de l'affichage du html
proprement dit)
et c'est où que je précise ce que je veux ?
c'est dans le winsock.connet ou dans le GET ?
et dans mon exemple quel est la requete à faire ?
parce que moi l'avantage c'est que je voudrais juste quelques valeurs et
non pas affiché le site
En fait c'est assez simple, tout en pouvant devenir un peu compliqué.
Tu fais ton premier GET, tel que tui la fais, et tu récupères ta page HTML.
Puis tu dois parser cette page, en recherchant tous les "src=""
De la tu récupères les liens pointés par les src, par exemple dans ton
exemple:
src="/index.php?frameset=1" , et bien tu récupères ce qui est entre les
guillements après le src= et tu fais le GET correspondant:
GET /index.php?frameset=1 HTTP/1/1 & vbcrlf
Tu dois faire cela pour chaque src= rencontré sur ta page.
LA ou les choses devienneent amusantes, c'est que le code HTML retourné
par les GET peuvent à leur tour contenir des src=, qu'il faut parser, etc.
Bref, 2 solutions: tu stockes dans des tableaux les src= et tu parcours
ensuite (simple, mais un peu bourrin) soit tu fais une jolie focntion
récursive (fun mais pas sans rique et nettement plus compliqué: attention
aux conditions de sortie ...)
Si ce n'est pas clair, je pourrais sans doute faire un mini exemple.
ca marche bien, j'ai tout compris ;-)
merci
ca marche bien, j'ai tout compris ;-)
merci
ca marche bien, j'ai tout compris ;-)
merci
"seb-seb" a écrit dans le message de
news:OFD%ca marche bien, j'ai tout compris ;-)
merci
Parfait :-)
"seb-seb" <sperot51@msn.com> a écrit dans le message de
news:OFD%23A8f8FHA.3636@TK2MSFTNGP09.phx.gbl...
ca marche bien, j'ai tout compris ;-)
merci
Parfait :-)
"seb-seb" a écrit dans le message de
news:OFD%ca marche bien, j'ai tout compris ;-)
merci
Parfait :-)
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:OFD%
>
>>ca marche bien, j'ai tout compris ;-)
>>merci
>
>
> Parfait :-)
encore une question en fait
un formulaire de connexion avec login ca se gère comment ?
je connais que tres tres vaguement l'html ...
Jean-Marc a écrit :
> "seb-seb" <sperot51@msn.com> a écrit dans le message de
> news:OFD%23A8f8FHA.3636@TK2MSFTNGP09.phx.gbl...
>
>>ca marche bien, j'ai tout compris ;-)
>>merci
>
>
> Parfait :-)
encore une question en fait
un formulaire de connexion avec login ca se gère comment ?
je connais que tres tres vaguement l'html ...
Jean-Marc a écrit :
> "seb-seb" a écrit dans le message de
> news:OFD%
>
>>ca marche bien, j'ai tout compris ;-)
>>merci
>
>
> Parfait :-)
encore une question en fait
un formulaire de connexion avec login ca se gère comment ?
je connais que tres tres vaguement l'html ...