salut je dois indexer des sites.
pour faire ca je les aspire !
y a t-il un moyen que je sache la date de modification de la page avant de
faire un fopen dessus?
je doute que ce type de commande existe mais bon !!! sait on jamais !
Cette action est irreversible, confirmez la suppression du commentaire ?
Signaler le commentaire
Veuillez sélectionner un problème
Nudité
Violence
Harcèlement
Fraude
Vente illégale
Discours haineux
Terrorisme
Autre
Olivier Miakinen
[ publication croisée, suivi vers fciws ]
salut je dois indexer des sites. pour faire ca je les aspire !
Donc des requêtes HTTP GET (je suppose que tu ne fais pas de POST).
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus?
Si de la date peut dépendre le fait que tu les récupères ou non, tu peux commencer par faire une requête HTTP HEAD. Sinon, profite du HTTP GET pour récupérer d'éventuelles infos dans les entêtes HTTP de la réponse. Je ne sais pas en revanche si tu peux récupérer ces infos avec la commande fopen() de PHP.
L'un des entêtes intéressant (s'il existe) est "Last-Modified". Pour savoir s'il y en a d'autres, je fais suivre là où c'est plus en charte, c'est-à-dire <fr.comp.infosystemes.www.serveurs>.
[ publication croisée, suivi vers fciws ]
salut je dois indexer des sites.
pour faire ca je les aspire !
Donc des requêtes HTTP GET (je suppose que tu ne fais pas de POST).
y a t-il un moyen que je sache la date de modification de la page avant de
faire un fopen dessus?
Si de la date peut dépendre le fait que tu les récupères ou non, tu peux
commencer par faire une requête HTTP HEAD. Sinon, profite du HTTP GET
pour récupérer d'éventuelles infos dans les entêtes HTTP de la réponse.
Je ne sais pas en revanche si tu peux récupérer ces infos avec la
commande fopen() de PHP.
L'un des entêtes intéressant (s'il existe) est "Last-Modified". Pour
savoir s'il y en a d'autres, je fais suivre là où c'est plus en charte,
c'est-à-dire <fr.comp.infosystemes.www.serveurs>.
salut je dois indexer des sites. pour faire ca je les aspire !
Donc des requêtes HTTP GET (je suppose que tu ne fais pas de POST).
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus?
Si de la date peut dépendre le fait que tu les récupères ou non, tu peux commencer par faire une requête HTTP HEAD. Sinon, profite du HTTP GET pour récupérer d'éventuelles infos dans les entêtes HTTP de la réponse. Je ne sais pas en revanche si tu peux récupérer ces infos avec la commande fopen() de PHP.
L'un des entêtes intéressant (s'il existe) est "Last-Modified". Pour savoir s'il y en a d'autres, je fais suivre là où c'est plus en charte, c'est-à-dire <fr.comp.infosystemes.www.serveurs>.
dwojylac.nospam
Etienne SOBOLE wrote:
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus? je doute que ce type de commande existe mais bon !!! sait on jamais !
Oui il y a moyen : c'est avec la commande fsockopen et fwrite ou avec la biliothèque curl
Mais certains hébergeurs désactivent ces fonctions.
-- http://wojylac.free.fr Un proverbe chinois dit que lorsqu'on a rien à dire on cite généralement un proverbe chinois.
Etienne SOBOLE <trash@tlk.fr> wrote:
y a t-il un moyen que je sache la date de modification de la page avant de
faire un fopen dessus?
je doute que ce type de commande existe mais bon !!! sait on jamais !
Oui il y a moyen :
c'est avec la commande fsockopen et fwrite ou avec la biliothèque curl
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus? je doute que ce type de commande existe mais bon !!! sait on jamais !
Oui il y a moyen : c'est avec la commande fsockopen et fwrite ou avec la biliothèque curl
Mais certains hébergeurs désactivent ces fonctions.
-- http://wojylac.free.fr Un proverbe chinois dit que lorsqu'on a rien à dire on cite généralement un proverbe chinois.
Pascal COPPIN
Pourquoi n'utiliserais tu pas wget? Je suppose que tu veux une copie mirroir locale tout en ne recopiant que les nouvelles pages, si je devinne bien le pourquoi de ta question. Cdt Pascal
Extraits du man :
--mirror Turn on options suitable for mirroring. This option turns on recursion and time-stamping, sets infinite recursion depth and keeps FTP directory listings. It is currently equivalent to -r -N -l inf --no-remove-listing.
Very Advanced Usage
· If you wish Wget to keep a mirror of a page (or FTP subdirecto- ries), use --mirror (-m), which is the shorthand for -r -l inf -N. You can put Wget in the crontab file asking it to recheck a site each Sunday:
"Etienne SOBOLE" a écrit dans le message de news: 46124ab4$0$5881$
salut je dois indexer des sites. pour faire ca je les aspire !
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus? je doute que ce type de commande existe mais bon !!! sait on jamais !
merci Etienne
Pourquoi n'utiliserais tu pas wget?
Je suppose que tu veux une copie mirroir locale tout en ne recopiant que les
nouvelles pages, si je devinne bien le pourquoi de ta question.
Cdt
Pascal
Extraits du man :
--mirror
Turn on options suitable for mirroring. This option turns on
recursion and time-stamping, sets infinite recursion depth and
keeps FTP directory listings. It is currently equivalent
to -r -N
-l inf --no-remove-listing.
Very Advanced Usage
· If you wish Wget to keep a mirror of a page (or FTP subdirecto-
ries), use --mirror (-m), which is the shorthand for -r -l
inf -N.
You can put Wget in the crontab file asking it to recheck a site
each Sunday:
"Etienne SOBOLE" <trash@tlk.fr> a écrit dans le message de news:
46124ab4$0$5881$426a74cc@news.free.fr...
salut je dois indexer des sites.
pour faire ca je les aspire !
y a t-il un moyen que je sache la date de modification de la page avant de
faire un fopen dessus?
je doute que ce type de commande existe mais bon !!! sait on jamais !
Pourquoi n'utiliserais tu pas wget? Je suppose que tu veux une copie mirroir locale tout en ne recopiant que les nouvelles pages, si je devinne bien le pourquoi de ta question. Cdt Pascal
Extraits du man :
--mirror Turn on options suitable for mirroring. This option turns on recursion and time-stamping, sets infinite recursion depth and keeps FTP directory listings. It is currently equivalent to -r -N -l inf --no-remove-listing.
Very Advanced Usage
· If you wish Wget to keep a mirror of a page (or FTP subdirecto- ries), use --mirror (-m), which is the shorthand for -r -l inf -N. You can put Wget in the crontab file asking it to recheck a site each Sunday:
"Etienne SOBOLE" a écrit dans le message de news: 46124ab4$0$5881$
salut je dois indexer des sites. pour faire ca je les aspire !
y a t-il un moyen que je sache la date de modification de la page avant de faire un fopen dessus? je doute que ce type de commande existe mais bon !!! sait on jamais !