GNT sans publicité, site mobile, fonctionnalitées exclusives...

Aspirateur de site ?

Le
Pierre
Je recherche un aspirateur de site pour os x capable d'aspirer un site
contenant des pages dynamiques et de les convertir en page html
statiques. par exemple :
soit la page index.html qui contient un lien href vers une page du style
"toto.php3?rub=blabla"

il faut que le lien href dans index.html devienne quelque chose comme
"totoblabla.html" et que la page dynamique obtenue en cliquant sur ce
lien se nomme totoblabla.html bien sur.

J'ai essayé webdevil, deepvacuum, sitesucker, mais aucun d'eux ne
fonctionne, ils stockent tous les page sous un nom du genre
toto.php3?rub=blabla rendant ses pages inaccessible lorsqu'on teste le
site aspiré.

Quelle solution ?

Merci
Lire les 3 réponses

Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
patpro ~ patrick proniewski
Le #1834182
In article jose.campos+ (José Campos) wrote:

Pierre
Je recherche un aspirateur de site pour os x capable d'aspirer un site
contenant des pages dynamiques et de les convertir en page html
statiques.[...]
J'ai essayé webdevil, deepvacuum, sitesucker, mais aucun d'eux ne
fonctionne, ils stockent tous les page sous un nom du genre
toto.php3?rub=blabla rendant ses pages inaccessible lorsqu'on teste le
site aspiré.

Quelle solution ?


À vue de nez, renommer tes pages par lot avec un petit utilitaire
dont j'ai oublié le nom. Puis, à l'aide de BBEdit ou TextMate
rechercher/remplacer tous les liens à l'intérieur des pages en une seule
fois avec RegEx, un truc du genre :
search : (toto).php3?rub=(w+)
replace : $1$2.html


a priori wget avec l'option --html-extension devrait suffire.


patpro


francois.jacquemin
Le #1823262
Pierre
Je recherche un aspirateur de site pour os x capable d'aspirer un site
contenant des pages dynamiques et de les convertir en page html
statiques.


As-tu essayé Safari ? Dans le menu "Fichier" tu choisis "Enregistrer
sous..." et là, tu choisis "Archive Web". Tu vas être bluffé par le
résultat en ce qui concerne les pages contenant des appels en PHP.
--
F. Jacquemin

blanc
Le #1834118
Pierre
J'ai essayé webdevil, deepvacuum, sitesucker, mais aucun d'eux ne
fonctionne, ils stockent tous les page sous un nom du genre
toto.php3?rub=blabla rendant ses pages inaccessible lorsqu'on teste le
site aspiré.


Essaye aussi iCab. Je ne l'ai pas testé avec des liens php, mais il a un
bon système d'archivage, et ses archives ont en outre l'avantage d'être
des zips qu'on peut dézipper et utiliser ensuite avec n'importe quel
navigateur.

JPaul.

Publicité
Suivre les réponses
Poster une réponse
Anonyme