OVH Cloud OVH Cloud

Aspirer un site web avec Mozilla

8 réponses
Avatar
herve.nospam
Salut,

Si je fais Fichier/Enregister sous dans Mozilla 1.4, j'ai un menu
déroulant me proposant 4 formats (Page web complète, Page web HTML
seulement, Fichiers texte, Tous les fichiers). Mais pas d'option pour
choisir la "profondeur" d'enregistrement, c'est à dire le niveau
hiérarchique des liens à enregistrer. Apparemment Mozilla ne permet
d'aspirer que la page en cours, pas celles définies par les liens.
IE permet de le faire, avec une option pour n'enregistrer que les
liens internes au site web, ce qui évite d'aspirer la moitié du web
mondial ;-) Mais le fichier obtenu est au format WAFF, que Mozilla ne
sait pas lire.
Merci d'avance pour vos suggestions,

Hervé

8 réponses

Avatar
Paul GABORIT
À (at) 3 Nov 2003 00:58:44 -0800,
(herve) écrivait (wrote):
Si je fais Fichier/Enregister sous dans Mozilla 1.4, j'ai un menu
déroulant me proposant 4 formats (Page web complète, Page web HTML
seulement, Fichiers texte, Tous les fichiers). Mais pas d'option pour
choisir la "profondeur" d'enregistrement, c'est à dire le niveau
hiérarchique des liens à enregistrer. Apparemment Mozilla ne permet
d'aspirer que la page en cours, pas celles définies par les liens.
IE permet de le faire, avec une option pour n'enregistrer que les
liens internes au site web, ce qui évite d'aspirer la moitié du web
mondial ;-) Mais le fichier obtenu est au format WAFF, que Mozilla ne
sait pas lire.


Il existe de très nombreuses extensions pour Mozilla (ou Firebird). Je crois
qu'il en existe une permettant de faire ce que vous voulez (personnellement,
je préfère utiliser 'wget' en ligne de commande).

Allez voir sur <http://www.mozdev.org/>.

--
Paul Gaborit - <http://www.enstimac.fr/~gaborit/>

Avatar
yvon.thoraval
Paul GABORIT wrote:


Il existe de très nombreuses extensions pour Mozilla (ou Firebird). Je crois
qu'il en existe une permettant de faire ce que vous voulez (personnellement,
je préfère utiliser 'wget' en ligne de commande).

Allez voir sur <http://www.mozdev.org/>.



il y a aussi un emballage cocoa de wget...

--
Yvon Thoraval

Avatar
herve.nospam
Paul GABORIT wrote in message news:...
Allez voir sur <http://www.mozdev.org/>.


Merci. Je n'y ai trouvé que http://packrat.mozdev.org/, qui semble
n'être qu'à l'état embryonnaire. Cependant j'ai trouvé plusieurs
logiciels qui font ça (voir ma réponse à Yvon), même si c'est moins
pratique que depuis le navigateur lui-même.

Hervé

Avatar
herve.nospam
(Yvon Thoraval) wrote in message news:<1g3ug4b.1109lz9xwudltN%...
il y a aussi un emballage cocoa de wget...


Il y en a même plusieurs. En faisant une recherche sur VersionTracker
avec "offline" on trouve pas mal de choses. J'ai téléchargé et vais
tester SiteSucker, léger et gratuit.

Au passage j'ai trouvé un logiciel un peu différent, qui semble
intéressant si l'on a une connexion RTC : MM3 Web Assistant
<http://www.mm3tools.de/WebAssistant/private/en/index.html>
Ca mémorise automatiquement toutes les pages web consultées, ce qui
permet de les revoir hors ligne sans avoir besoin de faire une manip
d'enregistrement volontaire.
Quelqu'un a-t-il testé ?

Hervé

Avatar
h.sainct
iCab fait ça très bien, en détail, depuis longtemps (je suis par ex. en
train de télécharger le dernier exemplaire de la new york review of
books, lisible seulement si j'ai le cookie "abonné" qui va bien, avec
juste deux niveaux de profondeur et en excluant toutes les images sauf
les jpeg, seulement les fichiers sur le site etc.)

Hervé (un autre, faut s'entr'aider entre Hervés :-)

--
Frédérique & Hervé Sainct,
Frédérique's initial is missing in front of the above address
l'initiale de Frédérique manque devant l'adresse email ci-dessus
Avatar
herve.nospam
(Frédérique & Hervé Sai nct) wrote in message news:<1g3v6ov.occyix41a1i2N%...
iCab fait ça très bien, en détail, depuis longtemps
Merci Hervé, je vais voir ça. J'avais testé iCab il y a longtemps,

mais pas en version X, il faut dire qu'il y a le choix maintenant
parmi les navigateurs, et les commentaires sur iCab sur VersionTracker
ne sont pas très élogieux.

Hervé

Avatar
h.sainct
herve wrote:

(...) il faut dire qu'il y a le choix maintenant
parmi les navigateurs, et les commentaires sur iCab sur VersionTracker
ne sont pas très élogieux.


iCab a un défaut énorrme, une tare: il "passe" mal ce que l'on nomme les
CSS2. Ca l'élimine pour environ 5% des sites, ce qui reste effroyable.

Cela dit, ses développeurs sont intensément conscients de la chose, et
travaillent d'arrache-pied (quasi une mise à jour par mois en ce
moment), et l'annonce des CSS2 pour la prochaine version ne semble pas
du bluff (le tout est de savoir si elle sortira le mois prochain ou
l'année prochaine).

Surtout, iCab représente une philo très, très originale parmi les
navigateurs, avec une très forte avance sur trois points au moins:

- les capacités de téléchargement, supérieures de très loin à tout autre
navigateur (exemple: tu peux charger une page avec image sous forme d'un
seul fichier, qui est une archive zip de tous les html, jpeg etc.
-manipulation simple, aucun format "propriétaire", ouverture dans iCab
d'un double clic) et naturellement tous les réglages dont j'ai parlé
plus haut qui le rendent largement comparable aux logiciels de "copie de
site" dédiés (voire mieux: lequel permettra par ex. le login préalable
sur un site gérant la suite des connexions avec des cookies)

- les capacités de filtrage de pubs, animations, popups etc.: là encore,
ce que les autres navigateurs permettent en tant que réglage *général*
(par ex. pas de popups, cookies seulement provisoires, refus des images
de pub provenant de serveurs différents...), iCab le propose en outre
site par site. Par exemple, tu peux avoir des réglages généraux "très
prudents" (aucun cookie, aucun popup, aucune image de serveur différent,
etc.) et *en même temps* avoir un réglage spécifique pour chacun de tes
sites favoris, pour tel les popups sont nécessaires, pour tel autre on
accepte tous les cookies, pour tel on doit accepter le referer...
A ma connaissance là encore aucun autre navigateur ne permet ça, et...
c'est vite indispensable: après une semaine d'iCab la lecture de ton
journal quotidien devient vite inacceptable lorsque reviennent toutes
ces pubs entrelacées ou clignotantes

- iCab permet en outre un mode kiosque très élaboré (dont je ne me sers
pas, donc je ne peux pas beaucoup en parler).

A part ça, c'est quand même le seul navigateur à démarrer aussi vite que
Safari (c'est-à-dire beaucoup, beaucoup plus vite que tous les autres),
et son interface n'a rien de rédhibitoire (onglets, personalisation des
boutons, des barres d'outils...).
Bref, dans mon cas, c'est l'un des deux nav de base avec Opéra (plus
lent, gaspilleur de CPU, assez pauvre question filtrage et
téléchargement, mais parfaitement "compatible")

Hervé

--
Frédérique & Hervé Sainct,
Frédérique's initial is missing in front of the above address
l'initiale de Frédérique manque devant l'adresse email ci-dessus

Avatar
fr_jacqu
Frédérique & Hervé Sainct wrote:


Surtout, iCab représente une philo très, très originale parmi les
navigateurs, avec une très forte avance sur trois points au moins:
Oui, c'est vraiment un navigateur intéressant, prometteur, et à suivre.


--
F. Jacquemin