problème avec %20

Le
unbewusst.sein
j'ai des pbs avec %20

ce que je fais :
je télécharge avec curl des pages et images dont l'URL est obtenue par
les href et src des pages concernées.

j'enregistre ces images et pages sur mon ordi. je ne change que la
partie dossier du path.
pas d'encodage ni de décodage du nom de fichier.

donc quand il y a des %20 dans l'URL référencée par un href ou src,
firefox 4, ne trouve pas.

ces fichiers sont enregistrés avec des noms du genre :
"mon%20fichier.jpg", par exemple.

si je duplique ce fichier en lui donnant le nom : "mon fichier.jpg" ff 4
ne trouve pas +.

le remplacement des %20 par des espaces dans les noms de fichiers sur
l'ordi ne suffit donc pas.

j'imagine qu'il faut "tout" faire càd remplacer/décoder aussi les URLs
dans les fichiers HTML ? ce qui est + coûteux en temps.

question diagnostic, je suis un peu peaumé car je ne vois pas où est la
véritable source du pb.

pour info, ma commande curl :

curl --create-dirs -f -o "#{f_path}" "#{u_href}"

où f_path est la réplique locale de u_href, ie. seul le nom du dossier
est changé.
--
Je m'intéresse au futur, c'est là que je compte passer
le reste de ma vie.
(Woody Allen)
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
yamo'
Le #22635631
Salut,

Une Bévue a tapoté, le 02/10/2010 08:07:
j'ai des pbs avec %20...



À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
je ne connais pas assez bien curl et wget.

--
Stéphane
http://pasdenom.info
unbewusst.sein
Le #22635721
yamo'
À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
je ne connais pas assez bien curl et wget.



c'est uniquement dispo par fink, sur Mac OS X ?

notes que je pense que curl ne fait rien dans l'affaire.
je pense que les pages en cause sont celles téléchargées par le
butineur.

je viens de faire l'expérience avec cette page :
<http://blog.savourclub.fr/dossiers/accords-mets-vins/canard-aux-pommes/
?&xtor=EPR-15-[]-20101002&xtdt!433348>

si je laisse faire FF, il me crée un dossier "Canard aux
pommes_fichiers" et je retrouve dans le html sauvegardé des
"Canard%20aux%20pommes_fichiers".

je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
provient le pn, pas si évident...
--
Je m'intéresse au futur, c'est là que je compte passer
le reste de ma vie.
(Woody Allen)
yamo'
Le #22635911
Salut,

Une Bévue a tapoté, le 02/10/2010 11:13:
c'est uniquement dispo par fink, sur Mac OS X ?



euh...

À part savoir que Mac OS X est un unix je ne connais rien à ce système!

Sur

--
Stéphane
http://pasdenom.info
SAM
Le #22635991
Le 02/10/10 11:13, Une Bévue a écrit :
yamo'
À part essayer httrack qui fais ça très bien, je ne sais pas répondre,
je ne connais pas assez bien curl et wget.



c'est uniquement dispo par fink, sur Mac OS X ?

notes que je pense que curl ne fait rien dans l'affaire.
je pense que les pages en cause sont celles téléchargées par le
butineur.

je viens de faire l'expérience avec cette page :
<http://blog.savourclub.fr/dossiers/accords-mets-vins/canard-aux-pommes/
?&xtor=EPR-15-[]-20101002&xtdt!433348>

si je laisse faire FF, il me crée un dossier "Canard aux
pommes_fichiers" et je retrouve dans le html sauvegardé des
"Canard%20aux%20pommes_fichiers".



Oui, et ?

Il s'en débrouille très bien, non ?
(sauf qu'il ne sauvegarde pas les images des css...)

je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
provient le pn, pas si évident...



Il ne devrait n'il y avoir aucun problème

me trouve bien l'image
tout en montrant l'url traduite (espaces au lieu de %20)
Un copié-collé de cette url traduite nous re-donne :
<file:///Users/STEF/Desktop/yt/%C2%BB%20Canard%20aux%20pommes_fichiers/recette15-199x300.jpg


et Firefox affiche aussi l'image avec cette url ;
<file:///Users/STEF/Desktop/yt/%C2%BB Canard aux
pommes_fichiers/recette15-199x300.jpg>


--
Stéphane Moriaux avec/with iMac-intel
unbewusst.sein
Le #22636091
SAM
Il s'en débrouille très bien, non ?
(sauf qu'il ne sauvegarde pas les images des css...)

> je suis en train d'inspecter mes dossiers/fichiers pour bien piger d'où
> provient le pn, pas si évident...

Il ne devrait n'il y avoir aucun problème



ben ouais, c'est ce que je pense aussi mais, j'en ai rencontrés...
à re-re-re-vérifier, c'est en cours !

--
Je m'intéresse au futur, c'est là que je compte passer
le reste de ma vie.
(Woody Allen)
unbewusst.sein
Le #22636101
yamo'
À part savoir que Mac OS X est un unix je ne connais rien à ce système!

Sur


OK, merci, je n'ai pas assez regardé, mea culpa ))

mais bon :

imyt% sudo port install httrack
---> Computing dependencies for httrack
---> Fetching httrack
---> Attempting to fetch httrack-3.43-9.tar.gz from
http://www.httrack.com/
---> Verifying checksum(s) for httrack
Error: Checksum (md5) mismatch for httrack-3.43-9.tar.gz
Error: Checksum (sha1) mismatch for httrack-3.43-9.tar.gz
Error: Checksum (rmd160) mismatch for httrack-3.43-9.tar.gz
Error: Target org.macports.checksum returned: Unable to verify file
checksums
Log for httrack is at:
/opt/local/var/macports/logs/_opt_local_var_macports_sources_rsync.macpo
rts.org_release_ports_net_httrack/main.log
Error: Status 1 encountered during processing.
To report a bug, see

--
Je m'intéresse au futur, c'est là que je compte passer
le reste de ma vie.
(Woody Allen)
Publicité
Poster une réponse
Anonyme