US An english version of this website is available, would you like to check it out ?

YES | NO, stay on the french website


FR Une version anglophone du site est disponible, souhaitez-vous la consulter ?

OUI | NON, rester sur le site français

Close / Fermer

transformer du pdf en html ?

20/04/2008 12:16 par unbewusst.sein | Signaler un contenu abusif
je souhaite transformer le document "Ecma-262.pdf", qui n'a pas de lien
hypertexte en html.

j'ai essayé par google qui a jugé que :
Impossible d'afficher l'intégralité de la pièce jointe, car le fichier
est trop volumineux.

le document fait 706ko/188 pages

je cherche donc un outil pour le convertir en html, voire xml, le but
étant d'en faire un "panel" pour firefox et/ou opera comme sur :
<http://people.opera.com/rijk/panels....html>.
--
Une Bévue
email Suivre cette discussionRéponses Lire les 19 réponsesReplies Répondre

Lire les réponses

#1 h.sainct
20/04/2008 13h47 | Contenu abusif
il y a un projet unix GNU nommé pdftohtml qui fait ça sur sourceforge;
je ne sais pas s'il y a une version osx toute compilée...


--
Frédérique & Hervé Sainct, [fr,es,en,it]
Frédérique's initial is missing in front of the above address
l'initiale de Frédérique manque devant l'adresse email ci-dessus
Reponse Répondre à ce message
#2 unbewusst.sein
20/04/2008 15h40 | Contenu abusif
Frédérique & Hervé Sainct
il y a un projet unix GNU nommé pdftohtml qui fait ça sur sourceforge;
je ne sais pas s'il y a une version osx toute compilée...


ok, merci beaucoup, je peux me contenter d'un truc en ligne de commande.

pour l'instant, j'ai procédé à trois essais :

- Google : il faut s'envoyer à soi-même le fichier pdf en fichier
attaché d'un email et, à la réception, demander à la visualiser en html.
manque de pot, celui que je voulait convertir est trop lourd pour Google
;

- Adobe, sur le convertisseur online ça n'a pas marché, par email si
mais il manque les images dans le résultat et la présentation est
nettement moins bonne que celle de Google ;

- deskUNPDF (version d'essai d'un produit commercial) semble correct
mais ne convertit qu'une page en "trial".

--
Une Bévue

Reponse Répondre à ce message
#3 Paul Gaborit
20/04/2008 17h39 | Contenu abusif
À (at) Sun, 20 Apr 2008 15:40:49 +0200,
(Une Bévue) écrivait (wrote):
- Google : il faut s'envoyer à soi-même le fichier pdf en fichier
attaché d'un email et, à la réception, demander à la visualiser en html.
manque de pot, celui que je voulait convertir est trop lourd pour Google


Il existe des outils permettant d'extraire une ou plusieurs pages d'un
fichier PDF (pdftk ou le package 'pdfpages' de TeX).

--
Paul Gaborit -
Reponse Répondre à ce message
#4 unbewusst.sein
20/04/2008 17h56 | Contenu abusif
Paul Gaborit

Il existe des outils permettant d'extraire une ou plusieurs pages d'un
fichier PDF (pdftk ou le package 'pdfpages' de TeX).


ok, merci pour l'info.

j'ai installé la v 4 de pdftohtml par MacPorts.

ça marche pas mal.
--
Une Bévue

Reponse Répondre à ce message
#5 Henripasdespammerci
20/04/2008 17h59 | Contenu abusif
Une Bévue
je souhaite transformer le document "Ecma-262.pdf", qui n'a pas de lien
hypertexte en html.

j'ai essayé par google qui a jugé que :
Impossible d'afficher l'intégralité de la pièce jointe, car le fichier
est trop volumineux.

le document fait 706ko/188 pages

je cherche donc un outil pour le convertir en html, voire xml, le but
étant d'en faire un "panel" pour firefox et/ou opera comme sur :


On peut faire ça en deux temps
- convertir le PDF en texte via n'importe quel logiciel d'OCR
- convertir le fichier texte obtenu en fichier html

Maintenant 188 pages ... pfou !

Henri


--
Henri Balmain
http://freenours.org

email Suivre cette discussion Reponse Répondre à ce message