Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

transformer du pdf en html ?

20 réponses
Avatar
unbewusst.sein
je souhaite transformer le document "Ecma-262.pdf", qui n'a pas de lien
hypertexte en html.

j'ai essayé par google qui a jugé que :
Impossible d'afficher l'intégralité de la pièce jointe, car le fichier
est trop volumineux.

le document fait 706ko/188 pages

je cherche donc un outil pour le convertir en html, voire xml, le but
étant d'en faire un "panel" pour firefox et/ou opera comme sur :
<http://people.opera.com/rijk/panels/panelizer.html>.
--
Une Bévue

10 réponses

1 2
Avatar
laurent.pertois
Une Bévue wrote:

j'avoue ne pas comprendre qu'on puisse (en dehors du détail technique)
laisser microsoft dans un titre.


L'outil ne va quand même pas décider à ta place, il prend ce qu'il
trouve comme infos.

--
Politically Correct Unix - UTILITIES
The "touch" command has been removed from the standard distribution due
to its inappropriate use by high-level managers.

Avatar
unbewusst.sein
Laurent Pertois wrote:


j'avoue ne pas comprendre qu'on puisse (en dehors du détail technique)
laisser microsoft dans un titre.


L'outil ne va quand même pas décider à ta place, il prend ce qu'il
trouve comme infos.


euh, ce n'est pas ce que je voulais dire...
--
Une Bévue


Avatar
Henripasdespammerci
Une Bévue wrote:

écoutes, le "man" est plutôt laconique...

je l'ai sous les yeux, non, il n'y a pas cette option, par contre tu
peux choisir, c'est ce que je suis en train de faire, de sortir le
document en xml, et là, ça doit-être manipulable avec xslt, amha...


sinon tu ouvres ton fichier html, même à distance sur site,avec un
texteur/encodeur genre TextWrangler ,et tu changes ce qu'il y a dans la
balise <title>... </title>

Henri

--
Henri Balmain
http://freenours.org

Avatar
unbewusst.sein
Henri Balmain wrote:


sinon tu ouvres ton fichier html, même à distance sur site,avec un
texteur/encodeur genre TextWrangler ,et tu changes ce qu'il y a dans la
balise <title>... </title>


ah ben ça, merci, j'ai fait.

--
Une Bévue

Avatar
laurent.pertois
Une Bévue wrote:

Laurent Pertois wrote:


j'avoue ne pas comprendre qu'on puisse (en dehors du détail technique)
laisser microsoft dans un titre.


L'outil ne va quand même pas décider à ta place, il prend ce qu'il
trouve comme infos.


euh, ce n'est pas ce que je voulais dire...


Mais c'est ce que tu as dit :-)

Je ne pense pas que le titre restait avec Microsoft dans le document
Word, c'est une métadonnée et ton outil de conversion a repris cette
métadonnée pour faire le titre.

--
Politically Correct Unix - UTILITIES
The "touch" command has been removed from the standard distribution due
to its inappropriate use by high-level managers.



Avatar
unbewusst.sein
Laurent Pertois wrote:


Mais c'est ce que tu as dit :-)

Je ne pense pas que le titre restait avec Microsoft dans le document
Word, c'est une métadonnée et ton outil de conversion a repris cette
métadonnée pour faire le titre.


ouais, seule explication plausible...

"ce que j'aurais voulu dire et que je n'ai pas dit" :
je ne vois pas un type, non Microsoft, mettre un titre commençant par
Microsoft...
--
Une Bévue

Avatar
laurent.pertois
Une Bévue wrote:

"ce que j'aurais voulu dire et que je n'ai pas dit" :
je ne vois pas un type, non Microsoft, mettre un titre commençant par
Microsoft...


Ah ça...

--
Politically Correct Unix - UTILITIES
The "touch" command has been removed from the standard distribution due
to its inappropriate use by high-level managers.

Avatar
blanc
Une Bévue wrote:

je cherche donc un outil pour le convertir en html, voire xml, le but
étant d'en faire un "panel" pour firefox et/ou opera comme sur :


Macupdate ou Versiontracker devraient te permettre de trouver ça :
<http://www.versiontracker.com/php/qs.php?modeºsic&action=search&str=p
df+html&srchArea=macosx&submit=Go>
--
JiPaul.
/ /--/--// Jean-Paul Blanc
|/| L | quelquepart en (somewhere in)
/|| = ||| FRANCE

Avatar
unbewusst.sein
JiPaul wrote:

Macupdate ou Versiontracker devraient te permettre de trouver ça :
<http://www.versiontracker.com/php/qs.php?modeºsic&action=search&str=p
df+html&srchArea=macosx&submit=Go>


Ah ! Merci beaucoup, je vais pouvoir comparer avec ce que j'ai fait avec
pdftohtml (outil en ligne de commande) qui est un peu buggé (virtical au
lieu de vertical dans les rules css par ex) et surtout qui donne un html
très nettement plus lourd que le pdf 700ko -> 14 mo !!!

en espérant qu'il n'utilise pas pdftohtml...

on peut voir un résultat ici :

<http://thoraval.yvon.free.fr/ECMA-262/Ecma-262-i-001.html>

c'est moi qui ai ajouté le menu en js... pas d'yperliens internes au pdf
original.
--
Une Bévue

Avatar
zvif
Le dimanche 20 Avril 2008 à 13:47 par h.sainct :
il y a un projet unix GNU nommé pdftohtml qui fait ça sur
sourceforge;
je ne sais pas s'il y a une version osx toute compilée...


--
Frédérique & Hervé Sainct, [fr,es,en,it]
Frédérique's initial is missing in front of the above address
l'initiale de Frédérique manque devant l'adresse email ci-dessus


pdf en html/swf/images ....

http://www.biclim.com/
1 2