faire un screenshot d'un fichier word (ou le convertir en HTML)

Le
heulman
Bonjour,

Je souhaiterais faire automatiquement un screenshot d'un fichier word (voire
de tout fichier Office) lors de l'upload sur serveur.

Pour les fichiers PDF, j'utilise ImageMagick + GhostScript et ça fonctionne
à merveille.

Pour les fichiers Word, je vois bien une solution en passant par OpenOffice
mais ça oblige à avoir une interface graphique, ce que je souhaiterais
éviter pour une serveur web. C'est pourquoi je cherche une autre solution.
Peut-être en passant par une convertion Word->HTML, mais tout ce que je
trouve utilise des objets COM uniquement disponibles sous windows.

Donc, si vous avez une solution ou simplement une idée, je suis preneur.

heulman
Vidéos High-Tech et Jeu Vidéo
Téléchargements
Vos réponses
Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Stephane Chazelas
Le #1215198
2008-03-5, 10:37(+01), heulman:
Bonjour,

Je souhaiterais faire automatiquement un screenshot d'un fichier word (voire
de tout fichier Office) lors de l'upload sur serveur.

Pour les fichiers PDF, j'utilise ImageMagick + GhostScript et ça fonctionne
à merveille.

Pour les fichiers Word, je vois bien une solution en passant par OpenOffice
mais ça oblige à avoir une interface graphique, ce que je souhaiterais
éviter pour une serveur web. C'est pourquoi je cherche une autre solution.
Peut-être en passant par une convertion Word->HTML, mais tout ce que je
trouve utilise des objets COM uniquement disponibles sous windows.

Donc, si vous avez une solution... ou simplement une idée, je suis preneur.
[...]


$ apt-cache show unoconv antiword wv
Package: unoconv
Priority: extra
Section: text
Installed-Size: 65
Maintainer: Vincent Bernat Architecture: all
Version: 0.3-3
Depends: python, python-uno
Conflicts: odt2txt (<= 0.3-1)
Filename: pool/main/u/unoconv/unoconv_0.3-3_all.deb
Size: 14890
MD5sum: 93cb6b8a4fa31465adba1d921efb6dee
SHA1: dc4793e1477f5aa1d18ed152f41de615e22b168f
SHA256: eaa18611af415c75fa5577dc92d2c6f91f962519ac1e4c5f7fe5a73620d5ce4d
Description: converter between OpenOffice.org document formats
This package provides a commandline utility which can convert from
any document format that OpenOffice can import to any document format
it can export. It uses OpenOffice's UNO bindings for non-interactive
conversion of documents.
.
Supported document formats include Open Document format, MS Word, MS
Office Open/MS OOXML, PDF, HTML, XHTML, RTF, Docbook, and more.
Homepage: http://dag.wieers.com/home-made/unoconv/
Tag: implemented-in::python, interface::commandline, role::program, use::converting, works-with::file, works-with-format::{docbook,html,odf,pdf}

Package: antiword
Priority: optional
Section: text
Installed-Size: 756
Maintainer: Anibal Monsalve Salazar Architecture: i386
Version: 0.37-2
Depends: libc6 (>= 2.3.6-6)
Filename: pool/main/a/antiword/antiword_0.37-2_i386.deb
Size: 149698
MD5sum: 56775f548da6c3356cb1ed0471d1c684
SHA1: 0539065a6932b1e7e69e7a31d2b8107705762372
SHA256: b91fa57e3d7b9f6740e39ceedbef1f2eb6211b12412fba54f6a5cb5054c9e634
Description: Converts MS Word files to text and ps
Antiword is a free MS Word reader.
.
It converts the binary files from MS Word 6, 7, 97 and 2000 to text and
Postscript.
.
Homepage: http://www.winfield.demon.nl/
Tag: interface::commandline, role::program, scope::utility, use::converting, works-with::dtp, works-with::text, works-with-format::plaintext, works-with-format::postscript

Package: wv
Priority: optional
Section: text
Installed-Size: 2120
Maintainer: Daniel Walrond Architecture: i386
Version: 1.2.4-2
Replaces: mswordview
Provides: mswordview
Depends: libc6 (>= 2.3.6-6), libexpat1 (>= 1.95.8), libfreetype6 (>= 2.2), libglib2.0-0 (>= 2.12.0), libgsf-1-114 (>= 1.14.3), libjpeg62, libpng12-0 (>= 1.2.15~beta5), libwmf0.2-7 (>= 0.2.8.4), libwv-1.2-3 (>= 1.2.4), libx11-6, libxml2 (>= 2.6.27), zlib1g (>= 1:1.2.1)
Suggests: tetex-extra, gs, elinks | links | lynx, imagemagick, gv | postscript-viewer
Conflicts: mswordview
Filename: pool/main/w/wv/wv_1.2.4-2_i386.deb
Size: 98394
MD5sum: 11e32d7712742d221eb0b4f22a2ef86a
SHA1: 5ba0a61b9d6f00580ee78fda1d8f575b6ae1eb66
SHA256: 003cef298599e992d5d72b953741f9426449e495d2c2d2dfd6764507cc2bb9b5
Description: Programs for accessing Microsoft Word documents
wvWare (previously known as mswordview) is a library that allows access
to Microsoft Word files. It can load and parse the Word 2000, Word 97,
Word 95, and Word 6 file formats. (Work is underway to support reading
earlier formats as well: Word 2 documents are converted to plain text.)
.
This package provides the following programs:
.
* wvWare: Converts to HTML and LaTeX. It's used by a small army of
helper scripts able to preview Word documents and convert them to
various other formats, like PostScript, PDF, DVI, etc.
.
* wvRTF: Converts to Microsoft's Rich Text Format.
.
* wvSummary: Displays the summary information stream of all OLE2 files,
i.e. Excel, PowerPoint, Visio, Access, etc.
.
* wvVersion: Outputs the version of the Word format a document is stored
in.
.
Note that conversion to DVI, PostScript, or PDF requires the tetex-extra
package; PDF conversion also requires Ghostscript. Having ELinks, Links,
or Lynx will greatly improve the plain text output. ImageMagick may help
with the quality of images. If you wish to preview Word documents from
the comfort of your mail reader, install a PostScript viewer like gv.
Tag: role::program, role::shared-lib, scope::utility, use::converting, use::viewing, works-with::{db,dtp,spreadsheet,text}, works-with-format::{pdf,postscript,tex}

--
Stéphane

Marc
Le #1219735
"heulman" wrote:

Je souhaiterais faire automatiquement un screenshot d'un fichier word (voire
de tout fichier Office) lors de l'upload sur serveur.

Pour les fichiers PDF, j'utilise ImageMagick + GhostScript et ça fonctionne
à merveille.

Pour les fichiers Word, je vois bien une solution en passant par OpenOffice
mais ça oblige à avoir une interface graphique, ce que je souhaiterais
éviter pour une serveur web.


On peut scripter openoffice pour qu'il fasse des conversions sans lancer
d'interface graphique. J'avais vu les détails à plusieurs endroits sur le
web, ça doit se trouver.

Matthieu Moy
Le #1221809
Stephane Chazelas
$ apt-cache show unoconv


Attention pour unoconv : Ça utilise une instance d'OpenOffice.org, et
même si on peut avoir un processus openoffice sans avoir de fenêtre
graphique, je ne trouve pas de moyen d'avoir ça sans avoir un serveur
X quelque part :

$ DISPLAY= ooffice -headless
/usr/lib/openoffice/program/soffice.bin X11 error: Can't open display:
Set DISPLAY environment variable, use -display option
or check permissions of your X-Server
(See "man X" resp. "man xhost" for details)

Dommage, parce que par ailleurs, c'est très pratique, unoconv.

--
Matthieu

Thierry B.
Le #1230274
--{ Matthieu Moy a plopé ceci: }--


$ apt-cache show unoconv


Attention pour unoconv : Ça utilise une instance d'OpenOffice.org, et
même si on peut avoir un processus openoffice sans avoir de fenêtre
graphique, je ne trouve pas de moyen d'avoir ça sans avoir un serveur
X quelque part :

Si je me souviens bien, il existe un pseudo-serveur X11 qui permet

de contourner ce genre de contrainte. Je pense que c'est un morceau
de Xorg, genre "xnull". Je connais quelqu'un qui s'en est servi
pour faire tourner Firefox sans écran, ni clavier, ni souris.

$ DISPLAY= ooffice -headless
/usr/lib/openoffice/program/soffice.bin X11 error: Can't open display:
Set DISPLAY environment variable, use -display option
or check permissions of your X-Server
(See "man X" resp. "man xhost" for details)


Et ça réglait ce genre de souci. Hélas, j'arrive pas à me rappeller
où il avait trouvé ça, à part que c'était pour utiliser un soft
de test d'application Web.


--
$ su -
Password:
you are not in group wheel
Sorry


Stephane Chazelas
Le #1230273
2008-03-05, 19:52(+01), Matthieu Moy:
Stephane Chazelas
$ apt-cache show unoconv


Attention pour unoconv : Ça utilise une instance d'OpenOffice.org, et
même si on peut avoir un processus openoffice sans avoir de fenêtre
graphique, je ne trouve pas de moyen d'avoir ça sans avoir un serveur
X quelque part :

$ DISPLAY= ooffice -headless
/usr/lib/openoffice/program/soffice.bin X11 error: Can't open display:
Set DISPLAY environment variable, use -display option
or check permissions of your X-Server
(See "man X" resp. "man xhost" for details)

Dommage, parce que par ailleurs, c'est très pratique, unoconv.


Le ooffice que j'ai ici (recente mise a jour sur une debian
unstable) n'a pas ce probleme. En revanche, je n'ai pas reussi a
y faire marcher unoconv.

--
Stéphane


Stephane Chazelas
Le #1234015
2008-03-06, 09:15(+00), Stephane Chazelas:
[...]
$ DISPLAY= ooffice -headless
/usr/lib/openoffice/program/soffice.bin X11 error: Can't open display:
Set DISPLAY environment variable, use -display option
or check permissions of your X-Server
(See "man X" resp. "man xhost" for details)

Dommage, parce que par ailleurs, c'est très pratique, unoconv.


Le ooffice que j'ai ici (recente mise a jour sur une debian
unstable) n'a pas ce probleme. En revanche, je n'ai pas reussi a
y faire marcher unoconv.


Au temps pour moi, j'ai le meme probleme.

Le "virtual X server" que quelqu'un d'autre mentionnait est
probablement xvfb.

--
Stéphane


Nicolas George
Le #1234014
"Thierry B." wrote in message
Si je me souviens bien, il existe un pseudo-serveur X11 qui permet
de contourner ce genre de contrainte. Je pense que c'est un morceau
de Xorg, genre "xnull".


Regarde Xfake ou Xvfb, qui sont des sous-produits possibles de la
compilation de Xserver.

Thierry B.
Le #1252440
--{ Thierry B. a plopé ceci: }--

(See "man X" resp. "man xhost" for details)


Et ça réglait ce genre de souci. Hélas, j'arrive pas à me rappeller
où il avait trouvé ça, à part que c'était pour utiliser un soft
de test d'application Web.

Et cet outils de test s'appelait Selenium. Ils ont peut-être

des infos dans leur FAQ.

--
++++++ http://la.buvette.org/POV/ex/grille.html ++++++


Publicité
Poster une réponse
Anonyme