OVH Cloud OVH Cloud

generation de miniatures d'une page html

8 réponses
Avatar
Lascap
Salut à tous,

Pour les besoins d'un CMS que je suis en train de développer, j'aimerais,
même si je peux faire autrement, afficher en regard de l'administration
d'une page modifiable, une vignette plus ou moins grande qui serait en fait
l'équivalent d'une capture d'écran de la page en question....

Je sais que c'est possible, étant donné que google l'avait fait à une
époque dans un de ses développements (à moins que c'était des types qui
faisaient des Print screen à la mimine, mais j'y crois pas trop....), mais
je n'ai pas trop d'idée sur la chose. A part peut etre parser le code html
généré (à partir par exemple des pages que je mets en cache) et générer une
image de la chose avec gd ou autre, image que je peux par la suite
redimensionner pour en faire une vignette montrable (quelque chose comme
300x450 serait envisageable..)

Autre option, un bidule écrit en c ou en java, placé sur le serveur (j'ai
pas trop de restrictions sur le serveur, il est dédié)

voilà voilà, si vous aviez des idées là dessus...

Merci,
Lascap

8 réponses

Avatar
Lascap
Re.
Bon, alors je vais continuer ma reflexion tout seul, puisque personne ne
daigne me répondre (snif)
En fait, l'idée que j'ai eu hier est la suivante: il faudrait que je génére
des fichiers pdf, puis que je crée une image jpeg à partir de ce fichier via
quelque chose comme image magik.
Seulement voilà, la génération de pdf à partir de html ne marche pas top,
surtout s'il y a des couleurs , et surtout si le html n'est pas strictement
valide.(genre <br> à la place de <br />, ou pire <br/> à la place de <br />)
et/ou devient un peu complexe)
Donc ça veux dire traitement du code html avant génération, etc, beaucoup de
boulot pour finalement un petit luxe (afficher une vignette d'une page html,
franchement...). Mais en même temps si on est obligé de passer par là,
pourquoi pas.
d'ou ma question subsidiaire: quelle lib pdf utilisez vous, et faite vous de
la conversion html -> pdf avec???

pour l'instant j'ai essayé
- fpdf : très bien, gratos, mais pas top au point pour importer du html
(d'ailleurs l'auteur le dit lui même)
- HTML_ToPDF, que je n'ai malheureusement pas réussi à utiliser, parce qu'il
manquait un soft externe qu'utilise la lib, html2ps, sur mon serveur, et que
je ne savais pas / j'avais la flemme de trouver.
- pdf-o-matic (http://www.easysw.com/htmldoc/pdf-o-matic.php) qui m'a
relativement bluffé, mais qui n'était pas tout à fait satisfaisant qd même.


voilà voilà...

Lascap
Avatar
Frederic BISSON
Seulement voilà, la génération de pdf à partir de html ne marche pas top,
surtout s'il y a des couleurs , et surtout si le html n'est pas strictement
valide.(genre <br> à la place de <br />, ou pire <br/> à la place de <br />)
et/ou devient un peu complexe)
Tu peux passer par Tidy. En PHP5, c'est une extension disponible, sinon tu

peux l'avoir comme ligne de commande. Tidy est capable de mettre au norme
le code HTML (et notamment de résoudre les quelques problèmes
d'écritures dont tu parles).

d'ou ma question subsidiaire: quelle lib pdf utilisez vous, et faite vous de
la conversion html -> pdf avec???
J'ai eu comme toi à un moment l'envie de faire des miniatures de pages

HTML et j'avais utilisé html2ps à l'époque. J'avais vite arrêté car
le résultat était décevant, surtout avec l'utilisation de CSS.

@+

Frédéric

Avatar
Guillaume Bouchard
Frederic BISSON wrote:
J'ai eu comme toi à un moment l'envie de faire des miniatures de pages
HTML et j'avais utilisé html2ps à l'époque. J'avais vite arrêté car
le résultat était décevant, surtout avec l'utilisation de CSS.



http://xhtml2pdf.mandragor.org/

Gere deja pas mal de truc et en gerera plus le jour ou j'aurais envit de
m'y remettre ;o)

*S'occupe de la partie parsing CSS*
Donc prochainement, gestion des casacades et autres joyeusetées ;o)

--
Guillaume.

Avatar
Lascap
d'ou ma question subsidiaire: quelle lib pdf utilisez vous, et faite
vous de


la conversion html -> pdf avec???
J'ai eu comme toi à un moment l'envie de faire des miniatures de pages

HTML et j'avais utilisé html2ps à l'époque. J'avais vite arrêté car
le résultat était décevant, surtout avec l'utilisation de CSS.



Bon, ben je vais peut etre laisser tomber, moi aussi... Malgré le test de
la classe de Guillaume, cf post plus bas (en fait, à partir du moment ou ça
gère pas les tableaux ni les images, les vignettes vont avoir une sale
tronche)
En fait, ça me décoit d'autant plus qu'il doit y avoir moyen, en connaissant
un minimum l'explorateur de fichier linux (ou windows) du point de vue du
code, de récupérer la routine qui génère des vignettes de page HTML....
parce que ça se fait, et ça marche bien !!!
voilà voilà, ceci dit c'est pas bien grave.

Lascap


Avatar
Sebastian Lauwers
Lascap wrote:

Bon, ben je vais peut etre laisser tomber, moi aussi... Malgré le test de
la classe de Guillaume, cf post plus bas (en fait, à partir du moment ou ça
gère pas les tableaux ni les images, les vignettes vont avoir une sale
tronche)
En fait, ça me décoit d'autant plus qu'il doit y avoir moyen, en connaissant
un minimum l'explorateur de fichier linux (ou windows) du point de vue du
code, de récupérer la routine qui génère des vignettes de page HTML....
parce que ça se fait, et ça marche bien !!!
voilà voilà, ceci dit c'est pas bien grave.


Lorsque j'ai entendu le mot CSS, ca a fait tilt, un tutoriel très bien
fait que j'avais vu avait donné un lien vers BrowserCam...

http://www.browsercam.com/public.aspx?proj_id2697

Vous pouriez leur demander comment ils ont fait, c'est certes des
screenshots, mais en faisant un crop correct, vous devriez réussir à
obtenir des résultats.


Lascap


HTH,
Sebastian


--
The most likely way for the world to be destroyed,
most experts agree, is by accident.
That's where we come in; we're computer professionals.
We cause accidents.
--Nathaniel Borenstein

Avatar
Guillaume Bouchard
Lascap wrote:

Bon, ben je vais peut etre laisser tomber, moi aussi... Malgré le test de
la classe de Guillaume, cf post plus bas (en fait, à partir du moment ou ça
gère pas les tableaux ni les images, les vignettes vont avoir une sale
tronche)


Les tableaux c'est mal (tm) :)

Blague (concernant un reve utopiste) à part:

En fait, ça me décoit d'autant plus qu'il doit y avoir moyen, en connaissant
un minimum l'explorateur de fichier linux (ou windows) du point de vue du
code, de récupérer la routine qui génère des vignettes de page HTML....


L'explorateur de fichier Linux comme tu dis, si il s'agit de celui de
gnome ou kde (parce que moi mon explorateur de fichier c'est cd/ls/file
:)) doit surement fournir des sources dispo.

parce que ça se fait, et ça marche bien !!!


Le probleme c'est que surement que ces trucs machin font appel au moteur
de rendu de leur navigateur par defaut (IE sous win, ca doit etre
Konkeror sous KDE...) ce que je doute que tu ais de disponible. Mais si
jamais tu peut faire un appel systeme, il doit surement y avoir moyen de
regler cela :) Cependant cela restera dependant des differents packages
installés sur le serveur. Bref, soit ton serveur est sous win, soit il
est sous Nux et tu peux toujours courir pour que il y ai KDE sur un
serveur (sinon faut virer l'admin :))

--
Guillaume.

Avatar
Lascap

Les tableaux c'est mal (tm) :)


Jte le fais pas dire... mais bon, parfois on est obligé par
flemme/simplicité de l'éditeur...


Le probleme c'est que surement que ces trucs machin font appel au moteur
de rendu de leur navigateur par defaut (IE sous win, ca doit etre
Konkeror sous KDE...) ce que je doute que tu ais de disponible. Mais si
jamais tu peut faire un appel systeme, il doit surement y avoir moyen de
regler cela :) Cependant cela restera dependant des differents packages
installés sur le serveur. Bref, soit ton serveur est sous win, soit il
est sous Nux et tu peux toujours courir pour que il y ai KDE sur un
serveur (sinon faut virer l'admin :))



voui, c'est tout à fait ça.... je crois que je vais aller poster sur
machin.truc.fr.linux , là dessus. parce que bon, je peux très bien imaginer
récupérer le code (open source) qui va bien, et en faire une appli autonome
a qui je passe en argument une page ouaibe. (ça serait bon, ça !!)

voilà voilà
Lascap

Avatar
Frederic BISSON
Les tableaux c'est mal (tm) :)
Petite précision qui a son importance :

- c'est mal si on s'en sert pour faire du formatage pour l'affichage
- c'est bien si on s'en sert pour leur utilisation "normale" : présenter
un ensemble de données (résultat de requêtes, liste d'utilisateurs...)

@+

Frédéric