Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Nettoyeur d'HTML Word

18 réponses
Avatar
Thierry
Bonsoir,

J'aide quelqu'un a faire/mettre en ligne son site et il m'a filé ses pages
en WORD. J'ai commencé a nettoyer les cochenneries, mais il existe peut-
etre un outil spécialisé ?

8 réponses

1 2
Avatar
Laurent vilday
SAM a écrit :
Laurent vilday a écrit :
Thierry a écrit :
Laurent vilday écrivait
news:482b0d83$0$7182$:

Dans tous les cas, personne n'utilise Word ni pour maquetter et
encore moins pour la production finale.



Dans le monde professionnel où le moindre site est facturé 5000€,
certes.
Mais pas pour un ami qui veut donner une idée de ce qu'il veut.



Crois bien ce que tu veux !

Ami ou pas, on ne travaille PAS avec Word. C'est un fait.



J'ai failli répondre aussi.

Mais il a dit : "un ami qui veut montrer ce qu'il veut"
^^^^^^^
si le pote préfère Word à un crayon c'est son droit, non ? :-)



On est donc dans le deuxième cas de figure dont je parlais, cad : le
client (ami) fourni une saloperie en Word pour montrer le layout global
(position des blocs), il faut donc maquetter. Pas besoin du document
Word si ce n'est pour se faire une idée de comment créer le véritable
document HTML.

M'enfin depuis le 12/05 du premier post de l'OP j'espère bien qu'il
s'est paluché (fait à la main) le HTML et les styles.

De toute façon à part peut-être Tidy

<http://tidy.sourceforge.net/>

avec la config "word-2000", je ne vois pas d'outils capable d'extraire
les styles (immondes) générés par Word à l'intérieur d'un document Word
HTMLisé.

--
laurent
Avatar
Thierry
"Laurent vilday" a écrit dans le message de news:
482c41b6$0$681$

On est donc dans le deuxième cas de figure dont je parlais, cad : le
client (ami) fourni une saloperie en Word pour montrer le layout global
(position des blocs), il faut donc maquetter. Pas besoin du document Word
si ce n'est pour se faire une idée de comment créer le véritable document
HTML.

M'enfin depuis le 12/05 du premier post de l'OP j'espère bien qu'il s'est
paluché (fait à la main) le HTML et les styles.

De toute façon à part peut-être Tidy

<http://tidy.sourceforge.net/>

avec la config "word-2000", je ne vois pas d'outils capable d'extraire les
styles (immondes) générés par Word à l'intérieur d'un document Word
HTMLisé.



Ok, j'essaierai tidy... Mais j'essaierai avant tout l'export HTML
d'OpenOrifice.
Ca ne peut-etre que mieux que Word.
Avatar
Mihamina Rakotomandimby
d'OpenOrifice.
Ca ne peut-etre que mieux que Word.



L'un ne rattrape pas l'autre. Désolé.

--
Huile Essentielle de Camphre http://www.huile-camphre.fr
Infogerance http://www.infogerance.us
(Serveurs, Postes de travail, Développement logiciel)
Avatar
CrazyCat
Mihamina Rakotomandimby wrote:
d'OpenOrifice.
Ca ne peut-etre que mieux que Word.



L'un ne rattrape pas l'autre. Désolé.



De toutes manières, leur but n'est pas de générer du html, c'est un
"petit plus" pratique pour certains mais il ne faut en aucun cas les
imaginer comme des éditeurs.

De plus, je ne connais aucun outil wysiwyhtg qui fasse un code propre,
ce ne sont d'ailleurs que des aides à la mise en page.

--
Réseau IRC Francophone: http://www.zeolia.net
Aide et astuces webmasters : http://www.c-p-f.org
Communauté Francophone sur les Eggdrops: http://www.eggdrop.fr
Avatar
Thierry
"CrazyCat" a écrit dans le message de news:
4832c7c7$0$21147$

De toutes manières, leur but n'est pas de générer du html, c'est un "petit
plus" pratique pour certains mais il ne faut en aucun cas les imaginer
comme des éditeurs.



Oui, je sais bien. Disons que j'essayais de trouver la solution la moins
pire et OpenOrifice ne l'est pas.
Bref: Tiny + nettoyage manuel.
Avatar
Mihamina Rakotomandimby
Thierry wrote:
OpenOrifice



Tu le fais expres?
Parceque du coup, c'est toi qui passe pour l'oriffice.

--
Huile Essentielle de Camphre http://www.huile-camphre.fr
Infogerance http://www.infogerance.us
(Serveurs, Postes de travail, Développement logiciel)
Avatar
Pierre Maurette
Laurent vilday, le 15/05/2008 a écrit :

[...]

Ami ou pas, on ne travaille PAS avec Word. C'est un fait.



Bonjour,

L'idée ne me viendrais pas de maquetter avec Microsoft Word, mais je
vous trouve bien affirmatif. La problématique qui m'a amené à traîner
ici n'est pas tout à fait la même que celle de l'OP, mais je pense que
mon besoin de passer un .doc en HTML est justifié. J'explique pour
info, sans poser à priori de question, mais toute suggestion est
bienvenue:
- Je dispose d'une série d'une quinzaine de fichiers Microsoft Word,
pour un total de plus de 900 pages, destinés à l'édition papier. Je
veux mettre ce document en ligne, impérativement en HTML, avec des
styles adaptés à ce contexte.
- Ces fichiers sont déjà "merdiques" en eux-mêmes, en ce sens qu'ils
utilisent un template (.dot) destiné à la chaîne de PAO tout en
assurant un affichage écran à peu près lisible.
- Accessoirement il me faudra envisager la conversion "vers le web"
d'images vectorielles .cdr et bitmap .pcx.
- Ce document est supposé devoir évoluer. La source unique sera les
.doc. Pour cette raison, et parce qu'il y a quand même une quinzaine de
fichiers sur le même modèle, je vais devoir automatiser au mieux le
transfert. En considérant le volume et la fréquence des modifications,
cette automatisation sera pragmatiquement partielle.

Coté Word, je simplifie au maximum, un simple export HTML. OpenOffice
sur ce coup est plutôt plus crade que Microsoft Office, peut-être bien
à cause du .dot, mais peu importe, j'utilise donc l'export "HTML
filtré".

Coté web, j'ai un .css ("inspiré" ou non du HTML exporté) et des pages
qui accueilleront les pages Word dans un div. Le HTML exporté comporte
justement un (un seul dans mon cas) div class=Section? juste sous le
body.

J'ai donc un gros travail de nettoyage refactoring modification à
faire. Passage en utf-8, renommage de styles, mise à jour des meta,
title, etc. dans head, et des trucs spécifiques comme le passage de
certains blocs vers un affichage type

J'ai commencé à tester des trucs en Python - BeautifulSoup, c'est
prometteur. Il faut que je vérifie si le nommage des styles par
Microsoft Word est robuste par rapport à l'utilisation effective de tel
ou tel style dans un document donné. Ensuite, je n'ai pas l'intention
de me prendre la tête pour gagner une passe, éviter une correction à la
mimine, ou rester en BeautifulSoup si un passage en pur Python me
simplifie la vie.

Bonne journée...

--
Pierre Maurette
Avatar
jacques77
"Pierre Maurette" a écrit dans le message de news:

Laurent vilday, le 15/05/2008 a écrit :

[...]

Ami ou pas, on ne travaille PAS avec Word. C'est un fait.



Bonjour,

L'idée ne me viendrais pas de maquetter avec Microsoft Word, mais je vous
trouve bien affirmatif. La problématique qui m'a amené à traîner ici n'est pas
tout à fait la même que celle de l'OP, mais je pense que mon besoin de passer
un .doc en HTML est justifié. J'explique pour info, sans poser à priori de
question, mais toute suggestion est bienvenue:
.........
Bonne journée...
Pierre Maurette



Bonsoir,

Pourquoi ne pas proposer vos document sous forme de liens pour les télécharger
en .pdf ?

Cordialement.
Jacques
1 2