Page 1 sur 1
conversion .doc en .html comment avoir du code propre..?
Publié : 11 mars 2006, 19:56
par cemoi
yep! Bon bé j'ai encore des documents en .doc moi... et quand je veux le mettre en html je vous dis pas la cata:
http://cemoi2005.free.fr/fiche%20de%20d ... ocess1.htm
je vous laisses voire le code source

(dois je pleurer ou rire?...)
En un mot j'ai du.doc et je veux le tranformer rapidement en .html convenable (j'ai plus de 500 fichiers donc les truc à la mano c'est mort car je veux pas y passer la vie

)
edit: es que openoffice fait du code aussi pouri que ça quand on transforme les fichiers en html?
Merci pour vos lumières.
Re: conversion .doc en .html comment avoir du code propre..?
Publié : 11 mars 2006, 20:48
par Kazé
cemoi a écrit :Bon bé j'ai encore des documents en .doc moi... et quand je veux le mettre en html je vous dis pas la cata:
Connais-tu HTML Tidy ? C'est un utilitaire en ligne de commande pour nettoyer le code HTML. Il y a une option "--clean" qui a été, à l'origine, conçue pour nettoyer le code HTML issu de Word2000. Ca devrait pouvoir t'aider.
http://tidy.sourceforge.net/
cemoi a écrit :En un mot j'ai du.doc et je veux le tranformer rapidement en .html convenable (j'ai plus de 500 fichiers donc les truc à la mano c'est mort car je veux pas y passer la vie

)
Un petit script pour lancer la conversion depuis Word ou OOo + un passage dans Tidy et ça devrait aller à peu près.
cemoi a écrit :es que openoffice fait du code aussi pouri que ça quand on transforme les fichiers en html?
OpenOffice.org fait un code HTML4 correct (rien à voir avec l'immondice pondue par M$ Word, évidemment). Il dispose également d'une fonction "exporter en XHTML" qui fait du code très propre (Java requis).
Publié : 11 mars 2006, 21:13
par calimo
Argh, tout des images sans texte alternatif
Effectivement, la version 2 d'OOo ouvre très bien tous les fichiers .doc de Word® donc il ne faut pas te gêner de l'utiliser

Publié : 11 mars 2006, 22:49
par cemoi
ok merci pour les conseils avisés

Heureusement que je suis passé sous Ooo mais malheureusement j'ai déja pas de mal de matos en format ms office et le pire c'est pour les feuilles de calcul exel.... C'est un boulot de taré parfois du jenre comme ici:
http://syl20.h.free.fr/BD_gene/index.htm
sur la feuille de calcul: "calcul des coef de pression/dépression globaux/locaux selon l'EC1."
C'est la vrai misére pour passer sous Ooo avec ce jenre d'application.... Et je ne parle meme pas d'espérer mettre une feuille de calcul de ce type en html ou xhtml....
A ce sujet qu'es que l'on peu faire comme calculs (complex ou non) en html? Es obligé de passer par du php pour faire des calculs complex? Dans dix ans quand je serai au point

je tenterai une feuille de calcul en ligne
Merci pour vos conseils.
Publié : 11 mars 2006, 23:20
par arno.
[quote="cemoi"
A ce sujet qu'es que l'on peu faire comme calculs (complex ou non) en html? Es obligé de passer par du php pour faire des calculs complex?
[/quote]
Si tu veux faire des calculs complexes côté client, il faut que tu utilises un langage de script type javascript. On ne peut pas faire de calculs avec uniquement du html.
Voila en gros les fonctions mathématiques natives de javascript :
http://fr.selfhtml.org/javascript/objets/math.htm
Publié : 12 mars 2006, 09:10
par calimo
arno. a écrit :Si tu veux faire des calculs complexes côté client
Et même des calculs simples comme 2+2
Le HTML n'est pas (et ne sera jamais) prévu pour faire quoi que ce soit de dynamique. Il ne fait que baliser du contenu existant pour lui donner un sens

Publié : 12 mars 2006, 18:31
par cemoi
mouai ok c'est obligatoire de ce taper le codage à la mano? Il n'existe pas un editeur plus ou moins orienté pour faire des feuilles de calculs? Si je transforme une feuille de calcul de Ooo en html il me met pas les formules corectement...

dommage!
Publié : 12 mars 2006, 19:06
par calimo
Rien ne t'empêche de proposer la feuille de calcul ODS elle-même : après tout c'est un standard ouvert

Conversion .doc to .html
Publié : 31 mars 2006, 16:45
par Aurelien
Bonjour a tous
vous m'avez un peu éclairer sur le sujet mais suis je obligé de passer par une conversion du .doc en .sxw pour transformer ensuite mon fichier en .html ?.
Actuellment je bosse avec writer2latex et il ne me prend pas le format .doc en entrée par contre la conversion s'effectue correctement si je lui donne du .sxw
Enfin bref je cherche la solution la moins couteuse en temps de developpement et je n'ai pas envie d'installer open office sur mon serveur quelqu'un a t-il un solution ?
un pti soft ou du code
merci d'avance
Message envoyé avec : Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)
Re: Conversion .doc to .html
Publié : 31 mars 2006, 16:59
par arno. sans ses cookies
catdoc peut-être ?
catdoc behaves much like cat(1) but it reads MS-Word file and produces
human-readable text on standard output. Optionally it can use latex(1)
escape sequences for characters which have special meaning for LaTeX.
It also makes some effort to recognize MS-Word tables, although it
never tries to write correct headers for LaTeX tabular environment.
Additional output formats, such is HTML can be easily defined.
Message envoyé avec : Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.0.1) Gecko/20060315 Debian/1.5.dfsg+1.5.0.1-3bpo1 Firefox/1.5.0.1