[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [gulliver] sxw et mode texte


From François Joulaud <francois dot joulaud at bzh dot net>
Subject Re: [gulliver] sxw et mode texte
Date Thu, 19 May 2005 01:42:18 +0200

François Joulaud a écrit :
> Est-ce que quelqu'un connaitrait un outil ou une technique pour extraire
> le texte d'un document sxw.

Bon, je me réponds à moi-même. J'ai un truc pas top mais qui permet au
moins d'afficher le minimum vital, c'est sûrement améliorable et ça
existe sans doute déjà quelque part en mieux (par exemple pour l'export
vers LaTeX il y a writer2latex [2] écrit en java).

Grâce à un document [1] et quelques petites infos sur XSL on a un truc
très moche mais lisible grâce à la feuille xslt ci-jointe et à la ligne
de commande :

unzip monfichier.sxw content.xml ;
xsltproc --novalid transfo_sx.xsl content.xml ;

(il faut avoir zip et xsltproc d'installés)

Si il y en a qui veulent améliorer avec leurs mimines vous pouvez aller
voir [3] et [4]

-
[1] <http://www.phpzoom.com/linfaq/single.htm#AEN1854>
[2] <http://www.hj-gym.dk/~hj/writer2latex/index.html>
[3] <http://xml.openoffice.org/xml_specification.pdf>
[4] <http://xml.openoffice.org/>

François.

PS: je ne sais pas si ça marche mais je viens de tomber sur ooo2txt
<http://ooo2txt.free.fr/>

Attachment: signature.asc
Description: OpenPGP digital signature