Einleitung

Dieses Dokument ist die Anleitung für WordXML. WordXML ist Software zur Konvertierung von Microsoft Word Dokumenten nach XML, (X)HTML und TEXT. Die Ausgabe von WordXML kann jeder beliebigen DTD und jedem beliebigen Schema angepasst werden. Die Ergebnisse sind sowohl in der Struktur als auch im Layout umfassend konfigurierbar und lassen sich so leicht an jede Art von Vorgaben anpassen. Das Dokument beinhaltet umfassende Informationen zu Anwendung und Konfiguration. Diese Hilfe wurde selbst mit WordXML erstellt.


Einleitung

Mit WordXML können Word-Dokumente nach XML konvertiert werden. Die XML-Dateien werden über XSLT-Stylesheets transformiert; als Ausgabe stehen die Formate XML, HTML 1TEXT 2

Zur Betrachtung der Ergebnisse in den Formaten XML und HTML dient der ResultViewer.

Diese Funktionalität wird grundsätzlich auch von jedem modernen Browser unterstützt. Der ResultViewer selbst basiert auf dem Internet Explorer von Microsoft. Er stellt die zentrale Komponente des Viewers dar. Der ResultViewer ergänzt die Browserfunktionalität um viele nützliche Funktionen, insbesondere vereinfacht er solche Aufgaben, die mit der Konvertierung von Word-Dokumenten Hand in Hand gehen.

Mit Hilfe von WordXML können Inhalte in gewohnter MS Word Umgebung generiert und zu spezifischen XML-Dokumenten auf Basis einer zugehörigen DTD konvertiert werden. Die Inhalte werden über definierte Formatvorlagen strukturiert, und dadurch bei der Konvertierung den entsprechenden Elementen der XML-Definition zugeordnet. Das Layout der XML-Dokumente wird bei der späteren Publikation z.B. im Internet über XSLT- bzw. CSS-Stylesheets erzeugt, die den einzelnen XML-Elementen eine bestimmte Formatierung zuweisen. Dadurch wird eine konsequente Trennung des Inhalts und des Layouts erreicht, d.h. Inhalte werden in XML medienneutral gespeichert und können mit beliebigen Ausgabegeräten in unterschiedlichen Layouts publiziert oder weiterverarbeitet werden.

Hinweis: Bei der Strukturierung der Inhalte mit MS Word ist daher nur die Auszeichnung der Textstellen mit den entsprechenden Formatvorlagen ausschlaggebend für die Konvertierung. Layoutinformationen, die das Aussehen der Texte in MS Word beeinflussen (wie z.B. Fettdruck, Schriftarten, Schriftgrößen, etc.), haben keinen Einfluss auf die Konvertierung nach XML – entscheidend ist nur die Zuweisung von Formatvorlagen bei den entsprechenden Textstellen. Die Ansicht bzw. das Layout der Inhalte in MS Word stellt lediglich eine Strukturierungshilfe dar und entspricht nicht dem Layout bei der Publikation.

Schematische Darstellung der WordXML Funktionsweise

Abbildung 1 Schematische Darstellung der WordXML Funktionsweise


1 Die im Paket mitgelieferten Stylesheets zur Transformation nach HTML, insbesondere diejenigen, die zur Erzeugung der HTML-Hilfe verwendet werden, sind XHTML konform
2 Praktisch steht jedes beliebige, textbasierte Ausgabeformat zur Verfügung. Die Ausgabe ist einzig von dem dafür verwendeten Stylesheet ab. Über ein Stylesheet kann jederzeit ein eigenes Format spezifiziert werden.