OASIS Open Document Format for Office Applications (Kurzform: OpenDocument, ODF) bezeichnet die offenen Austauschformate für Dateien von Office-Programmen, welche durch die Organisation OASIS spezifiziert wurden und inzwischen als internationale Norm ISO/IEC 26300 veröffentlicht worden sind. [1] [2]
Inhaltsverzeichnis |
Um ein standardisiertes Dateiformat – vor allem für Textverarbeitungen – zu etablieren, wurde bei OASIS eine Arbeitsgruppe gebildet, die das Dateiformat von OpenOffice.org als Basis für den neuen Standard auswählte. Das OpenDocument-Format wurde im Mai 2005 veröffentlicht.
Eine OpenDocument-Datei ist entweder eine einzelne XML-Datei oder eine Sammlung verschiedener XML-Dateien und anderer Objekte (z. B. eingebundene Bilder), die zu einer komprimierten Datei zum Beispiel im ZIP zusammengefasst werden, um Speicherplatz zu sparen. Durch das XML-Format können selbst mit einem einfachen Texteditor Veränderungen am Dokument durchgeführt werden, nachdem die Datei entpackt wurde.
Die Europäische Kommission empfahl 2004 im Rahmen ihres IDA-Programms (Interchange of Data between Administrations) [3], unter anderem OASIS OpenDocument einer offiziellen internationalen Standardisierungsbehörde wie etwa der ISO vorzulegen[4]. Das offene Dateiformat ist ein einheitliches, kompatibles Dokumentenformat. Durch die Einführung würde die EU unabhängig von einzelnen Anbietern. Damit wäre der Zugriff auf Altdaten auf lange Zeit gesichert. Dies ist unter anderem relevant für die revisionssichere gesetzeskonforme Langzeitablage von Dokumenten. Außerdem soll durch den offenen Standard mehr Wettbewerb ermöglicht werden.
Eine offizielle Empfehlung für ein bestimmtes Format wurde jedoch seitens der Kommission nicht ausgesprochen.
Im Rahmen des Belgian Government Interoperability Framework (BELGIF) strebt die belgische Regierung den ausschließlichen Einsatz von offenen Formaten und Standards im externen Datenaustausch an[5].
Für den Austausch von Office-Dokumenten wurde OpenDocument vorgeschlagen[6] und ab September 2007 muss im Rahmen eines Pilotbetriebes jede Bundesbehörde OpenDocument-Formate unterstützen. Falls diese Erprobungsphase positiv abgeschlossen wird, soll ODF ab September 2008 das Standardformat werden.
Allerdings hält sich die belgische Regierung die Möglichkeit einer Erweiterung der Liste der zugelassenen Dateiformate um konkurrierende Standards offen[7].
Gemäß dem Enterprise Technical Reference Model (ETRM) Version 3.5 (PDF) des Commonwealth of Massachusetts (veröffentlicht: 2005-09-21) müssen alle offiziellen Akten des Commonwealths in einem offenen Dateiformat verfasst und gespeichert werden. Der Commonwealth definiert offene Dateiformate als Formate, die auf einem offenen Standard basieren, gemeinschaftlich entwickelt wurden, von einer Normungsorganisation verwaltet werden, vollständig dokumentiert und öffentlich einsehbar sind.[8]
Das ETRM 3.5 erlaubt folgende Dateiformate: OpenDocument, Plain Text, HTML und PDF, wobei ab 2007 alle Office-Dateien standardmäßig im OpenDocument-Format gespeichert werden müssen[9]. Der genaue Termin der Umstellung wurde aber noch nicht festgelegt[10].
In einem Interview meinte Staatssekretär Thomas Trimarco allerdings, dass auch Office Open XML den Vorgaben entsprechen und somit zum Einsatz gelangen könnte.[11]
Am 1. November 2005 veröffentlichte die BECTA (British Educational Communications and Technology Agency) eine technische Spezifikation in der neben einigen anderen Dateiformaten die Verwendung von OpenDocument für Office-Dateien empfohlen wird.[12]
Ein am 10. April 2006 veröffentlichter Bericht, der von der französischen Regierung in Auftrag gegeben wurde, schlägt vor, auf europäischer Ebene ODF als Dokumentaustauschformat zu verwenden. Darüber hinaus schlägt der Bericht eine gesetzliche Regelung vor, die die französische Verwaltung zur Verwendung von OpenDocument verpflichten soll.[13]
Seit Anfang März 2006 existiert die Open Document Format Alliance zur Unterstützung des OpenDocument-Formates. Ziel der Allianz ist es, Entscheidern eine Unterstützung und Lobby für das ODF zu geben.
Im Rahmen der internationalen Standardisierung ist das OpenDocument Format unter der Nummer ISO/IEC DIS 26300 Open Document Format for Office Applications (OpenDocument) v1.0 standardisiert.[14]
Die Speicherung der Dokumentinhalte erfolgt in dem Java-Archive-Format. Es handelt sich dabei um eine ZIP-Datei mit speziellen Einträgen in diesem Archiv. Die Dateiendung eines Java-Archivs ist .jar, jedoch werden für OpenDocument-Dateien die Dateiendungen .odt für Texte, .ods für Tabellen, .odp für Präsentationen und .odg für Zeichnungen verwendet.
Damit sich der Dateityp auch unabhängig von der Dateiendung und ohne Dekomprimierungsprogramm (siehe Datenkompression) ermitteln lässt, ist der erste Archiv-Eintrag der MIME-Typ des Dateiinhaltes im Klartext und unkomprimiert.
Grundsätzlich enthält jede OpenDocument-Datei in dem Archiv den Ordner meta-inf mit der Datei manifest.xml. Die manifest.xml listet alle weiteren Dateien in der OpenDocument-Datei mit den MIME-Typen auf. Alle weiteren Dateien in der OpenDocument-Datei sind üblicherweise komprimierte XML-Dateien, die eine Dokumentstruktur, den Dokumentinhalt, die Dokumentstile und Dokumenteinstellungen beschreiben. Des Weiteren werden Multimediadateien, wie zum Beispiel Bilder, Filme und Musikdateien mit ihrem Binärformat, gegebenenfalls komprimiert, in der OpenDocument-Datei gespeichert.
Folgendes Beispiel zeigt die Struktur einer OpenDocument-Textdatei:
mimetype Pictures\10000000000001E800000118B5A37F3F.png layout-cache content.xml styles.xml meta.xml Thumbnails\thumbnail.png settings.xml meta-inf\manifest.xml
Dabei sind die Dateien mimetype und meta.xml immer unkomprimiert, alle anderen Dateien können komprimiert sein. Im Ordner Pictures befindet sich, in diesem Beispiel, ein Bild im PNG-Format. Die Datei layout-cache ist eine proprietäre Datei einer Textverarbeitung, um das Textdokument schnell darstellen zu können. Fremdprogramme können diese Datei ignorieren, die Daten in dieser Datei sind redundant. Die Datei content.xml enthält in diesem Fall die Textinhalte des Dokumentes. In styles.xml sind alle verwendeten Dokumentformate gespeichert. Die Datei meta.xml beschreibt eine Übersicht der Datei. Zum Beispiel, wie viele Seiten das Dokument enthält, wer der Autor ist und wann es angelegt und geändert wurde. Die Datei thumbnail.png im Ordner Thumbnails zeigt ein kleines Dokumentabbild der ersten Seite des Dokumentes. Dieses Abbild kann von einem Dateibetrachter als Vorschaubildchen verwendet werden. Die dokumentspezifischen Einstellungen finden sich in der settings.xml. Üblicherweise finden sich dort die Druckeinstellungen. Wie schon beschrieben, listet die manifest.xml alle Dateien in diesem Archivformat nochmals auf.
In der mimetype-Datei steht der Typ der Datei (siehe Abschnitt Dateiendungen und MIME-Typ). In diesem Beispiel application/vnd.oasis.opendocument.text.
Die manifest.xml hat in diesem Beispiel folgenden Inhalt:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE manifest:manifest PUBLIC "-//OpenOffice.org//DTD Manifest 1.0//EN" "Manifest.dtd"> <manifest:manifest xmlns:manifest="urn:oasis:names:tc:opendocument:xmlns:manifest:1.0"> <manifest:file-entry manifest:media-type="application/vnd.oasis.opendocument.text" manifest:full-path="/"/> <manifest:file-entry manifest:media-type="application/vnd.sun.xml.ui.configuration" manifest:full-path="Configurations2/"/> <manifest:file-entry manifest:media-type="image/png" manifest:full-path="Pictures/10000000000001E800000118B5A37F3F.png"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Pictures/"/> <manifest:file-entry manifest:media-type="application/binary" manifest:full-path="layout-cache"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="content.xml"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="styles.xml"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="meta.xml"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/thumbnail.png"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="settings.xml"/> </manifest:manifest>
An dem Beispiel der meta.xml Datei kann man sehen, welche Übersichtsinformationen in der OpenDocument-Datei gespeichert werden. Da auch diese Datei unkomprimiert ist, können Dateibetrachter ohne dekomprimieren zu müssen, die Informationen als Eigenschaften zum Dokument darstellen, ohne die komplette Datei lesen oder verstehen zu müssen. Sie folgen teilweise dem Metadaten-Schema Dublin Core (Elemente im Namensraum dc).
<?xml version="1.0" encoding="UTF-8"?> <office:document-meta xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xlink="http://www.w3.org/1999/xlink"> <office:meta> <meta:generator>OpenOffice.org/1.9.118$Win32 OpenOffice.org_project/680m118$Build-8936</meta:generator> <meta:initial-creator>Vorname Nachname</meta:initial-creator> <meta:creation-date>2005-09-27T16:53:48</meta:creation-date> <dc:creator>Vorname Nachname</dc:creator> <dc:date>2005-09-29T18:12:57</dc:date> <meta:printed-by>Vorname Nachname</meta:printed-by> <meta:print-date>2005-09-29T17:57:42</meta:print-date> <dc:language>de-DE</dc:language> <meta:editing-cycles>11</meta:editing-cycles> <meta:editing-duration>PT6H11M44S</meta:editing-duration> <meta:user-defined meta:name="Info 1"/> <meta:user-defined meta:name="Info 2"/> <meta:user-defined meta:name="Info 3"/> <meta:user-defined meta:name="Info 4"/> <meta:document-statistic meta:table-count="0" meta:image-count="4" meta:object-count="0" meta:page-count="5" meta:paragraph-count="92" meta:word-count="1460" meta:character-count="10405"/> </office:meta> </office:document-meta>
Das folgende Bild zeigt die Miniaturansicht der ersten Seite des Beispieldokumentes.
Folgende Tabelle zeigt einige verwendete Dateiendungen für die unterschiedlichen OpenDocument-Dateien.
| Dateiformat | Dateiendung | MIME-Typ |
|---|---|---|
| Dokumente | ||
| OpenDocument-Text | .odt | application/vnd.oasis.opendocument.text |
| OpenDocument-Tabellendokument | .ods | application/vnd.oasis.opendocument.spreadsheet |
| OpenDocument-Präsentation | .odp | application/vnd.oasis.opendocument.presentation |
| OpenDocument-Zeichnung | .odg | application/vnd.oasis.opendocument.graphics |
| OpenDocument-Diagramm | .odc | application/vnd.oasis.opendocument.chart |
| OpenDocument-Formel | .odf | application/vnd.oasis.opendocument.formula |
| OpenDocument-Bild | .odi | application/vnd.oasis.opendocument.image |
| OpenDocument-Globaldokument | .odm | application/vnd.oasis.opendocument.text-master |
| Vorlagen | ||
| OpenDocument-Textvorlage | .ott | application/vnd.oasis.opendocument.text-template |
| OpenDocument-Tabellenvorlage | .ots | application/vnd.oasis.opendocument.spreadsheet-template |
| OpenDocument-Präsentationsvorlage | .otp | application/vnd.oasis.opendocument.presentation-template |
| OpenDocument-Zeichnungsvorlage | .otg | application/vnd.oasis.opendocument.graphics-template |
Weitere Dateiendungen werden in dem OASIS-Standard (Seite 697 f.) [15] aufgelistet.
OpenOffice.org verwendet ein XML-basiertes Dateiformat (Dateiendung: .odb) zur Speicherung von HSQL-Datenbanken bzw. von Definitionen, wie und wo die Daten zu finden sind.
Dieser Dateityp ist nicht Bestandteil der OpenDocument-Spezifikation Version 1.0 (ISO/IEC 26300) und auch in der neuen Version 1.1 der Spezifikation ist er nicht enthalten.[16]
Mit OpenRaster existiert ein Projekt, welches sich zum Ziel gesetzt hat, den OpenDocument-Standard um ein Dateiformat zum Austausch von Rastergrafiken zu erweitern, welches alle benötigten Elemente moderner Bildbearbeitungsprogramme beinhalten soll. Die Entwickler des Bildbearbeitungsprogramms Krita planen die Unterstützung von OpenRaster bereits für die kommende Version von KOffice.[17]
Office Open XML (durch Ecma International standardisiertes Konkurrenzformat der Firma Microsoft)