OOXML ist (kein) ISO Standard – Was ist das Problem ?

Bei Dokumenten kann man aus zwei Formatstandards wählen:

Der eine, OpenDocumentFormat („ODF“, genormt als ISO/IEC 26300) ist ein sog. „Offener Standard“: herstellerneutral, rechtlich und technisch offen zugänglich und öffentlich erarbeitet. ODF ist über mehrere Jahre und Versionen abwärtskompatibel und wird von vielen Office-Programmen unterstützt.

Der andere, Office Open XML („OOXML“, genormt als ISO/IEC 29500) wurde von einem Hersteller (Microsoft) entwickelt, ist nicht vollständig offen im o.g. Sinne und wurde insgesamt in drei Varianten spezifiziert: „ECMA“ (nach der Standardisierungsorganisation, die diese Version akzeptierte; ISO lehnte sie wegen Intransparenz ab), „Transitional“ und „Strict“. Diese drei Varianten von OOXML sind untereinander nicht kompatibel!

 

Der Hersteller hat zwar ECMA und Transitional als obsolet und Strict als aktuelle Version benannt, aber natürlich besitzen alle Verwaltungen, die seit 2007 MS-Office Produkte einsetzen, Dokumente in verschiedenen MS-Office Versionen.

Das Problem: „Strict“ ist nicht abwärtskompatibel, ältere Versionen von MS-Office können es weder lesen noch schreiben. Das wird auch nichts mehr, denn MS-Office 2007 ist nicht mehr erhältlich und wird auch nicht mehr vom Hersteller unterstützt. Seit damals enden alle MS-Office-Dateien mit dem berühmten „x“ – docx/xlsx/pptx. Der Anwender kann an der Endung also nicht ablesen, welche Formatversion er tatsächlich verwendet, was die Inkompatibilität so gefährlich macht. Als Richtschnur gilt:

  • Office 2007 liest und schreibt in „ECMA“
  • Office 2010 und neuer schreiben „Transitional“
  • Office 2013 liest und schreibt – nicht „Strict“, jedenfalls nicht gemäß ISO/IEC 29500


Michael Meeks, einer der Kernentwickler der Open Source Office-Suite „LibreOffice„, ist davon überzeugt, dass niemand ISO OOXML Strict in der freien Wildbahn verwendet: „Wenn eine Firma oder Verwaltung verschiedene Versionen von MS Office einsetzt, incl. Office 2007 oder 2010, dann erfüllen Dokumente, die von mehreren Leuten ausgetauscht wurden, die strikte Variante von OOXML, wie in ISO/IEC 29500 vorgeschrieben, nicht.“

Dieses Zitat und alle weiteren stammen aus einem ausführlichen, technisch tief gehenden Artikel von Markus Feilner, stellv. Chefredakteur des deutschen Linux-Magazins, der im Juni 2014 für das EU-Portal Joinup, den Zoo an OOXML-Varianten analysierte und mit Experten wie Michael Meeks und anderen sprach. Mit anderen Worten: Es gibt zwar einen von der ISO genormten Dokumentenstandard, der OOXML Strict heißt, aber es existiert keine Software, die dieses Format strikt nach Vorgaben verarbeiten kann – auch nicht vom Hersteller selbst.

 

Diese Inkonsistenzen führen zu vielfältigsten Problemen, u.a. Verlust an Metadaten, Fehlern in Grafiken und eingebetteten Objekten, proprietären Komponenten in einem „offenen“ Standards, usw. Es ist in der Tat so komplex, dass Open Source Projekte mit enormen Schwierigkeiten zu kämpfen haben, um Filter zu schreiben, die alle Versionen von MS-Office-Dokumenten verarbeiten können.

Die schlichte Nichtexistenz einer MS-Office Version, die alle Formatvarianten lesen und schreiben kann, spricht Bände.

Björn Lundell, der als Informatikprofessor an der Universität Skövde (Schweden) zu Kompatibilität und Standards bei Office-Programmen forscht, sagt:

„Wenn ein Anwender eine Datei in Office 2007 erstellt und in Transitional docx speichert, sollten andere sie in Office 2013 öffnen können und in Strict docx erneut abspeichern, bevor sie schließlich in Office 2010 geöffnet wird. Sie würden sich wundern, was tatsächlich dabei herauskommt.“

Wie konnte das passieren?

Als klar wurde, dass ein Dokumentenformat, welches nicht aus dem eigenen Haus kam – das offen spezifizierte ODF – Ende 2006 die Zertifizierung als ISO-Standard erhalten würde, musste Microsoft handeln, denn vorhandene ISO-Standards werden häufig als Kriterium bei öffentlichen Ausschreibungen verlangt.

Man sah sich der Gefahr gegenüber, mit einem nicht-ISO-zertifizierten Produkt in dem riesigen Geschäftsbereich Public Sector ins Hintertreffen zu geraten. In sehr kurzer Zeit entwickelte der Hersteller also XML-Versionen seiner proprietären Dokumentenformate und ließ sie von der gleichnamigen Organisation als ECMA-Standard durchwinken. Dieselbe Version wurde jedoch von der ISO abgelehnt: Es seien zuviele nicht nachvollziehbare, proprietäre Elemente darin, die zudem häufig direkte Abhängigkeiten zu einzelnen MS-Office-Produkten darstellten. Die ISO-Arbeitsgruppe kam zum Schluß, dass niemand außer dem Hersteller selbst den Standard implementieren können würde – was genau nicht die Idee eines Standards ist.

 

Nach einem umstrittenen Prozess wurde OOXML Strict von ISO als beabsichtigter Standard definiert. Ohne diesen Kompromiss wäre der Standardisierungsprozess bereits dann zu einem Halt gekommen. ISO erlaubte in einem außergewöhnlichen Schritt sogar eine Variante, wodurch der ISO/IEC 29500 Standard schließlich aus zwei Varianten bestand: ISO/IEC 29500 Strict and Transitional. Transitional für den ÜBergang, um später Strict als beabsichtigten Standard zu erhalten. Um allein die Unterschiede zwischen beiden Varianten zu beschreiben waren 1500 Seiten technische Dokumentation notwendig, doppelt so viele wie die komplette ODF-Spezifikation benötigt. Dieser Prozess war sehr umstritten, weil es weltweit aus den nationalen Standardisierungsgremien immer wieder Meldungen von Einflussnahmen des Herstellers auf die ISO Gremien und den Prozess gab. Die englische Wikipedia hat einen eigenen Artikel dazu.

Weiterlesen >> https://netzpolitik.org/