Sonntag, 10. Juli 2011

ePUB 3 – Eine kleine Übersicht

ePUB 3 ist keine einfache Weiterentwicklung des jetzt noch aktuellen ePUB 2-Standards. ePUB 3 ist eher eine kleine Revolution.
Wenn man sagt, dass ein ePUB eine gepackte Webseite ist, dann ist ePUB 2 eine mit sehr alter Technik, also XHTML und Teilen aus CSS 2.1 und ohne die Möglichkeiten von JavaScript. ePUB 3 hebt den Standard auf eine Stufe mit dem, was in der heutigen Webwelt passiert. Wir haben HTML5, weit mehr Möglichkeiten im CSS (auch wenn CSS3 nicht vollständig Teil des ePUB 3-Standards ist).
Ich habe versucht in dem Bild mit den vielen Kreisen den ePUB 3-Standard zu skizzieren. Das IDPF ist sich treu geblieben. ePUB ist weiterhin ein „best of breed“-Ansatz. Es werden bestehende, bewährte Standards zu einem neuen Standard zusammengeführt.

Zentraler Punkt des Wandels von ePUB 2 zu ePUB 3 ist die Ersetzung von XHTML durch HTML 5 (DTBook als DTD für die Textdaten im ePUB entfällt ganz).

HTML 5
Allseits bekannt und für viele in Hinblick auf enhanced E-Books die wichtigste Neuerung sind der audio- und der video-Tag, mit denen man jetzt einen Standard hat, entsprechende Daten einzubinden.
Ein weiteres bedeutendes Element von HTML 5 ist das canvas-Element. Dieses definiert eine Fläche, auf der mit Hilfe von JavaScript dynamische Bitmap-Grafiken gezeichnet werden können. Mit dieser Art, Animationen darzustellen, können proprietäre Technologien wie Flash im Web zum größten Teil ersetzt werden. Allerdings ist die Nutzung dieses Elements in ePUB-Dokumenten nicht unproblematisch. Die Dynamik lässt sich nicht auf allen Ausgabegeräten darstellen (kein Bewegtbild auf E-Ink-Geräten!) und es ist  ein Element, dass nur im Zusammenhang mit JavaScript Sinn macht.
Ein weiteres interessantes Element in HTML 5 ist das nav-Element. Nach Vorstellungen des IDPF soll es langfristig das NCX-Inhaltsverzeichnis ersetzen, das wir aus ePUB 2 kennen. NCX bleibt aber Teil des ePUB-Standards.
Interessant für einige E-Book-Anwendungen könnte auch die Geolocation-API des HTML 5-Standards sein. Die Nutzung setzt natürlich voraus, dass das E-Book-Lesegerät GPS oder eine ähnliche Technologie unterstützt.
Zusätzlich gibt es in HTML 5 auch neue Elemente, die eine bessere semantische Darstellung von Buchinhalten ermöglichen. Als Beispiel sei hier der aside-Tag genannt. Mit diesem lassen sich Nebenbemerkungen darstellen, die man mit Marginalien in einigen Büchern vergleichen könnte. Aber auch Inhalte aus Fußnoten könnten sich so darstellen lassen.
Als Teil des HTML 5-Standards wird auch MathML Einzug in den ePUB3-Standard erhalten. Der Vorteil hier ist, dass mathematische Ausdrücke als solche ausgezeichnet und von den Lesegeräten entsprechend dargestellt werden. Bisher konnten Formeln nur als Abbildungen in das Dokument eingebunden werden. Damit waren sie nicht durchsuchbar und nur sehr eingeschränkt skalierbar.
Es ist drauf zu achten, dass HTML 5 für ePUB nach den Regeln der XML-Syntax zu erfassen ist, während in der Browserversion Attribute wie z.B. autoplay ohne Attributwert sein können.

JavaScript
Schon erwähnt habe ich die Rolle von JavaScript für HTML-Features wie das canvas-Element. Aber auch viele andere Eigenschaften, wie die Nutzung von Popup-Fenstern u.Ä. sind ohne JavaScript nicht möglich.
JavaScript wird das ePUB-Format sehr weit öffnen und ePUBs vielfältiger machen. In der Textgestaltung können Textteile ausgeschaltet und eingeschaltet werden. Texte können in eigene Fenster gesetzt werden.
In der Funktionalität kann man echte Formulare bauen. E-Books bekommen so einen Rückkanal.
Wichtig ist zu erwähnen, dass JavaScript ein optionaler Bestandteil des ePUB 3-Standards ist. Das heißt, dass die Lesegeräte JavaScript nicht unterstützen müssen. Ich gehe aber davon aus, dass die wesentlichen Programme, die ePUB lesen JavaScript unterstützen werden.

CSS
Das IDPF sagt in seiner Spezifikation zu ePUB 3 ausdrücklich, dass das eingesetzte CSS auf dem CSS-Standard CSS 2.1 beruht. Aber auch das ist schon eine Verbesserung zu der aktuellen Situation, die den CSS 2-Standard nicht vollständig ins ePUB 2 übernommen hat.
Zusätzlich hat das IDPF auch einige Feature aus dem CSS 3-Standard übernommen. Dies sind z.B. CSS speech. Mit dieser Technologie kann, wenn diese auf den Geräten in entsprechender Qualität vorhanden ist, Text-to-speech-Technologie beeinflusst werden. Es gibt Einstellungen für voice family (männlich oder weiblich), voice volume (Lautstärke), Pausen vor oder nach Elemente u.Ä. Die Nutzung dieser Eigenschaften bedeuten ein ganz neues Betätigungsfeld für Autoren, Lektoren, etc. – nennen wir das neue Berufsbild einfach mal Text-to-speech-Dramaturg.
Abgesehen davon, dass mit allen Möglichkeiten aus CSS 2.1 und einigen Möglichkeiten aus CSS 3 ePUBs abwechslungsreicher und typografisch ansprechender gestaltet werden können, gibt den ePUB-Erstellern die Technologie der media-query sehr viele neue Möglichkeiten. Endlich kann die Gestaltung von ePUBs an Displayeigenschaften angepasst werden. Hier kann man bestimmte CSS-Eigenschaften an Displaygrößen, -farben, -auflösungen, -ausrichtung usw. anpassen. Das heißt zum Beispiel, dass bestimmte Inhalte für ein größeres Display wie das des iPad in der Potraitausrichtung mit einer Marginalspalte dargestellt sein können. Wenn man das iPad dann dreht und in iBooks die Doppelseitendarstellung erhält, werden diese, wie auch in der iPhone-Darstellung in Boxen in den Text integriert. Die Farben der Boxenhinterlegung werden für ein E-Ink-Gerät nicht automatisch in Grautöne verwandelt, die dann kaum noch unterscheidbar sind, sondern für die Darstellung auf diesen Geräten werden verschiedene Boxrahmen angewandt usw. Der Möglichkeiten gibt es dann viele. Das bedeutet natürlich auch größeren Aufwand oder weniger Einzeltitelgestaltung und dafür die Erstellung einer durchdachten CSS-Bibliothek für einen gesamten Verlag.

Metadaten
Metadaten können weiter wie bisher in der OPF-Datei des ePUBs angegeben werden. Allerdings gibt es in ePUB 3 auch die Möglichkeit die ONIX-Daten bzw. Metadaten in Adobe’s XMP-Format in den Container zu stellen und entsprechend darauf zu verweisen. Die Metadaten im ePUB selbst werden damit reicher. Es werden keine Metadaten über den ePUB-Container hinaus benötigt (denn Metadaten gehören nach meiner Überzeugung genauso zur Publikation, wie der eigentliche Content).

ePUB 3 bietet also sehr viele neue Möglichkeiten, die diesem Format dabei helfen werden, mehr darzustellen als die Umsetzung von gedruckten Inhalten auf unterschiedlichen Displays. Das ist natürlich eine technische Herausforderung. Weit größer ist aber aus meiner Sicht die Herausforderung für Verlage diese Möglichkeiten konzeptionell zu nutzen. Gerade als ich mir über die Möglichkeiten, einen Rückkanal im Buch zu nutzen, Gedanken gemacht habe, habe ich mich gefragt, was der Verlag mit den wertvollen Informationen, die die Leser ihm liefern, macht und wer damit umgehen wird …

2 Kommentare:

  1. Hallo,

    sehr interessante Informationen hier. Ich wollte nachfragen wie es bei epub in Zusammenhang mit DRM aussieht. Von apple und adobe gibt es hier einige Möglichkeiten. Wie schätzen Sie die derzeitige Situation ein?

    AntwortenLöschen
    Antworten
    1. Das Adobe DRM kann neben PDF-Dateien auch ePUB-Dateien verwalten und schützen.

      Löschen