Längeres Shelf Life
mit repub

Quelle: Archivberatung Hessen

Quelle: Papierdirekt Blog

Wie altersbeständig sind E-Books?

  • Veraltete Daten: HTML, CSS und Metadaten
  • Geräte, Standards und Prüftools entwickeln sich weiter
  • neue Anforderungen: Barrierefreiheit, TDMRep

kurz zusammengefasst

repub konvertiert (und repariert) EPUB 2/3 nach EPUB 3.3

Was bisher geschah


  • Beginn der Entwicklung,
    GGP Media

  • Penguin Random House

  • Aufbau, Suhrkamp

Wie funktioniert repub?

Was macht repub
(und was nicht)?

HTML-Seitengrenzen erhalten

<div class="epub-html-split" id="idb9783518743362_000309xhtml"/>
<h1 id="h1-5" class="h2" 
    xml:base="OEBPS/b9783518743362_000309.xhtml">
  <b>Vorwort<br/>zur erweiterten Ausgabe</b>
</h1>
<!-- (…) -->
<div class="epub-html-split" id="idb9783518743362_000335xhtml"/>
<h1 id="h1-6"
    xml:base="OEBPS/b9783518743362_000335.xhtml">
  <b>Aus den Sterntagebüchern<br/>Ijon Tichys</b>
</h1>
<!-- (…) -->

Patchen von Verweisen
und Dateireferenzen

  • leere Links entfernen
  • Dateipfade aktualisieren
  • Entfernen von proprietären Dateien (z.B. XPGT)

Fehlende Hauptsprache

Inhalt:

<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
  <!-- (…) -->
</html>

Hauptsprache ermitteln

Metadaten (OPF):

<?xml version="1.0" encoding="UTF-8"?>
<package xmlns:dc="http://purl.org/dc/elements/1.1/" 
  xmlns="http://www.idpf.org/2007/opf" 
  version="2.0"
  unique-identifier="PackageID">
  <metadata>
    <dc:title>Sterntagebücher</dc:title>
    <dc:language>de</dc:language>
    <dc:identifier id="PackageID">9783518743362</dc:identifier>
  </metadata>
</package>

Inhalt:

<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" lang="de">
  <!-- (…) -->
</html>

Veraltetes HTML-und CSS-Markup

<p>This text is set in 
  <font face="Arial" size="1" color="green">
    Arial, 1.125em and green.
  </font>
</p>

<font size>

size px em
1 10 0.625
2 13 0.8125
3 16 1
4 18 1.125
5 24 1.333
6 32 2
7 48 3

Veraltetes HTML-und CSS-Markup

<p>This text is set in 
  <span style="font-family:Arial; font-size:1.125em; color:green">
    Arial, 1.125em and green.
  </span>
</p>

Veraltete HTML-Elemente

TagErsatz
<s>
<strike>
<span style="text-decoration: line-through;">
<acronym><abbr>
<big><span style="font-size: larger;">
<center><span style="text-align: center;">
<u><span style="text-decoration: underline;">
<tt><span style="font-family: monospace;">
<strike><span style="text-decoration: line-through;">
<dir>
<frame>
<frameset>
<noframes>
<span>

Veraltete HTML-Attribute

TagErsatz ("$" für Attributwert)
@border@style="border $px solid #000;"
@longdesc@alt
font/@face@style="font-family:$"
font/@size@style="font-size:$"
font/@color@style="color:$"
@align
@alink
@background
@char
@charoff
@charset
@clear
@coords
@frame
@frameborder
@hspace
@link
@marginheight
@marginwidth
@noshade
@rev
@scrolling
@shape
hr/@size
@table/@rules
@text
@type
@valign
@version
@vlink
@vspace
@width
entfällt

epub:type-Attribute ohne ARIA-Pendant

<section epub:type="chapter">
  <h2 epub:type="chapter">Vierundzwanzigste Reise</h2>
  <!-- (…) -->
<section/>

epub:type-Attribute ohne ARIA-Pendant

<section epub:type="chapter" role="doc-chapter">
  <h2>Vierundzwanzigste Reise</h2>
  <!-- (…) -->
<section/>

EPUB-3.0-konforme Navigation

  • NCX dient als Quelle
  • toc nav
  • landmarks (Konfiguration)
  • page list

Fehlende Alternativtexte

  1. Erzeugung der Alt-DOCX
  2. Einlesen der ausgefüllten Alt-DOCX und
    EPUB-Erzeugung

Fehlende Accessibility-Metadaten

<metadata>
  <!-- (…) -->
  <meta property="schema:accessMode">textual</meta>
  <meta meta property="schema:accessMode">visual</meta>
  <meta meta property="schema:accessibilityHazard">none</meta>
  <meta property="schema:accessModeSufficient">textual</meta>
  <meta property="schema:accessibilityFeature">displayTransformability</meta>
  <meta property="schema:accessibilityFeature">alternativeText</meta>
<metadata/>

Kundenspezifische Konfiguration

  • HTML- und CSS-Markup
  • OPF-Metadaten (z.B. TDMRep, Print-ISBN)
  • Container: Namenskonventionen und Ordnerstruktur

Was macht repub nicht?

  • Anpassungen der Überschriftenhierarchie
  • Reihenfolge des Inhaltsverzeichnis an Inhalt anpassen
  • „intelligente“ Erkennung von Anzeigen, Plain ToCs etc.
  • dass das „E-Book wie das PDF aussieht“

Vielen Dank für
Ihre Aufmerksamkeit!