Du-Plex: Duden-Produktionssystem
für lexikografische Inhalte

Gerrit Imsieke, Paul Markwart

transpect User Group 2025

Du-Plex: Duden-Produktionssystem
für lexikografische Inhalte

  • Redaktionssystem für Duden
  • 2025 von uns im Auftrag von Cornelsen entwickelt
  • Verwaltung, Import, Bearbeitung, Versionierung, Sortierung von Lexikon-Artikel-XML
  • IDML-Synthese oder automatisierter Umbruch mit xerif (jeweils nur A–Z-Teil)

Geplante Werke (Auswahl)

Kürzel Titel Artikel Quelle ET Satz
D1 Rechtschreibung 141.000 WN 2027 xerif
D2 Stilwörterbuch 11.000 WN 2026 xerif
D5 Fremdwörterbuch 52.000 WN 2027 xerif
D7 Herkunftswörterbuch 11.000 Du-Plex 2026 xerif
D8 Synonyme 20.000 WN 2028 xerif
D9 Zweifelsfälle 6.000 Du-Plex 2026 xerif
D10 Bedeutungswörterbuch 18.000 WN 2028 xerif
DDUW Universalwörterbuch 137.000 WN 2028 xerif
GSW Grundschulwörterbuch 11.000 WN 2028 InDesign

Du-Plex: Software-Komponenten

  • BaseX (XML-DB, XQuery-Prozessor): Suche, GUI etc.
  • XML Calabash (XProc-Prozessor): transpect-Pipelines
  • Saxon (XSLT-Prozessor): Transformationen in BaseX, transpect und Oxygen
  • Oxygen XML Editor: Redaktionswerkzeug
  • TeX Live 2025 (LuaTeX): PDF-Erzeugung mit CoCoTeX, dem xerif-Makropaket
  • DeltaXignia (XML-Diffing-Tool): Vergleichsfahnen
  • Gitlab (Versionierung)
  • Apache (Authentifizierung, WebDAV etc.)
  • Microsoft AAD (Einbindung Kunden-SSO per OIDC)
  • Docker (Container: apache, basex, deltaxml, gitlab, xerif)
  • Edge-Browser (HTML, Javascript, CSS)

Du-Plex: System-Schaubild

Du-Plex: Server

  • 3 identisch ausgestattete virtuelle Maschinen bei AWS: duplex-test, duplex-stage und duplex (-prod)
  • 64 GB RAM, 12 CPU-Kerne, 200 GB Plattenspeicher
    • basex-Container: max. 38 GB RAM
    • gitlab-Container: max. 11 GB RAM
    • xerif-Container: max. 9 GB RAM
    • deltaxml-Container: max. 6 GB RAM
  • Nächtliches Backup der prod-Daten in S3-Bucket

Du-Plex: Demo (1): Werk anlegen, importieren

  • Anmeldung (Single Sign On, bis auf WebDAV)
  • Werk anlegen: D10TEST3, Auflage 1, Workflow Du-Plex
  • Importe
    • WebDAV-Authentifizierungsmaske in Oxygen und Profilseite in Du-Plex
    • in autoimport hochladen und manuell importieren: D10TEST3-01.xml, übernehmen, D10TEST3-02.xml, übernehmen
    • jeweils PDF und evtl. Importbericht ansehen
    • Verweise von „aasen“ in der Detailansicht prüfen

Du-Plex: Demo (2): Editieren, Vorschau, Vergleichsfahne

  • Auflageneinrichtung → Manuskriphase
  • Verweise korrigieren bei aasen (→Aas, →Majonäse), Oxygen-Completion für art-rid anfordern
  • Vorschau anzeigen aus Oxygen
  • Bearbeitung beenden, Ende des Importvorgangs abwarten
  • Vergleichsfahne zwischen Erstimport und aktuellem Stand anfordern
  • Git-Historie des bearbeiteten Artikels ansehen

Du-Plex: Demo (3): Suche, Merklisten

  • in D2 Aufl. 3 z.B. suchen:
    • alle Artikel (blättern)
    • ^test.* (Regex)
    • test.* (Volltext)
    • tedtest (von–bis)
  • Merkliste erzeugen, bearbeiten, in Oxygen speichern (ohne „Bearbeitung beenden“)
  • HTML-Diff
  • Bearbeitung beenden
  • Überlappende Merkliste (z.B. Regex teil) anlegen
  • eine Merkliste zum Bearbeiten sperren und sehen, warum die andere nicht bearbeitet werden kann
  • Sperre brechen, Benachrichtigung ansehen

Du-Plex: Demo (4): BaseX-DBA, Performance-Monitoring

  • docker stats
  • DBA: Jobs, Datenbanken, Settings
  • Auslastungs-Ampel