xerif
neue Features

transpect user group, 15.11.2024

Überblick

  • Benutzerdefinierte Silbentrennmuster
  • PDF-Splitter
  • Textmuster und Textersetzung
  • Heuristiken für Language Tagging
  • Optimierung
  • TeXLive-Aktualisierung

Commits/Codezeilen (seit trug 2023)

ModulCommits1Codezeilen2 +/-
xerif340+1.085-237
docx2tex82+206-99
xmltex50+1.538-1.263
mml2tex25+38-20
cocotex3441+922-320
htmltabs19+450-87
Summe957+4.239-2.026

1 $ git rev-list --count --since="Nov 10 2023"
2 $ git diff --shortstat 3d93579b8a6418e59a546bdadffa3591e9c54e03 HEAD 3cocotex: nur src/

Silbentrennmuster

Beispiel (Englisch)

Silbentrennmuster

  • kaskadierend: hyph/hyph-en.txt
  • mehrsprachig: hyph-en.txt, hyph-de.txt, (…)
  • beeinflussen nur Trennungen im PDF

PDF-Splitter

  • setzt Gesamt-PDF voraus
  • Vorlage wird beim Schreiben des PDFs erstellt
  • Aufteilen anhand von Vorlage

Textmuster und
Textersetzung

  • Textmuster können nun auf den gleichen Textknoten angewendet werden
  • man kann optional den XML-Kontext angeben
  • die Reihenfolge lässt sich mit Prioritäten steuern

Heuristiken für Language Tagging

  • Umbau des Language Taggings mit neuer Textmuster-Funktion
  • Clean Mode um überflüssiges Sprach-Tagging zu entfernen

Optimierung Saxon PE

Saxon HE: 1m:46s

Saxon PE: 1m:36s (-10%)

xerif: Konvertierung von DOCX nach TeX

TeXLive-Aktualisierung

  • Update von TeXLive 2019 auf 2024
  • xerif profitiert von zahlreichen Verbesserungen
  • demnächst jährliche TeXLive-Aktualsierungen

TeXLive: Zeichensatz und Schriften

  • bessere OTF-Unterstützung
  • mehr Font-Befehle für Glyphen-Kurven
  • Untersützung für sehr lange Unicode-Adressen

Quelle: https://ctan.mc1.root.project-creative.net/macros/latex-dev/base/ltnews.pdf

TeXLive: Sprachen

  • Bidirektionaler Satz
  • Zeilenumbruch für Südostasiatische Sprachen und CJK
  • Nicht-Standard-Trennungen (z.B. bei Ligaturen)
  • Akzente für Kyrillisch

TeXLive: Grafiken

  • verbessertes Laden von Grafiken
  • Alternativ-Texte
  • Viewport-Einstellung für Nicht-EPS-Formate

one more thingie…

PrintCSS

  • PrintCSS-Parser: fertig
  • PrintCSS nach xml2tex-Config: in Entwicklung