xerif
neue Features
transpect user group, 15.11.2024
Überblick
- Benutzerdefinierte Silbentrennmuster
- PDF-Splitter
- Textmuster und Textersetzung
- Heuristiken für Language Tagging
- Optimierung
- TeXLive-Aktualisierung
Commits/Codezeilen (seit trug 2023)
| Modul | Commits1 | Codezeilen2 +/- | |
| xerif | 340 | +1.085 | -237 |
| docx2tex | 82 | +206 | -99 |
| xmltex | 50 | +1.538 | -1.263 |
| mml2tex | 25 | +38 | -20 |
| cocotex3 | 441 | +922 | -320 |
| htmltabs | 19 | +450 | -87 |
| Summe | 957 | +4.239 | -2.026 |
1 $ git rev-list --count --since="Nov 10 2023"
2 $ git diff --shortstat 3d93579b8a6418e59a546bdadffa3591e9c54e03 HEAD
3cocotex: nur src/
Silbentrennmuster
- kaskadierend:
hyph/hyph-en.txt
- mehrsprachig:
hyph-en.txt, hyph-de.txt, (…)
- beeinflussen nur Trennungen im PDF
PDF-Splitter
- setzt Gesamt-PDF voraus
- Vorlage wird beim Schreiben des PDFs erstellt
- Aufteilen anhand von Vorlage
Textmuster und
Textersetzung
- Textmuster können nun auf den gleichen Textknoten angewendet werden
- man kann optional den XML-Kontext angeben
- die Reihenfolge lässt sich mit Prioritäten steuern
Heuristiken für Language Tagging
- Umbau des Language Taggings mit neuer Textmuster-Funktion
- Clean Mode um überflüssiges Sprach-Tagging zu entfernen
Optimierung Saxon PE
Saxon HE: 1m:46s
Saxon PE: 1m:36s (-10%)
xerif: Konvertierung von DOCX nach TeX
TeXLive-Aktualisierung
- Update von TeXLive 2019 auf 2024
- xerif profitiert von zahlreichen Verbesserungen
- demnächst jährliche TeXLive-Aktualsierungen
TeXLive: Sprachen
- Bidirektionaler Satz
- Zeilenumbruch für Südostasiatische Sprachen und CJK
- Nicht-Standard-Trennungen (z.B. bei Ligaturen)
- Akzente für Kyrillisch
TeXLive: Grafiken
- verbessertes Laden von Grafiken
- Alternativ-Texte
- Viewport-Einstellung für Nicht-EPS-Formate
PrintCSS
- PrintCSS-Parser: fertig
- PrintCSS nach xml2tex-Config: in Entwicklung