Folgende Neuerungen / Änderungen sind in Q3 2024 enthalten:
- CWB/CQPweb – Export verbessert: Dateien sind jetzt kleiner und lassen sich einfacher in CWB/CQPweb importieren.
- CEC6-Daten werden jetzt schneller eingelesen.
- GermaParlTEI: Neues Format zum Einlesen von Dateien von https://github.com/PolMine/GermaParlTEI/
- CeRange – Betrifft nur das interne Handling. Zuvor wurden Fundstellen mit einem Index gespeichert. Dies wurde auf ein ’struct‘ umgestellt. Damit lassen sich Position, aber auch Bereiche Speichern (from/to).
- Das Einlesen von einfache JSON-Dateien erlaubt jetzt auch JSON-Arrays (mehrere JSON-Dokumente pro Datei).
- NXDTCS – New robust DateTime Cluster System – Eher für den internen Gebrauch, aber auch sinnvoll für die Verarbeitung von Korpora mit dem Terminal. Das neue Cluster-System, speziell für Zeitabschnitte, erlaubt jetzt ein Datentyp unabhängiges Clustering.
- Neuer Randomizer für Korpus-Publish. Jetzt möglich: Vertausche Sätze (bisher), Vertausche Worte (neu – gleiche Reihenfolge Worte), Vertausche Worte und Sätze in einem Dokument.
- Sentiment-Detection – Im-/Export funktionierte unter bestimmten Umständen nicht (wenn Encoding geändert wurde).
- Die Schnittstelle (API) für KorAP wurde überarbeitet.
- Weitere kleinere Korrekturen und Update für 3rd-Party Libs.