Folgende Neuerungen / Änderungen sind in Q3 2024 enthalten:

    • CWB/CQPweb – Export verbessert: Dateien sind jetzt kleiner und lassen sich einfacher in CWB/CQPweb importieren.
    • CEC6-Daten werden jetzt schneller eingelesen.
    • GermaParlTEI: Neues Format zum Einlesen von Dateien von https://github.com/PolMine/GermaParlTEI/
    • CeRange – Betrifft nur das interne Handling. Zuvor wurden Fundstellen mit einem Index gespeichert. Dies wurde auf ein ’struct‘ umgestellt. Damit lassen sich Position, aber auch Bereiche Speichern (from/to).
    • Das Einlesen von einfache JSON-Dateien erlaubt jetzt auch JSON-Arrays (mehrere JSON-Dokumente pro Datei).
    • NXDTCS – New robust DateTime Cluster System – Eher für den internen Gebrauch, aber auch sinnvoll für die Verarbeitung von Korpora mit dem Terminal. Das neue Cluster-System, speziell für Zeitabschnitte, erlaubt jetzt ein Datentyp unabhängiges Clustering.
    • Neuer Randomizer für Korpus-Publish. Jetzt möglich: Vertausche Sätze (bisher), Vertausche Worte (neu – gleiche Reihenfolge Worte), Vertausche Worte und Sätze in einem Dokument.
    • Sentiment-Detection – Im-/Export funktionierte unter bestimmten Umständen nicht (wenn Encoding geändert wurde).
    • Die Schnittstelle (API) für KorAP wurde überarbeitet.
    • Weitere kleinere Korrekturen und Update für 3rd-Party Libs.