Folgende Neuerungen / Änderungen sind in Q3 2024 enthalten:

  • CWB/CQPweb – Export verbessert: Dateien sind jetzt kleiner und lassen sich einfacher in CWB/CQPweb importieren.
  • CEC6-Daten werden jetzt schneller eingelesen.
  • GermaParlTEI: Neues Format zum Einlesen von Dateien von https://github.com/PolMine/GermaParlTEI/
  • CeRange – Betrifft nur das interne Handling. Zuvor wurden Fundstellen mit einem Index gespeichert. Dies wurde auf ein struct umgestellt. Damit lassen sich Position aber auch Bereiche Speichern (from/to).
  • Das Einlesen von einfache JSON-Dateien erlaubt jetzt auch JSON-Arrays (mehrere JSON-Dokumente pro Datei).
  • NXDTCS – New robust DateTime Cluster System – Eher für den internen Gebrauch, aber auch sinnvoll für die Verarbeitung von Korpora mit dem Terminal. Das neue Cluster-System, speziell für Zeitabschnitte erlaubt jetzt ein datentypunabhängige Clusterung.
  • Neuer Randomizer für Korpus-Publish. Jetzt möglich: Vertausche Sätze (bisher), Vertausche Worte (neu – gleiche Reihenfolge Worte), Vertausche Worte und Sätze in einem Dokument.
  • Sentiment-Detection – Im-/Export funktionierte unter bestimmten Umständen nicht (wenn Encoding geändert wurde).
  • Die Schnittstelle (API) für KorAP wurde überarbeitet.
  • Weitere kleinere Korrekturen und Update für 3rd-Party Libs.