CorpusExplorer – Releasenotes Q4 / 2025

Wichtige Neuerungen

Überarbeitete Zeitverlaufs-Analysen

Die Analyse über Zeitverläufe wurde grundlegend überarbeitet und flexibler gestaltet:

  • Datentyp unabhängige Zeitangaben: Es ist nun nicht mehr erforderlich, dass Zeitangaben explizit als Datumstyp vorliegen. Ob String, Ganzzahl oder Datum – entscheidend ist nur, dass die Angabe auf ein interpretierbares Datum (z. B. Jahreszahl oder konkretes Datum) verweist.

  • Wegfall der automatischen Clusterung: Statt einer Cluster-basierten Unterteilung werden nun alle Zeitpunkte im Datensatz direkt auf dem Zeitstrahl ausgegeben.

  • Neue Cluster-Optionen: Über die Einstellung „Cluster“ kann die Ausgabe bei Bedarf in verschiedene Zeitauflösungen zusammengefasst werden:

    • tageweise

    • monatsweise

    • quartalsweise

    • jahresweise

    • jahrzehntweise

    ⚠️ Hinweis: Bei Korpora mit vielen Dokumenten kann eine tageweise Darstellung zu langen Berechnungszeiten führen (viele Tage = viele Datenpunkt => lange Berechnung). In solchen Fällen empfiehlt sich die Einstellung „Jahr“ (reduziert die Anzahl der Datenpunkte um den Faktor 365).


Verbesserungen

  • I5-XML-Verarbeitung: Verbesserte Stabilität und höhere Kompatibilität beim Einlesen und Verarbeiten von I5-XML-Daten.

  • CorpusMerger-Erweiterung für Entwickler*innen:
    Der CorpusMerger unterstützt nun Transformationen während des Merge-Prozesses (on-the-fly).
    Aktuell verfügbar:

    • Umwandlung des gesamten Textes in lower-case.
      Weitere Normalisierungen folgen in kommenden Versionen.


️ Fehlerbehebungen

  • Diverse kleinere Bugs wurden behoben und die allgemeine Performance verbessert.