CorpusExplorer – Releasenotes Q4 / 2025
Wichtige Neuerungen
Überarbeitete Zeitverlaufs-Analysen
Die Analyse über Zeitverläufe wurde grundlegend überarbeitet und flexibler gestaltet:
-
Datentyp unabhängige Zeitangaben: Es ist nun nicht mehr erforderlich, dass Zeitangaben explizit als Datumstyp vorliegen. Ob String, Ganzzahl oder Datum – entscheidend ist nur, dass die Angabe auf ein interpretierbares Datum (z. B. Jahreszahl oder konkretes Datum) verweist.
-
Wegfall der automatischen Clusterung: Statt einer Cluster-basierten Unterteilung werden nun alle Zeitpunkte im Datensatz direkt auf dem Zeitstrahl ausgegeben.
-
Neue Cluster-Optionen: Über die Einstellung „Cluster“ kann die Ausgabe bei Bedarf in verschiedene Zeitauflösungen zusammengefasst werden:
-
tageweise
-
monatsweise
-
quartalsweise
-
jahresweise
-
jahrzehntweise
⚠️ Hinweis: Bei Korpora mit vielen Dokumenten kann eine tageweise Darstellung zu langen Berechnungszeiten führen (viele Tage = viele Datenpunkt => lange Berechnung). In solchen Fällen empfiehlt sich die Einstellung „Jahr“ (reduziert die Anzahl der Datenpunkte um den Faktor 365).
-
Verbesserungen
-
I5-XML-Verarbeitung: Verbesserte Stabilität und höhere Kompatibilität beim Einlesen und Verarbeiten von I5-XML-Daten.
-
CorpusMerger-Erweiterung für Entwickler*innen:
Der CorpusMerger unterstützt nun Transformationen während des Merge-Prozesses (on-the-fly).
Aktuell verfügbar:-
Umwandlung des gesamten Textes in lower-case.
Weitere Normalisierungen folgen in kommenden Versionen.
-
️ Fehlerbehebungen
-
Diverse kleinere Bugs wurden behoben und die allgemeine Performance verbessert.