CorpusExplorer – Releasenotes Q4 / 2025
Wichtige Neuerungen
Überarbeitete Zeitverlaufs-Analysen
Die Analyse über Zeitverläufe wurde grundlegend überarbeitet und flexibler gestaltet:
Datentyp unabhängige Zeitangaben: Es ist nun nicht mehr erforderlich, dass Zeitangaben explizit als Datumstyp vorliegen. Ob String, Ganzzahl oder Datum – entscheidend ist nur, dass die Angabe auf ein interpretierbares Datum (z. B. Jahreszahl oder konkretes Datum) verweist.
Wegfall der automatischen Clusterung: Statt einer Cluster-basierten Unterteilung werden nun alle Zeitpunkte im Datensatz direkt auf dem Zeitstrahl ausgegeben.
Neue Cluster-Optionen: Über die Einstellung „Cluster“ kann die Ausgabe bei Bedarf in verschiedene Zeitauflösungen zusammengefasst werden:
tageweise
monatsweise
quartalsweise
jahresweise
jahrzehntweise
⚠️ Hinweis: Bei Korpora mit vielen Dokumenten kann eine tageweise Darstellung zu langen Berechnungszeiten führen (viele Tage = viele Datenpunkt => lange Berechnung). In solchen Fällen empfiehlt sich die Einstellung „Jahr“ (reduziert die Anzahl der Datenpunkte um den Faktor 365).
Verbesserungen
I5-XML-Verarbeitung: Verbesserte Stabilität und höhere Kompatibilität beim Einlesen und Verarbeiten von I5-XML-Daten.
CorpusMerger-Erweiterung für Entwickler*innen:
Der CorpusMerger unterstützt nun Transformationen während des Merge-Prozesses (on-the-fly).
Aktuell verfügbar:Umwandlung des gesamten Textes in lower-case.
Weitere Normalisierungen folgen in kommenden Versionen.
️ Fehlerbehebungen
Diverse kleinere Bugs wurden behoben und die allgemeine Performance verbessert.