Das gebündelte Q2/Q3 Update bringt einige neue und verbesserte Funktionen mit sich. Außerdem markiert es den ersten Meilenstein einer längeren Entwicklung – der CEC-UI.
Neue Funktionen:
- Scaper- und Import-Unterstützung für „IDS KorAP – XML“
- Import-Unterstützung für Simple-JSON-Standof Annotationen
- Neues integriertes Korpus zur Bundestagswahl 2021 – Ein großer Dank für die Aufbereitung und Bereistellung des Materials geht an Simon Meier-Vieracker.
- Die Ergebnisse des Moduls „Sentiment-Detection“ können jetzt exportiert werden. Danke für den Vorschlag für diese ergänzende Funktion an Leonie Weingart.
- Neuer „Visueller Skript Editor“ für die CorpusExplorerConsole (cec) wird als Beta-Version mit ausgeliefert.
Der „Visueller Skript Editor“ ist zum einen unter „Spezialfunktionen > Automatisierung“ direkt aus dem CorpusExplorer aufrufbar – zum anderen über den Befehl: cec-ui
Die GUI wurde getestet – ggf. kann es aber noch zu kleineren Fehlern kommen – in diesem Fall, bitte Fehler melden.
-
Über "Spezialfunktionen > Abfragen automatisieren" kann der neue (BETA) Skript-Editor gestartet werden.
-
Jedes Skript bietet im HEAD die Möglichkeit Metadaten zu hinterlegen. Pro Skript können beliebig viele Sessions definiert werden. Eine Session bündelt dabei Quellen, Abfragen und Aktionen (wie z. B. Analysen). Sessions können unabhängig voneinander ausgeführt werden.
-
Jede Session umfasst Quellen, Abfragen und Aktionen.
-
Quellen lassen sich importieren (annotiertes Korpusmaterial) oder annotieren.
-
Über den Query-Editor lassen sich sehr einfach Abfragen erzeugen. Einfach die Felder ausfüllen und der Query wird automatisch erzeugt.
-
Aktionen führen die Analysen aus. Eine Besonderheit ist die Funktion 'Cluster' mit ihr kann das Korpusmaterial in verschiedene Teilbereiche zerlegt und jeder Bereich für sich ausgewertet werden. Praktisch für schnelle Vergleiche.
-
Verbesserungen Korrekturen:
- Verbesserung des Tabellen-Exports.
- Texte-Annotieren – die Layerwerte werden jetzt alphabetisch sortiert.
- Bestimmte UTF-8 Sonderzeichen konnten die Textlinsen-Funktion verwirren. Der Fehler ist behoben.
- Unter bestimmten Umständen war nach einem Schnappschusswechsel die Liste der verfügbaren Dokumente nicht immer aktuell bzw. aktualisierte sich mit Zeitverzug – Die Listen sind jetzt immer direkt aktuell.
- Weitere kleinere Verbesserungen und Korrekturen
- Abhängigkeiten zum CorpusExplorer v1 wurden entfernt – Import weiterhin möglich.