Kurz vor Jahresende gibt es noch ein kleines Update für den CorpusExplorer. Folgende neue und geänderte Funktionen gibt es:
- Wichtig: Die Systemvoraussetzung wurde auf .NET 4.6.2 angehoben. Es ist absehbar, dass Microsoft den Support auch hierfür bald einstellt und ganz auf .NET 5 oder höher setzt. Ich werde so lange es geht, die ältest mögliche Version unterstützen.
- Der Export für verschiedene Standoff-Formate wie z. B. KorAP wurde verbessert.
- Es gibt einen neuen universellen TSV- und Microsoft Excel®-Importer. Beide setzen voraus, dass die Texte tokenisiert sind (pro Zeile = 1 Token). Die Spalten müssen benannt sein (erste Zeile) und es muss eine Spalte namens „Token“ oder „Wort“ geben, die das Token enthält. Weitere Spalten werden als Layer interpretiert.
- RegEx-Abfragen werden jetzt vorkompiliert – dies erhöht die Performance.
- Der CorpusExplorer wird ab kommenden Jahr im Pride-Month automatisch ein anderes Logo zeigen.
- Der CorpusMerger (wenn mehrere Korpora kombiniert werden) arbeitet jetzt vollständig parallelisiert. Dies bringt höhere Performance bei geringerem Speicherverbrauch.
- Kleinere Fehlerbehebungen und Aktualisierung von Komponenten.