Das 2021Q4-Update für den CorpusExplorer bringt folgende Neuerungen/Verbesserungen:
- LDA-Topic Modeling
Der CorpusExplorer verfügt jetzt über die Möglichkeit ein Topic-Modell zu erzeugen.
Grundlage ist hierfür LightLDA (https://github.com/microsoft/LightLDA) eine Weiterentwicklung des LDA-Verfahrens.
Damit lassen sich die Dokumente nach Topics gruppieren UND die Ausgabe der TOP-Terme pro Topic ist möglich.
Hinweise: Für die Funktion ist es notwendig, dass der CorpusExplorer als 64-Bit-Prozess läuft. Der CorpusExplorer startet automatisch als 64-Bit-Prozess, wenn Sie Windows mit 64-Bit nutzen. Sie finden die Funktion unter: Textedition > LDA-Topic Model
- Es gibt einen neuen Table-Writer zur Ausgabe von HTML-Tabellen (nur Tabellen-Skeleton). Der bisherige HTML5-Table-Writer bleibt erhalten (er erzeugt ein vollständiges HTML-Dokument)
- Diverse Korrekturen.