Das 2021Q4-Update für den CorpusExplorer bringt folgende Neuerungen/Verbesserungen:

  • LDA-Topic Modeling
    Der CorpusExplorer verfügt jetzt über die Möglichkeit ein Topic-Modell zu erzeugen.
    Grundlage ist hierfür LightLDA (https://github.com/microsoft/LightLDA) eine Weiterentwicklung des LDA-Verfahrens.
    Damit lassen sich die Dokumente nach Topics gruppieren UND die Ausgabe der TOP-Terme pro Topic ist möglich.

    Hinweise: Für die Funktion ist es notwendig, dass der CorpusExplorer als 64-Bit-Prozess läuft. Der CorpusExplorer startet automatisch als 64-Bit-Prozess, wenn Sie Windows mit 64-Bit nutzen. Sie finden die Funktion unter: Textedition > LDA-Topic Model

  • Es gibt einen neuen Table-Writer zur Ausgabe von HTML-Tabellen (nur Tabellen-Skeleton). Der bisherige HTML5-Table-Writer bleibt erhalten (er erzeugt ein vollständiges HTML-Dokument)
  • Diverse Korrekturen.