Das 2021Q4-Update für den CorpusExplorer bringt folgende Neuerungen/Verbesserungen:

    • LDA-Topic Modeling
      Der CorpusExplorer verfügt jetzt über die Möglichkeit ein Topic-Modell zu erzeugen.
      Grundlage ist hierfür LightLDA (https://github.com/microsoft/LightLDA) eine Weiterentwicklung des LDA-Verfahrens.
      Damit lassen sich die Dokumente nach Topics gruppieren UND die Ausgabe der TOP-Terme pro Topic ist möglich.

      Hinweise: Für die Funktion ist es notwendig, dass der CorpusExplorer als 64-Bit-Prozess läuft. Der CorpusExplorer startet automatisch als 64-Bit-Prozess, wenn Sie Windows mit 64-Bit nutzen. Sie finden die Funktion unter: Textedition > LDA-Topic Model

    • Es gibt einen neuen Table-Writer zur Ausgabe von HTML-Tabellen (nur Tabellen-Skeleton). Der bisherige HTML5-Table-Writer bleibt erhalten (er erzeugt ein vollständiges HTML-Dokument)
    • Diverse Korrekturen.