Artikel getaggt mit "Update"

Problem: Der CorpusExplorer zeigt keine Daten/Tabellen mehr an…

Bei einigen Nutzer*innen kann es vorkommen, dass urplötzlich keine Daten oder Tabellen im CorpusExplorer angezeigt werden. Das Problem liegt an der neuen DPI-Skalierungsfunktion von Windows. Diese neue Funktion wird durch das Windows-Update automatisch auf jedem Windows 10 Rechner installiert und tritt auch nur auf, wenn die Skalierung ungleich 100% beträgt (z. B. bei hochauflösenden Displays).

Abhilfe langfristig: Ein Update ist in Arbeit.

Abhilfe kurzfristig:

  1. Beenden Sie alle Programme.
  2. Klicken Sie mit der rechten Maustaste auf den Desktop und wählen Sie aus dem Menü „Anzeigeeinstellungen“.
  3. Überprüfen Sie ob der Regler/Auswahlbox für „Skalierung“ auf 100% steht. Wenn das der Fall ist, dann liegt ein anderes Problem vor (dann sind Sie hier fertig und müssen mir eine E-Mail schreiben, damit ich auch von diesem Fehler erfahre). Wenn der Wert von 100% abweicht, dann setzen Sie den Regler/Auswahlbox auf 100% und fahren Sie mit Punkt 4 fort.
  4. Wie Sie festestellen werden, wird nach der Reduktion auf 100% vieles auf dem Bildschirm kleiner. Um das auszugleichen, klicken Sie auf „Erweiterte Einstellungen“. Dort können Sie eine andere (niedrigere) Bildschirmauflösung wählen z. B. 1366 x 768. Die Reduktion der Auflösung hat den gleichen Effekt wie eine Skalierung – kommt dafür aber ohne unschöne Nebeneffekte daher.
  5. Starten Sie den Rechner neu. Das Problem sollte behoben sein.
Mehr

CorpusExplorer (April Update 2017) – Fehler: Die Anwendung kann nicht gestartet werden.

CorpusExplorer (April Update 2017) – Fehler: Die Anwendung kann nicht gestartet werden.

Wenn Sie die folgende Fehlermeldung erhalten, müssen Sie den CorpusExplorer über die Systemsteuerung zuerst deinstallieren und dann erneut installieren. Grund für diesen Fehler ist ein Tausch des Installationszertifikats (Bestätigt die Echtheit des CorpusExplorers und schützt ihn vor unberechtigter Manipulation). Ich bitte die Unannehmlichkeiten zu entschuldigen – falls Sie Hilfe benötigen, können Sie sich über das Kontaktformular an mich wenden.

Mehr

CorpusExplorer v2.0 – Januar 2017 Update

Das erste Update 2017 bringt hauptsächlich Neuerungen ‚unter der Haube‘ – es ist also eher funktional. Dafür bereitet es den Weg für neue Analysemöglichkeiten, die 2017 folgen werden. Die wichtigste Hauptfunktion ist das komplett neu entwickelte Dateiformat CEC6 (CorpusExplorerCorpus v6.0). Es hat gegenüber der Version 5.0 folgende Vorteile:

  • Höhere Performance bei einigen Analysen.
  • Wesentlich schnelleres Laden/Speichern von sehr großen Korpora
  • Ab ca. 15 Mio. Token oder 50’000 Dokumenten bricht die Performance der alten 5.0 Version spürbar ein, da sehr viel Arbeitsspeicher mehrfach beschrieben/freigegeben werden musste um das CEC5-Korpus vollständig zu laden/speichern. Dieses Problem ist in Version 6.0 beseitigt.
  • Das Format ist kompatibel zu unterschiedlichen Plattformen, dank MONO
  • Die Arbeitsspeicherausbeute wurde verbessert pro 1 GB RAM können ca. 30 Mio. Token gespeichert werden.

Hinweis: Das neue CEC6-Format kann ab jetzt genutzt werden. Aktuell ist noch das CEC5-Format die Standardeinstellung – dies wird sich im Laufe des Jahres ändern. Ein kleiner Nachteil des neuen CEC6-Formats liegt darin, dass die Daten binär-codiert sind. D.h. man kann die Daten nicht mehr manuell oder mit anderen Programmen auslesen. Mittlerweile verfügt der CorpusExplorer aber über eine gute Anzahl an Export-Formaten, so dass es jederzeit möglich ist, die Daten zu exportieren (z. B. in XML, JSON, DTA-Basisformat, Weblicht, usw.).

  • Kleinere Verbesserungen: Die Bereinigungsfunktion wurde verbessert. So ist es jetzt auch möglich osteuropäische Sprachdaten zu laden (diese wurden zuvor extrem bereinigt). Ein positiver Nebeneffekt der Korrektur: Der Annotationsprozess wurde beschleunigt.
  • Das Modul „PaperLinguist“ hat einen komplett neuen Unterbau erhalten, der die Generierung von Reports beschleunigt.
Mehr

CorpusExplorer v2.0 – November Update

CorpusExplorer v2.0 – November Update

Das November Update bringt viele neue Funktionen für Freunde von Zeitreihenanalysen.

Neuerungen / Verbesserungen :

  • Frequenzanalyse > Zeitliche Verteilung – Bisher war diese Funktion unter den Spezialfunktionen zu finden. Jetzt hat diese Analyseform endlich den Betastatus verlassen.
  • Kookkurrenzen > Zeitliche Verteilung – Wählen Sie einen Begriff und lassen Sie sich die Polarisationen einzelner Kookkurrenzen im zeitlichen Verlauf anzeigen.
  • Korpusverteilung > Zeitliche Verteilung – Wählen Sie eine Kategorie und dann die Werte dieser Kategorie um deren Verteilung über unterschiedliche Zeiträume zu vergleichen.
  • Korpusverteilung > Zustandanalyse – Wählen Sie einen Datums/Zeit-Parameter, dann die gewünschte Entität (z. B. Autor) und abschließend den Zustand (z. B. Verlag). So können Autoren identifiziert werden, die entweder für einen oder für mehrere Verlage arbeiten. Verlagswechsel werden so schnell und einfach nachvollziehbar.
  • Schnappschuss > Autosplit – Zu der bisherigen Funktion den Schnappschuss in gleichgroße Zeitfenster (Cluster) einzuteilen, gibt es jetzt die Möglichkeit die Dokumente anhand ihrer Werte zu gruppieren. Die möglichen Granulierungsstufen reichen von Jahr bis hin zu Minute. Granulierungen nach Jahrzehnt oder Jahrhundert sind aktuell nur auf Nachfrage möglich.
  • Kookkurrenzen > Tabelle – Bisher war es ratsam, die angezeigte Tabelle beidseitig zu filtern. D. h. ein Begriff musste einmal in der Spalte ‚Zeichenkette‘ und einmal in ‚Kookkurrenz‘ gesucht werden. Dies ist jetzt nicht mehr notwendig (aber weiterhin möglich). Unterhalb der Tabelle befindet sich jetzt eine Suchmaske, die Eingaben entgegennimmt und die Tabelle entsprechend filtert.
  • Textedition > Textvergleich – Ab jetzt kann direkt abgelesen werden, wie viele Einfügungen und Entfernungen notwendig sind um den linken in den rechten Text zu transformieren. Außerdem wird die Edit-Distanz angegeben. Diese ist nicht notwendigerweise identisch mit ‚Hinzufügen‘ + ‚Entfernen‘ – da sich überlappende Änderungen ergeben können.
  • Es gibt ein neues Datenformat für alle CorpusExplorer-Backends. Das ‚Lightweight‘-Korpusformat erfasst pro Korpus nur ein einziges Dokument. Dies erlaubt, auch Streamdaten in Echtzeit zu analysieren.
  • Über die Entwicklerschnittstelle (CorpusExplorer SDK) können jetzt Dokumente zusätzlich/nachträglich annotiert werden. Einzelne Layer lassen sich leichter exportieren, annotieren und re-importieren/duplizieren.
  • PMG-XML wird jetzt unterstützt. Es erlaubt den direkten Import von Zeitungsartikel unterschiedlicher Verlage.
  • Es wurden wie immer kleine fiese Anzeigefehler behoben. Diese Mistdinger sind einfach nicht tot zu kriegen.

Darüber hinaus wurde das Wartungstool aktualisiert. Es ist die erste Anlaufstelle für Probleme mit dem CorpusExplorer. Neu:

  • Fehler sind jetzt übersichtlich in Kategorien gruppiert.
  • Eine Installation des Wartungsprogramms ist jetzt nicht mehr notwendig. Die Exe kann heruntergeladen werden – ausgeführt und dann auch spurlos wieder gelöscht werden.
  • Es wird jetzt auch eine Hilfe für verschiedene Windows-Probleme angeboten.
    Hinweis: Microsoft empfiehlt schon seit geraumer Zeit keine Optimierungssoftware wir z. B. TuneUp-Utils oder CCleaner einzusetzen. Gerade unter Windows 10 nutzen diese Programme wenig – d. h. historisch waren diese Programme mal unter Windows XP von nutzen. Aktuell sorgen solche Programme aber oft für Probleme – einige davon kann das CorpusExplorer Wartungstool wieder beheben.
Mehr

CorpusExplorer v2.0 – Juni/Juli Update – Geänderter Updateplan

CorpusExplorer v2.0 – Juni/Juli Update – Geänderter Updateplan

Neues Update – Neue Funktion – Der „PaperLinguist“ ist jetzt verfügbar (Spezialanalysen). Dadurch wird es möglich, die wichtigsten Analysen in einem Rutsch auszudrucken bzw. als PDF, Word, Excel oder CSV zu exportieren. Aber vorsicht, bei Korpora ab 1 Mio. Token werden es schnell mehrere tausend Seiten.

PaperLinguist-Visualisierung

PaperLinguist-Visualisierung

Ansonsten: Weniger Fehler und minimale Verbesserungen am Benutzerinterface.

Wichtig: Um Zeit für die Dissertation zu haben – deren Teil ja auch der CorpusExplorer ist – werde ich vorübergehend nur noch alle drei Monate ein neues Update herausgeben. Mittlerweile korrigiere ich sowieso nur noch wenige Dinge – der CorpusExplorer läuft sehr stabil. Außerdem wird es durch den geänderten Updateplan eher mehr als weniger neue Funktionen geben. Jedes neue Update kostet Zeit – Zeit für die Bereitstellung und Zeit für die Dokumentation.

Mehr

CorpusExplorer v2.0 – Mai Update

Normalerweise ist der Mai einer der wichtigsten Update-Monate für den CorpusExplorer. Dieses Jahr fällt das Mai Update etwas kleiner aus. Das liegt daran, dass ich mich auf drei Dinge fokussieren muss. 1. Wollen einige Artikel geschrieben werden. 2. Dieses Update steht im Zeichen der Fehlerbeseitigung. 3. Es gibt da noch eine Promotionsschrift, die will auch noch geschrieben werden.

Was gibt es NEUES in diesem Update:

  • Der CorpusExplorer nutzt nun offiziell TagPies (http://www.tagpies.vizcovery.org/) zur Darstellung von Wortwolken. Danke an Stefan Jänicke und Team.
  • HTML5 Labor – Der CorpusExplorer verfügt über einen HTML5-, JavaScript-, CSS-Editor, mit dem Sie eigene HTML5-Visualisierungen mit Hilfe des CorpusExplorers erstellen können. Ein Video dazu  folgt in Kürze. Das Labor eignet sich z. B. auch für den Einsatz von D3.js oder Angular.
  • EuroParl kann jetzt als Korpusquelle genutzt werden. http://www.statmt.org/europarl/ – Bitte laden Sie das Paket: source release (text files)
  • Wird das Projekt gespeichert, werden alle Änderungen (Annotationen/Metadaten) an die jeweiligen Korpora durchgereicht.
  • Verbesserungen der CHAT-Ansicht
  • Verbesserungen im Query-Editor
  • Es besteht die Möglichkeit, Test-Korpora zu erstellen. Mit diesen lässt sich die Korrektheit des CorpusExplorers überprüfen.
  • Weniger Fehler / Bessere UI-Erfahrung
Mehr

CorpusExplorer v2.0 – April Update

Das April Update ist 100%-iges BugFix-Update. Was wurde verbessert:

  • Die neue HTML5-Engine
    Wichtig: Wer zwischen dem 25.03.2016 und 07.04.2016 ein Update durchgeführt hat, steckt wohl möglich in einer Updateschleife fest. Grund: Der CorpusExplorer wird nicht korrekt geschlossen, da die HTML5-Instanzen weiterhin aktiv sind. Lösung:

    1. Starten Sie ihren Computer neu.
    2. Besuchen Sie direkt nach dem Neustart folgende Webseite und klicken Sie auf „Ausführen“:
      http://bitcutstudios.com/products/CorpusExplorer-Tools/Wartung/publish.htm
    3. Das Wartungstool erscheint – Klicken Sie auf „QuickFix 0xE0001: Fehler automatisch beheben“. Der CorpusExplorer wird rekonfiguriert und aktualisiert.
  • Die Visualisierung „Kookkurrenzen > Als Wolke“ verarbeitet nun Anfragen wesentlich schneller.
  • CLAN CHILDES Dokumente werden jetzt noch exakter geparst.
Mehr

CorpusExplorer v2.0 – 2016 is here!

CorpusExplorer v2.0 – 2016 is here!

Mit dem ersten Update in 2016 ändert sich sehr viel für den CorpusExplorer denn er wird offen und flexibel.

Add-on System

Bisher gab es mehrere spezielle Projektversionen – Zusätlich zu den drei bisherigen (Standard, PC-Poolraum, Insider).

Unter der folgenden URL können Sie alle von mir betreuten Add-ons einsehen:
https://notes.jan-oliver-ruediger.de/software/corpusexplorer-overview/corpusexplorer-v2-0/erweiterungen/

Wenn Sie selber Add-ons für den CorpusExplorer anbieten wollen kontaktieren Sie mich und ich nehme Ihr Add-on gerne auf.

Was sind Add-ons?
Es gibt zwei Arten – Programm-Add-ons erweitern die Programmumfang des CorpusExplorers. Dann gibt es noch Korpus-Add-ons und hier wird es spannend … Sie können z. B. ein Korpus für ein Seminar als Add-on an ihre Student*innen verteilen. Ergeben sich Änderungen am Korpusmaterial erhalten die Studierenden diese Änderungen automatisch.

Apache Tika als eines der ersten Add-ons

Mit diesem Add-on nutzen Sie Apache Tika beim annotieren von neuen Korpora – Tika importiert und bereinigt fast jedes Textdokument. [Weitere Infos hier].

QueryBuilder

Auf Nutzerwunsch gibt es jetzt einen neuen Abfrageeditor für alle Tabellen-Analysen. Klicken Sie auf das neue Symbol und der Editor öffnet sich. Alle Abfragen die Sie bereits über die Tabelle erstellt haben werden übernommen. Außerdem können Sie Abfragen speichern & laden.

QueryEditor

Mehr

CorpusExplorer v2.0 – Dezember Update

CorpusExplorer v2.0 – Dezember Update

Das Update bringt viele kleine Verbesserungen mit sich. Die zwei wichtigsten hier:

Das Export-System wurde komplett neu entwickelt. Damit ist es jetzt möglich, eigene Exporter für den CorpusExplorer zu schreiben. Für Nutzer*innen biete das neue Export-System bereits jetzt einige neue Export-Funktionen und wird einheitlicher – Egal ob Sie ein Korpus, Schnappschüsse oder ein einzelnes Dokument (z. B. aus Text-Annotieren) exportieren, die Benutzererfahrung ist immer gleich. Exportformate: AnnotationPro, CEC5, DSpin-XML, JSON, Plaintext, XML

Export

 

 

 

 

 

 

Zeitliche Verteilung – Korpora die Datumsangaben enthalten können jetzt für eine Zeitreihenanalyse genutzt werden. Diese neue Analyse steht unter Spezialfunktionen > Zeitliche Verteilung zur Verfügung.

Timeline

Mehr

CorpusExplorer v2.0 – November Update

CorpusExplorer v2.0 – November Update

Das November Update ist unscheinbar. Eine wichtige aber für Nutzer*innen vorerst unsichtbare Änderung:

Der CorpusExplorer kann ab jetzt für viele verschiedene Datenformate genutzt werden (kein Import nötig). Dank Adapter-Pattern (Insider für OOP-Entwickler*innen). Die aktuelle Insider-Edition enthält bereits diese Funktion und wird zeitgleich mit dem neuen CEFS-Format ausgestattet.

Was ist CEFS?
CEFS ist das CorpusExplorer-FileSystem – ein neuartiges Korpusformat für (fast) unbegrenzt große Korpora.

Warum nur (fast)?
Das (fast) bezieht sich auf zwei Grenzen:

  1. Es können max. 2,1 Milliarden Layerwerte (Types) gespeichert werden.
  2. Es gibt eine Grenze an Token, diese ist definiert durch die Größe des verfügbaren Festplattenspeichers.

Wird CEFS das CEC5-Format ablösen?
Nein! – CEC5 ist eine In-Memory-Technik und beide Formate werden gleichberechtigt existieren.

Unterschiede CEFS / CEC5?

  • CEC5 eignet sich für kleine/mittlere Korpora – Regel Arbeitsspeicher in GB * 1 Mio. Token. Also auf aktuellen PCs (8 GB RAM) sind ca. 8 Mio. Token möglich.
  • CEFS für mittlere/große Korpora – Also für alle Korpora die über das CEC5-Limmit hinausgehen.

Wann wird CEFS für Standard-Nutzer verfügbar sein?
Der Insider-Test läuft noch bis 15.02.2016 – Das erste darauf folgende Release wird dann CEFS für alle verfügbar machen.

Wo finde ich CEFS?
Annotieren oder Importieren Sie Korpora und unterstützt der Tagger/Importer CEFS, dann wird Ihnen eine Auswahl zwischen CEC5 (Standardformat) und CEFS angezeigt – Aktueller Screenshot:

CEFS

Mehr

Folge mir auf Twitter