Gepostet vonJan

CorpusExplorer v2.0 – Januar 2017 Update

Das erste Update 2017 bringt hauptsächlich Neuerungen ‚unter der Haube‘ – es ist also eher funktional. Dafür bereitet es den Weg für neue Analysemöglichkeiten, die 2017 folgen werden. Die wichtigste Hauptfunktion ist das komplett neu entwickelte Dateiformat CEC6 (CorpusExplorerCorpus v6.0). Es hat gegenüber der Version 5.0 folgende Vorteile:

  • Höhere Performance bei einigen Analysen.
  • Wesentlich schnelleres Laden/Speichern von sehr großen Korpora
  • Ab ca. 15 Mio. Token oder 50’000 Dokumenten bricht die Performance der alten 5.0 Version spürbar ein, da sehr viel Arbeitsspeicher mehrfach beschrieben/freigegeben werden musste um das CEC5-Korpus vollständig zu laden/speichern. Dieses Problem ist in Version 6.0 beseitigt.
  • Das Format ist kompatibel zu unterschiedlichen Plattformen, dank MONO
  • Die Arbeitsspeicherausbeute wurde verbessert pro 1 GB RAM können ca. 30 Mio. Token gespeichert werden.

Hinweis: Das neue CEC6-Format kann ab jetzt genutzt werden. Aktuell ist noch das CEC5-Format die Standardeinstellung – dies wird sich im Laufe des Jahres ändern. Ein kleiner Nachteil des neuen CEC6-Formats liegt darin, dass die Daten binär-codiert sind. D.h. man kann die Daten nicht mehr manuell oder mit anderen Programmen auslesen. Mittlerweile verfügt der CorpusExplorer aber über eine gute Anzahl an Export-Formaten, so dass es jederzeit möglich ist, die Daten zu exportieren (z. B. in XML, JSON, DTA-Basisformat, Weblicht, usw.).

  • Kleinere Verbesserungen: Die Bereinigungsfunktion wurde verbessert. So ist es jetzt auch möglich osteuropäische Sprachdaten zu laden (diese wurden zuvor extrem bereinigt). Ein positiver Nebeneffekt der Korrektur: Der Annotationsprozess wurde beschleunigt.
  • Das Modul „PaperLinguist“ hat einen komplett neuen Unterbau erhalten, der die Generierung von Reports beschleunigt.
Mehr

DTA-Kernkorpus als Korpus-Addon verfügbar

Das DTA-Kernkorpus ist ab jetzt als Korpus-Addon verfügbar. Für Sie heißt das: Einfache Installation, bereits analysefertiges Material, Updates erfolgen vollautomatisch. Das DTA-Korpus-Addon können Sie hier herunterladen: [Download]. Weitere Informationen zum Addon sowie weitere Korpus- & Programm-Addons finden Sie [hier].

Mehr

CorpusExplorer v2.0 – November Update

CorpusExplorer v2.0 – November Update

Das November Update bringt viele neue Funktionen für Freunde von Zeitreihenanalysen.

Neuerungen / Verbesserungen :

  • Frequenzanalyse > Zeitliche Verteilung – Bisher war diese Funktion unter den Spezialfunktionen zu finden. Jetzt hat diese Analyseform endlich den Betastatus verlassen.
  • Kookkurrenzen > Zeitliche Verteilung – Wählen Sie einen Begriff und lassen Sie sich die Polarisationen einzelner Kookkurrenzen im zeitlichen Verlauf anzeigen.
  • Korpusverteilung > Zeitliche Verteilung – Wählen Sie eine Kategorie und dann die Werte dieser Kategorie um deren Verteilung über unterschiedliche Zeiträume zu vergleichen.
  • Korpusverteilung > Zustandanalyse – Wählen Sie einen Datums/Zeit-Parameter, dann die gewünschte Entität (z. B. Autor) und abschließend den Zustand (z. B. Verlag). So können Autoren identifiziert werden, die entweder für einen oder für mehrere Verlage arbeiten. Verlagswechsel werden so schnell und einfach nachvollziehbar.
  • Schnappschuss > Autosplit – Zu der bisherigen Funktion den Schnappschuss in gleichgroße Zeitfenster (Cluster) einzuteilen, gibt es jetzt die Möglichkeit die Dokumente anhand ihrer Werte zu gruppieren. Die möglichen Granulierungsstufen reichen von Jahr bis hin zu Minute. Granulierungen nach Jahrzehnt oder Jahrhundert sind aktuell nur auf Nachfrage möglich.
  • Kookkurrenzen > Tabelle – Bisher war es ratsam, die angezeigte Tabelle beidseitig zu filtern. D. h. ein Begriff musste einmal in der Spalte ‚Zeichenkette‘ und einmal in ‚Kookkurrenz‘ gesucht werden. Dies ist jetzt nicht mehr notwendig (aber weiterhin möglich). Unterhalb der Tabelle befindet sich jetzt eine Suchmaske, die Eingaben entgegennimmt und die Tabelle entsprechend filtert.
  • Textedition > Textvergleich – Ab jetzt kann direkt abgelesen werden, wie viele Einfügungen und Entfernungen notwendig sind um den linken in den rechten Text zu transformieren. Außerdem wird die Edit-Distanz angegeben. Diese ist nicht notwendigerweise identisch mit ‚Hinzufügen‘ + ‚Entfernen‘ – da sich überlappende Änderungen ergeben können.
  • Es gibt ein neues Datenformat für alle CorpusExplorer-Backends. Das ‚Lightweight‘-Korpusformat erfasst pro Korpus nur ein einziges Dokument. Dies erlaubt, auch Streamdaten in Echtzeit zu analysieren.
  • Über die Entwicklerschnittstelle (CorpusExplorer SDK) können jetzt Dokumente zusätzlich/nachträglich annotiert werden. Einzelne Layer lassen sich leichter exportieren, annotieren und re-importieren/duplizieren.
  • PMG-XML wird jetzt unterstützt. Es erlaubt den direkten Import von Zeitungsartikel unterschiedlicher Verlage.
  • Es wurden wie immer kleine fiese Anzeigefehler behoben. Diese Mistdinger sind einfach nicht tot zu kriegen.

Darüber hinaus wurde das Wartungstool aktualisiert. Es ist die erste Anlaufstelle für Probleme mit dem CorpusExplorer. Neu:

  • Fehler sind jetzt übersichtlich in Kategorien gruppiert.
  • Eine Installation des Wartungsprogramms ist jetzt nicht mehr notwendig. Die Exe kann heruntergeladen werden – ausgeführt und dann auch spurlos wieder gelöscht werden.
  • Es wird jetzt auch eine Hilfe für verschiedene Windows-Probleme angeboten.
    Hinweis: Microsoft empfiehlt schon seit geraumer Zeit keine Optimierungssoftware wir z. B. TuneUp-Utils oder CCleaner einzusetzen. Gerade unter Windows 10 nutzen diese Programme wenig – d. h. historisch waren diese Programme mal unter Windows XP von nutzen. Aktuell sorgen solche Programme aber oft für Probleme – einige davon kann das CorpusExplorer Wartungstool wieder beheben.
Mehr

CorpusExplorer v2.0 – Juni/Juli Update – Geänderter Updateplan

CorpusExplorer v2.0 – Juni/Juli Update – Geänderter Updateplan

Neues Update – Neue Funktion – Der „PaperLinguist“ ist jetzt verfügbar (Spezialanalysen). Dadurch wird es möglich, die wichtigsten Analysen in einem Rutsch auszudrucken bzw. als PDF, Word, Excel oder CSV zu exportieren. Aber vorsicht, bei Korpora ab 1 Mio. Token werden es schnell mehrere tausend Seiten.

PaperLinguist-Visualisierung

PaperLinguist-Visualisierung

Ansonsten: Weniger Fehler und minimale Verbesserungen am Benutzerinterface.

Wichtig: Um Zeit für die Dissertation zu haben – deren Teil ja auch der CorpusExplorer ist – werde ich vorübergehend nur noch alle drei Monate ein neues Update herausgeben. Mittlerweile korrigiere ich sowieso nur noch wenige Dinge – der CorpusExplorer läuft sehr stabil. Außerdem wird es durch den geänderten Updateplan eher mehr als weniger neue Funktionen geben. Jedes neue Update kostet Zeit – Zeit für die Bereitstellung und Zeit für die Dokumentation.

Mehr

CorpusExplorer v2.0 – Mai Update

Normalerweise ist der Mai einer der wichtigsten Update-Monate für den CorpusExplorer. Dieses Jahr fällt das Mai Update etwas kleiner aus. Das liegt daran, dass ich mich auf drei Dinge fokussieren muss. 1. Wollen einige Artikel geschrieben werden. 2. Dieses Update steht im Zeichen der Fehlerbeseitigung. 3. Es gibt da noch eine Promotionsschrift, die will auch noch geschrieben werden.

Was gibt es NEUES in diesem Update:

  • Der CorpusExplorer nutzt nun offiziell TagPies (http://www.tagpies.vizcovery.org/) zur Darstellung von Wortwolken. Danke an Stefan Jänicke und Team.
  • HTML5 Labor – Der CorpusExplorer verfügt über einen HTML5-, JavaScript-, CSS-Editor, mit dem Sie eigene HTML5-Visualisierungen mit Hilfe des CorpusExplorers erstellen können. Ein Video dazu  folgt in Kürze. Das Labor eignet sich z. B. auch für den Einsatz von D3.js oder Angular.
  • EuroParl kann jetzt als Korpusquelle genutzt werden. http://www.statmt.org/europarl/ – Bitte laden Sie das Paket: source release (text files)
  • Wird das Projekt gespeichert, werden alle Änderungen (Annotationen/Metadaten) an die jeweiligen Korpora durchgereicht.
  • Verbesserungen der CHAT-Ansicht
  • Verbesserungen im Query-Editor
  • Es besteht die Möglichkeit, Test-Korpora zu erstellen. Mit diesen lässt sich die Korrektheit des CorpusExplorers überprüfen.
  • Weniger Fehler / Bessere UI-Erfahrung
Mehr

CorpusExplorer v2.0 – April Update

Das April Update ist 100%-iges BugFix-Update. Was wurde verbessert:

  • Die neue HTML5-Engine
    Wichtig: Wer zwischen dem 25.03.2016 und 07.04.2016 ein Update durchgeführt hat, steckt wohl möglich in einer Updateschleife fest. Grund: Der CorpusExplorer wird nicht korrekt geschlossen, da die HTML5-Instanzen weiterhin aktiv sind. Lösung:

    1. Starten Sie ihren Computer neu.
    2. Besuchen Sie direkt nach dem Neustart folgende Webseite und klicken Sie auf „Ausführen“:
      http://bitcutstudios.com/products/CorpusExplorer-Tools/Wartung/publish.htm
    3. Das Wartungstool erscheint – Klicken Sie auf „QuickFix 0xE0001: Fehler automatisch beheben“. Der CorpusExplorer wird rekonfiguriert und aktualisiert.
  • Die Visualisierung „Kookkurrenzen > Als Wolke“ verarbeitet nun Anfragen wesentlich schneller.
  • CLAN CHILDES Dokumente werden jetzt noch exakter geparst.
Mehr

Lisa Lena Opas-Hänninen Young Scholar Prize 2016

Lisa Lena Opas-Hänninen Young Scholar Prize 2016

Da fährt man nichtsahnend nach Leipzig zur DHd2016 und kommt völlig überrascht mit einem „Lisa Lena Opas-Hänninen Young Scholar Prize“ zurück. Den prämierten Vortrag kann man [hier herunterladen]. Das vorgestellte Programm ist, wie könnte es anders sein, der CorpusExplorer. Ein kleines Dankeschön an die gesamte DH-Community: Ich habe mich entschlossen, ein spezielles DHd2016-CorpusExplorer-Release anzufertigen. Es wird auf spezielle Probleme der DHd2016 eingehen und ich werde versuchen, einige Lösungen nachzubauen/nachzuvollziehen. Das Release wird voraussichtlich Ende März zur Verfügung stehen – also @notejor auf Twitter folgen und immer informiert sein.

Im Vortrag vertieft (Foto by A. Rockenberger @ARockenberger)

Im Vortrag vertieft (Foto by A. Rockenberger @ARockenberger)

Verleihung des Lisa Lena Opas-Hänninen Young Scholar Prize

Mehr

CorpusExplorer v2.0 – 2016 is here!

CorpusExplorer v2.0 – 2016 is here!

Mit dem ersten Update in 2016 ändert sich sehr viel für den CorpusExplorer denn er wird offen und flexibel.

Add-on System

Bisher gab es mehrere spezielle Projektversionen – Zusätlich zu den drei bisherigen (Standard, PC-Poolraum, Insider).

Unter der folgenden URL können Sie alle von mir betreuten Add-ons einsehen:
https://notes.jan-oliver-ruediger.de/software/corpusexplorer-overview/corpusexplorer-v2-0/erweiterungen/

Wenn Sie selber Add-ons für den CorpusExplorer anbieten wollen kontaktieren Sie mich und ich nehme Ihr Add-on gerne auf.

Was sind Add-ons?
Es gibt zwei Arten – Programm-Add-ons erweitern die Programmumfang des CorpusExplorers. Dann gibt es noch Korpus-Add-ons und hier wird es spannend … Sie können z. B. ein Korpus für ein Seminar als Add-on an ihre Student*innen verteilen. Ergeben sich Änderungen am Korpusmaterial erhalten die Studierenden diese Änderungen automatisch.

Apache Tika als eines der ersten Add-ons

Mit diesem Add-on nutzen Sie Apache Tika beim annotieren von neuen Korpora – Tika importiert und bereinigt fast jedes Textdokument. [Weitere Infos hier].

QueryBuilder

Auf Nutzerwunsch gibt es jetzt einen neuen Abfrageeditor für alle Tabellen-Analysen. Klicken Sie auf das neue Symbol und der Editor öffnet sich. Alle Abfragen die Sie bereits über die Tabelle erstellt haben werden übernommen. Außerdem können Sie Abfragen speichern & laden.

QueryEditor

Mehr

CorpusExplorer v2.0 – Dezember Update

CorpusExplorer v2.0 – Dezember Update

Das Update bringt viele kleine Verbesserungen mit sich. Die zwei wichtigsten hier:

Das Export-System wurde komplett neu entwickelt. Damit ist es jetzt möglich, eigene Exporter für den CorpusExplorer zu schreiben. Für Nutzer*innen biete das neue Export-System bereits jetzt einige neue Export-Funktionen und wird einheitlicher – Egal ob Sie ein Korpus, Schnappschüsse oder ein einzelnes Dokument (z. B. aus Text-Annotieren) exportieren, die Benutzererfahrung ist immer gleich. Exportformate: AnnotationPro, CEC5, DSpin-XML, JSON, Plaintext, XML

Export

 

 

 

 

 

 

Zeitliche Verteilung – Korpora die Datumsangaben enthalten können jetzt für eine Zeitreihenanalyse genutzt werden. Diese neue Analyse steht unter Spezialfunktionen > Zeitliche Verteilung zur Verfügung.

Timeline

Mehr

CorpusExplorer v2.0 – November Update

CorpusExplorer v2.0 – November Update

Das November Update ist unscheinbar. Eine wichtige aber für Nutzer*innen vorerst unsichtbare Änderung:

Der CorpusExplorer kann ab jetzt für viele verschiedene Datenformate genutzt werden (kein Import nötig). Dank Adapter-Pattern (Insider für OOP-Entwickler*innen). Die aktuelle Insider-Edition enthält bereits diese Funktion und wird zeitgleich mit dem neuen CEFS-Format ausgestattet.

Was ist CEFS?
CEFS ist das CorpusExplorer-FileSystem – ein neuartiges Korpusformat für (fast) unbegrenzt große Korpora.

Warum nur (fast)?
Das (fast) bezieht sich auf zwei Grenzen:

  1. Es können max. 2,1 Milliarden Layerwerte (Types) gespeichert werden.
  2. Es gibt eine Grenze an Token, diese ist definiert durch die Größe des verfügbaren Festplattenspeichers.

Wird CEFS das CEC5-Format ablösen?
Nein! – CEC5 ist eine In-Memory-Technik und beide Formate werden gleichberechtigt existieren.

Unterschiede CEFS / CEC5?

  • CEC5 eignet sich für kleine/mittlere Korpora – Regel Arbeitsspeicher in GB * 1 Mio. Token. Also auf aktuellen PCs (8 GB RAM) sind ca. 8 Mio. Token möglich.
  • CEFS für mittlere/große Korpora – Also für alle Korpora die über das CEC5-Limmit hinausgehen.

Wann wird CEFS für Standard-Nutzer verfügbar sein?
Der Insider-Test läuft noch bis 15.02.2016 – Das erste darauf folgende Release wird dann CEFS für alle verfügbar machen.

Wo finde ich CEFS?
Annotieren oder Importieren Sie Korpora und unterstützt der Tagger/Importer CEFS, dann wird Ihnen eine Auswahl zwischen CEC5 (Standardformat) und CEFS angezeigt – Aktueller Screenshot:

CEFS

Mehr

CloneDetection

CloneDetection

Egal ob Tweets oder Zeitungsartikel – viele Korpora enthalten Textsorten, die per se zu Duplikaten neigen. Der CorpusExplorer kann jetzt diese automatisch entfernen. Laden Sie ein Korpus. Rufen Sie die Schnappschuss-Detailansicht auf und klicken Sie auf AntiClone.

Hinweis: Aktuell ist diese Funktion nur für kleinere Schnappschüsse geeignet (bis 1 Mio. Token). Für Q1 2016 ist bereits ein Speed-Update geplant.

Clone-Detection

Mehr

CorpusExplorer v2.0 – Oktober Release

Was ist neu im Oktober Release des CorpusExplorers?

  • Neue Scraper für EPUB, DSpin-XML & PDF.
  • Neuer Scraper „Auf gut Glück!“ – versucht aus allen Dateien den größtmöglichen Textinhalt zu extrahieren.
  • Mengenoperationen für Schnappschüsse (inner/outer join, diff).
  • Berechnung der Textähnlichkeit wurde verbessert und beschleunigt.
  • Exporter für DSpin-XML – erlaubt die Anbindung von Slash/A.
  • Serialisierung erfolgt nun ausschließlich mit dem .NET BinaryFormatter – Tests mit XML, JSON, ProtocolBuffer sowie MessagePack verliefen wenig erfolgreich.
  • Korpora und Projekte werden ab 2,5 Mio. Token nicht mehr komprimiert um die Daten schneller schreiben zu können. Komprimieren spart zwar Festplattenplatz, kostet aber Zeit. Wer möchte, kann die Dateien mit GZIP selbst nachträglich komprimieren – z.B. mit dem kostenfreien 7-ZIP.

Hinweis: Da es in diesem Release zu Änderungen an der Dateistruktur kommt, wurde größte Sorgfalt darauf verwendet, dass alle alten Dateien (Projekt/Korpora) weiterhin funktionieren. Der CorpusExplorer erkennt den Inhalt einer CEC5 bzw. PROJ5 Datei und schaltet dann in den entsprechenden Kompatibilitäts-Modus.

Mehr

WordPress PING-Services Stand: 2015-07

Gerade habe ich mal die „Update Services“ (PING) meines WordPress-Blogs überprüft, entschlackt und aktualisiert. Hier ist meine Liste 2015-07 mit PING-Services die

  • vertrauenswürdig sind…
  • funktionieren (zum Zeitpunkt des Abrufs heute 2015-07-07…
  • und für mich als deutschsprachiger Blogger relevant erscheinen.

Die Vertrauenswürdigkeit wurde mit WOT (Web of Trust) eingeschätzt.

Neue Liste 2015-07:
http://rpc.pingomatic.com
http://rpc.twingly.com
http://ping.feedburner.com
http://rpc.technorati.com/rpc/ping
http://rpc.weblogs.com/RPC2
http://blo.gs/ping.php
http://blogsearch.google.com/ping/RPC2
http://blogsearch.google.de/ping/RPC2
http://rpc.pingomatic.com/
http://blogpingr.de/ping/rpc2
http://rpc.bloggerei.de/ping/

Veraltete Liste:

http://rpc.pingomatic.com
http://rpc.twingly.com
http://api.feedster.com/ping
http://api.moreover.com/RPC2
http://api.moreover.com/ping
http://www.blogdigger.com/RPC2
http://www.blogshares.com/rpc.php
http://www.blogsnow.com/ping
http://www.blogstreet.com/xrbin/xmlrpc.cgi
http://bulkfeeds.net/rpc
http://www.newsisfree.com/xmlrpctest.php
http://ping.blo.gs/
http://ping.feedburner.com
http://ping.syndic8.com/xmlrpc.php
http://ping.weblogalot.com/rpc.php
http://rpc.blogrolling.com/pinger/
http://rpc.technorati.com/rpc/ping
http://rpc.weblogs.com/RPC2
http://www.feedsubmitter.com
http://blo.gs/ping.php
http://www.pingerati.net
http://www.pingmyblog.com
http://geourl.org/ping
http://ipings.com
http://www.weblogalot.com/ping
http://blogsearch.google.com/ping/RPC2
http://blogsearch.google.de/ping/RPC2
http://ping.wordblog.de/
http://rpc.icerocket.com:10080/
http://rpc.pingomatic.com/
http://rpc.twingly.com/
http://ping.feedburner.google.com/
http://blogpingr.de/ping/rpc2
http://rpc.bloggerei.de/ping/

Mehr

Kooperation: AnnotationPro & CorpusExplorer – Teil 2/2

Kooperation: AnnotationPro & CorpusExplorer – Teil 2/2

Wie in [diesem Artikel] angekündigt, gibt es jetzt eine Im-/Exporter für AnnotationPro und CorpusExplorer, der in beide Richtungen funktioniert. Bisher konnten ANT-Dateien im CorpusExplorer eingelesen werden. Jetzt können die Daten auch wieder an AnnotationPro zurück übermittelt werden.
AnnotationPro

Dazu installieren Sie bitte folgendes Programm:AnnotationPro <> CorpusExplorer

Nach dem Start können Sie wählen, in welche Richtung Sie eine Datei konvertieren wollen.
Wichtig: Für die Nutzung ist die Installation des CorpusExplorers v2.0 erforderlich.
Tipp: Das Programm stellt für den Weg AnnotationPro > CorpusExplorer nur den TreeTagger sowie dessen Sprachmodelle zur Verfügung. Wenn Sie mehr Option benötigen, dann importieren Sie die ANT-Datei wie bisher direkt über den CorpusExplorer.

Mehr

Kooperation: AnnotationPro & CorpusExplorer – Teil 1/2

Kooperation: AnnotationPro & CorpusExplorer – Teil 1/2

Auf die Frage einer Projektgruppe: Ob denn in naher Zukunft vorgesehen sei, dass der CorpusExplorer auch Transkription von Audio-/Video-Daten unterstützt – war meine Antwort: „Dazu fehlt leider die Zeit und das Budget“. Aber die neue Version (2.0 – aktuell Beta) unterstützt Dateiformate wie z. B. EXMARaLDA – d. h. man kann Transkripte leicht weiterverarbeiten und auswerten.
Diese Anfrage war aber der Ausgangspunkt einer Suche, die schließlich in einer sehr interessanten Kooperation mündet, von der ich jetzt berichte. Durch Zufall fand ich AnnotationPro [kostenlos] (http://annotationpro.org/), ein sehr visuelles, effizientes und vielseitiges Softwareprodukt. An dieser Stelle ein kurzes aber großes Dankeschön an Dr. Katarzyna Klessa, für die Unterstützung bei der Schnittstellenentwicklung und natürlich für AnnoationPro.
Zuerst ein Screenshot von AnnoationPro, dann ein paar wichtige FAQ (weiter unten).

2015-04-26 00_25_47-

 

FAQ

Wie funktioniert der aktuelle Austausch zwischen AnnotationPro und CorpusExplorer?

  1. Erstellen Sie einen Layer in AnnoationPro (oder benennen Sie einen bestehenden Layer um).
    Dieser Layer MUSS den Namen Text tragen (Groß- und Kleinschreibung beachten).
    Dieser Layer sollte einen möglichst fehlerfreien Text enthalten. Vermeiden Sie (soweit möglich) typische Sprach-/Transkript-Annotationen in diesem Layer (z. B. Pausen, Betonungen, Stimmlage, etc.). Dies hat den Grund, dass der CorpusExplorer aus dem Text-Layer einen durchlaufenden Fließtext erzeugt und diesen dann automatisch Annotiert. Sprach- und Transkript-Annotationen können aber nicht von den Parsern und Taggern des CorpusExplorers verarbeitet werden und erzeugen Fehler.
    Tipp: Wenn Sie dennoch Sprach-/Transkript-Annotationen mit auswerten wollen, dann ersetzen Sie die üblichen Tags durch Worte (zur besseren optischen Trennung groß- und zusammengeschrieben) – Bsp.: PAUSEKLEIN, ATMETEIN, HMMKURZ
    Bei Änderungen Speichern nicht vergessen :-)
  2. Starten Sie den „CorpusExplorer v2.0“ – klicken Sie „Mindestens ein Korpus laden“ und wählen Sie dann „Dokumente annotieren“. Ein Dialog erscheint.
  3. Wichtig: Damit Sie im Dialog die ANT-Dateien aus AnnotaionPro wählen können, müssen Sie den richtigen Dateitypen (AnnotationPro (*.ant)) auswählen – siehe Screenshot:2015-04-26 00_45_20-Program Manager
  4. Nachdem Sie den Dateityp ausgewählt haben, wählen Sie die gewünschten ANT-Dateien aus und klicken Sie abschließend auf „Öffnen“.
  5. Der CorpusExplorer fragt Sie noch ein paar Dinge, z. B. welchen Tagger Sie verwenden möchten. Sollten Sie Polnisch (Frau Dr. Klessa ist assoziiert mit der Adam Mickiewicz Universität (AMU) in Poznań, Polen) als Sprache benötigen, dann wählen Sie dies bitte über „Erweiterte Einstellungen“ aus.2015-04-26 00_52_07-CorpusExplorer

Wie wird sich die Kooperation von AnnotationPro und CorpusExplorer weiterhin auswirken?

Wir arbeiten an einem direkten Austausch beider Programme. Wie die Anleitung oben zeigt, funktioniert der Import aktuell nur in eine Richtung. Es wird angestrebt, dass auch AnnotationPro die Daten des CorpusExplorers versteht. Da beide Programme eine sehr ähnliche Programmbasis haben (beide nutzen .NET, sind C# geschrieben und können mit R kommunizieren), sind wir guter Dinge für die Realisation dieses Vorhabens.

[UPDATE: 08.06.2015]
Sie können ab jetzt auch die CorpusExplorer Datei in das ANT-Dateiformat zurückkonvertieren – [siehe hier].

Mehr

BETA 2.0: Updates, Updates, Updates….

Liebe Betatester*innen,

zuerst einmal vielen Dank für die vielen Tests, das Feedback und noch zahlreiche Ideen. Aktuell komme ich nicht dazu den Webblog zu pflegen oder die Hilfe für die Version 2.0 anzugehen, da so viele Rückmeldungen eingehen. Wahrscheinlich habt ihr es gemerkt, jedes mal wenn Ihr den CorpusExplorer v2.0 (beta) startet, erscheint der Updatedialog. Dies ist kein Fehler! – Teilweise veröffentliche ich täglich Updates. Danke nochmals, ihr seid großartig (!) und helft mit ein großartiges Produkt zu entwickeln.

Mehr

Updates 2015-03

Folgende Neuerungen (+)/Änderungen(#) gibt es im März-Release des CorpusExplorers.

Für Version 1.9:
+ Eigenes Speichermanagement
# Performance- und Stabilitätsverbesserungen

Für Version 2.0 (BETA):
+ Eigenes Speichermanagement
+ Excel-Scraper
+ TalkbankXML-Scraper
+ Tools für Softwareentwickler
+ Slash/A-Exporter
+ TwitterJSON- und yourTwapperKeeperJSON-Scraper
# Verbesserungen bei der Erstellung von Schnappschüssen
# Performance- und Stabilitätsverbesserungen

Mehr

CorpusExplorer – Miniupdate 2014/12

Dieses Miniupdate behebt Fehler die im Zusammenhang mit einer Drittanbieterkomponente stehen. Zeitweise war es so unter einigen Windows-Version nicht möglich, die DropDownButton-Auswahlmenüs anzuzeigen. Dieser Fehler wird mit dem Update behoben.

Mehr

CorpusExplorer – Miniupdate 2014/11

CorpusExplorer – Miniupdate 2014/11

Eines der letzten Updates in diesem Jahr enthält noch mal zwei neue Funktionen.

  1. Das Modul „Verschlagworten“, welches das Annotieren des Volltexts erlaubt, verfügt jetzt am unteren linken Rand über  eine neue Option „Metadaten“. Mit einem Klick klappt ein Menü aus, in dem man die Dokument-Metadaten des jeweiligen Dokuments einsehen kann.
  2. Alle Tabellen („Wörter, Lemma, POS zählen“, „N-Gramme“ und „Kookkurrenz“) verfügen über einen neuen Button „Zu Abfrage“. Dieser funktioniert wie folgt. Wählen Sie eine oder mehrere Tabellenzeilen aus (Mehrfachauswahl: Halten Sie die STRG-Taste gedrückt, während Sie auf unterschiedliche Zeilen klicken). Klicken Sie dann auf „Zu Abfrage“ (ohne gedrückte STRG-Taste). Im Suchfeld (links über der Dokumentenliste wird der erzeugte Suchausdruck automatisch eingefügt und es werden nur die Dokumente gewählt, die auf den Suchausdruck passen.
Mehr

Unterstützung eingeworben – Vielen Dank an Xamarin

Heute geht ein großes Dankeschön an die Firma Xamarin für die Unterstüzung meines Promotionsprojekts. Mit den Tools von Xamarin ist es möglich, C#-Programme auf mehrere Plattformen wie z.B. Android oder iOS zu portieren. Wie sinnvoll das ist, lässt sich jetzt noch nicht mit Bestimmtheit sagen, aber so lässt sich vieles leichter testen. Dankeschön!

Mehr

CorpusExplorer – Miniupdate 2014/10.2

Zweites Oktober-Update (10.2) für den CorpusExplorer. Was wurde geändert:

  1. Die Erkennung von Datumsangaben wurde verbessert. Dies kommt der Metadatenanalyse sehr zugute.
  2. Der unspezifische Begriff: „Kollokator“ wurde an den entsprechenden Stellen durch den passenderen Begriff „Kookkurrenz“ ersetzt um Verwirrungen zu vermeiden.  Vielen Dank an Sina Lautenschläger für den Hinweis.
Mehr

CorpusExplorer – Miniupdate 2014/10

Ein neues Mini-Update für den CorpusExplorer steht bereit. Dieses behebt neben einigen kleineren Fehlern ein Update/Installationsproblem für Windows 8. Perl wird ab jetzt via UAC installiert und läuft somit wesentlich stabiler.

Mehr

CorpusExplorer – Miniupdate 2014/09

Die September Version des CorpusExplorers enthält folgende Änderungen / Korrekturen:

  • Die Suchfunktion wurde verbessert. Die Ergebnisse werden nun noch schneller gefunden.
  • Suchanfragen können nun für Layer formuliert werden, die Sonderzeichen und/oder Leerzeichen im Namen (Layernamen) enthalten.
  • Sonstige Korrekturen (9) und Performanceverbesserungen (2).
Mehr

#LinguRätsel – Alle Lösungen

Lösungen für die #LinguRätsel

  1. Arzneimittel & Kinder
  2. Gegenmaßnahmen, Auftreten & Nebenwirkungen
  3. Arzneimittel & Arztes
  4. Risiken, Nebenwirkungen, Arzt & Apotheker
  5. Alkohol & [Arzneimittel]
  6. Nebenwirkungen, Patienten, Behandlung & [Arzneimittel]
  7. Infektionen, [Arzneimittel] & Beschwerden
  8. [Arzneimittel], Temperatur, [Arzneimittel] & Originalverpackung
Mehr

Folge mir auf Twitter