Gepostet im April, 2013

CorpusExplorer: Neuerungen in der offiziellen Version 1.0

CorpusExplorer (Neue Funktion in Version 1.0)

 Neuerungen Installation-/Einrichtungsassistent:

  • Es ist ab jetzt möglich, nur den CorpusExplorer zu installieren (ohne Perl und TreeTagger).
  • Ab jetzt können die Sprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch und Niederländisch ganz einfach per Klick eingerichtet werden. Die Sprachen werden getrennt voneinander installiert. Das spart Zeit und Platz.
    Video (ab 0:48): Sprachen installieren

 Neuerungen Hauptprogramm:

  • Für die offizielle neue Version wurde ein buntes Iconset gewählt.
  • In der Vorversion war es noch nötig, die Sprache auf dem Startbildschirm zu wählen (Beta-Funktion), dies entfällt. Dafür erscheint beim Erstellen eines neuen Korpus ein zusätzlicher Abfragedialog in dem die Korpussprache gewählt werden kann. Über diesen Dialog können auch nachträglich weitere Sprachen installiert werden.
    Video: Neuen Korpus erstellen
  • Die Suche wurde weiter verbessert. Sie bietet neben der Meta-Daten-Abfrage nun auch die Möglichkeit alle Datenlayer im Volltext zu durchsuchen.
    Video: Neue Suche und Suchassistent
  • Korpora lassen sich nun in das XML- bzw. XML-TEI-Format exportieren.
    Video (ab 2:50): Export in XML
  • Korrektur-, Bereinigungs- und Druckfunktionen sind nun in fast allen Modulen verfügbar.
  • Analysefunktionen wurde im Schnitt um ca. Faktor 3,1 beschleunigt.
  • Projekte die den CorpusExplorer einsetzen und aktiv in der Weiterentwicklung unterstützen, erhalten kostenlos eine spezielle Version (Branding mit Projektlogo und Link zu Webseite) sowie die Möglichkeit über den Einrichtungsassistenten eigene Korpora und Projekteinstellungen zu verteilen.
Mehr

CorpusExplorer (Hilfe-Video): CorpusExplorer goes Wordle.net

Hinweis: Diese Funktion wurde aus der aktuellen CorpusExplorer-Version entfernt und wird auch in Zukunft nicht mehr zur Verfügung stehen. Auf [dieser Seite] erfahren Sie, wie wordle auch in Zukunft mit dem CorpusExplorer genutzt werden kann.
Hinweis: Mit dem Update 2014/10.2 wurde eine einheitliche und korrekte Trennung der Begriffe Kollokatoren/Kookkurrenzen eingeführt. Daher kann es vorübergehend zu nicht identischen Bezeichnungen im Video/CorpusExplorer kommen. Der dargestellte Ablauf/Funktionsumfang ist aber weiterhin identisch, daher orientieren Sie sich bitte an der im Video gezeigten Oberfläche. Ich bitte Sie die entstandenen Unannehmlichkeiten zu entschuldigen und mir evtl. noch ausstehende Bezeichnungsfehler zu melden.

Wir alle lieben wordle – wir alle hassen wordle – jedenfalls wäre so manche Publikation weniger bunt ohne die bunten Bildchen von wordle.net… Der CorpusExplorer kann die Kookkurrenzauswertung direkt an die Webseite von wordle senden. Stellen Sie doch als Kommentar dieses Beitrags ein schickes wordle-Wölkchen ein, ich würde mich freuen.

Mehr

CorpusExplorer (Hilfe-Video): Suchfunktion und Suchassistent

Aufgrund der zahlreichen Rückmeldungen zum CorpusExplorer und zur Magisterarbeit ist aus der anfangs kleinen Suche (Quellcode: Q&D – Quick&Dirty) eine sehr effiziente Suchmaschine geworden, deren Funktion in Zukunft weiter ausgebaut werden. Die Suchsyntax ähnelt CWB/CQP bzw. ANNIS. Aber keine Angst, hier gibt es nichts zu lernen, ein bequemer Assistent nimmt einem das Schreiben des Query (Abfrage) ab – let’s rock.

Mehr

CorpusExplorer (Hilfe-Video): Oppositionswörter kontrastieren

Hinweis: Mit dem Update 2014/10.2 wurde eine einheitliche und korrekte Trennung der Begriffe Kollokatoren/Kookkurrenzen eingeführt. Daher kann es vorübergehend zu nicht identischen Bezeichnungen im Video/CorpusExplorer kommen. Der dargestellte Ablauf/Funktionsumfang ist aber weiterhin identisch, daher orientieren Sie sich bitte an der im Video gezeigten Oberfläche. Ich bitte Sie die entstandenen Unannehmlichkeiten zu entschuldigen und mir evtl. noch ausstehende Bezeichnungsfehler zu melden.

Während meiner Magisterarbeit stieß ich auf eine interessante Visualisierung von Jeff Clark. Tweets (Beiträge von Twitter) dienen als Datenbasis für eine Kookkurrenzanalyse die zwei Pole kennt. Leider besteht keine Möglichkeit das Werkzeug von J. Clark anderweitig einzusetzen. So entwickelte ich eine gleichwertig, wenn vielleicht auch nicht ganz so schöne, aber praktische Analyseform.

Tipp: Nicht nur Oppositionswörter lassen sich mit dem Modul analysieren. Auch sehr spannend sind Personenbeschreibungen (Angela / Peer).

Mehr

CorpusExplorer (Hilfe-Video): Kookurrenzen

Hinweis: Mit dem Update 2014/10.2 wurde eine einheitliche und korrekte Trennung der Begriffe Kollokatoren/Kookkurrenzen eingeführt. Daher kann es vorübergehend zu nicht identischen Bezeichnungen im Video/CorpusExplorer kommen. Der dargestellte Ablauf/Funktionsumfang ist aber weiterhin identisch, daher orientieren Sie sich bitte an der im Video gezeigten Oberfläche. Ich bitte Sie die entstandenen Unannehmlichkeiten zu entschuldigen und mir evtl. noch ausstehende Bezeichnungsfehler zu melden.

Liste mit Kookkurrenzen erstellen, schnell und einfach.

Mehr

CorpusExplorer (Hilfe-Video): Graphen, Graphen und nochmals Graphen

Sie sind hübsch und keine modern wirkende („wollende“) Publikation kommt ohne sie aus… je komplizierter… je größer… sein wir ehrlich, ein Spielzeug für fReAx… Party für alle!!! – Diese Modul macht es möglich Graphen sinnvoll zu nutzen und zu analysieren. Selbst rekursiv…

Nachdem ich in meiner Magisterarbeit GraphViz an die Grenzen des Möglichen gebracht habe, mit Grafiken jenseits der 2GB-Grenzen – jetzt ein Tool, dass wirklich große Graphen handhabbar macht und mit groß meine ich wirklich groß.

Mehr

CorpusExplorer (Hilfe-Video): Dokumentenähnlichkeit

Wie ähnlich sind sich zwei oder mehr Dokumente? – Eine Frage die nicht nur bei der Plagiatsforschung eine Rolle spielt. Zeitungskorpora sollten möglichst redundanzfrei sein. Doppelt Meldungen z. B. einfach abgedruckte Agenturmeldungen können das Analysebild verzerren. Das Modul zum auffinden von ähnlichen Dokumenten schafft Abhilfe.

Mehr

CorpusExplorer (Hilfe-Video): Annotieren

Hinweis: Ab dem „Juni 2014 Release“ ist es vorübergehend nicht möglich die Annotation zu ändern. Dieses Problem wird bis September 2014 behoben.

Der CorpusExplorer nutzt den TreeTagger von Helmut Schmid zur automatisch Textannotierung. Nachträgliche Korrekturen sind mit dem CorpusExplorer problemlos möglich, auch das Hinterlegen eigener Annotationen ist ein Kinderspiel.
Die Datenlayer genannten Schichten ermöglichen ein sauber getrenntes und thematisch organisiertes Arbeiten.

Mehr

CorpusExplorer (Hilfe-Video): Ein bestehendes Korpus laden

Seit 2014/06 – Gibt es eine kleine Änderung im Ablauf dieses Videos. [Bitte lesen Sie dazu diesen Hinweis].

Haben Sie einmal ein Korpus erzeugt/umgewandelt so können Sie es jederzeit wieder im CorpusExplorer laden, ohne es erneut zu taggen. Alle je erzeugten Korpora werden in ihren „Eigenen Dokumenten“ unter „CorpusExplorer/MeineKorpora“ abgelegt.

Mehr

Er ist da: CorpusExplorer v1.0

Mit großer Freude veröffentliche ich heute die erste OFFIZIELLE Version des CorpusExplorers. Diese Version darf nun offiziell und kostenfrei in Lehre und Forschung eingesetzt werden.

Link zum Download:

http://bitcut.de/app/ce

HINWEIS: Die Installation per InternetExplorer wird angeraten, da der IE benötigte Windows-Komponenten automatisch installieren kann.

Alle die bisher die INOFFIZIELLE Version genutzt haben, erhalten diese Version automatisch über die Update-Funktion.

Mehr

TED – Mark Pagel: How language transformed humanity

Von der Werkzeug-Metapher zur „visueller Diebstahl“… Vergleiche hierzu auch Tomaso (Lügen als evolutionäre Stufe) sowie „Sprache als Kooperationsmittel“. Der Vortrag enthält auch einen sehr interessanten amerikanischen Blick auf die Europäische Union, der vielleicht ökonomische richtig sein mag, aber grauenhaft unter dem Aspekt der Sprachdiversität (vergl. auch http://www.bpb.de/internationales/europa/europa-kontrovers/38167/standpunkt-krista-segermann).

Mehr

Neuer Webblog

„Der Webblog ist tot, es lebe der Webblog“ – Der alte Blog zur Magisterarbeit wurde soeben abgeschaltet. Alle alten Artikel sind ab jetzt hier zu finden. Die Umstellung wird aber noch einige Tage in Anspruch nehmen. Einige Artikel (Exzerpte) sind per Passwort geschützt. Das Passwort kann bei mir per E-Mail erfragt werden.

Mehr

Folge mir auf Twitter