Notes – das sind meine persönlichen Notizen zur Sprachwissenschaft, gemischt mit Quellcode, Ideen und Dingen, die mich sonst so bewegen. Der fragmentarische Charakter einer Sammelbox ist daher gewollt. Bilder, Fotos und Illustrationen sind nicht nur bunt, sondern visualisieren mein Denken. Daher ist der Blog nicht nur Sammelbox, sondern auch im ursprünglichen Sinn ein gedankliches Tagebuch.
CorpusExplorer – Ein Programm, das aus meiner Magisterarbeit erwachsen ist und im aktuellen Promotionsprojekt weiterentwickelt wird. Der CorpusExplorer vereint eine Vielzahl bekannter computer-/korpuslinguistischer Tools. Er vereinfacht das Arbeiten mit großen Textmengen und erlaubt es, Korpora als Wissensquelle neu zu entdecken … Das Ziel: Sprache und Technik ein Stück näher zusammenzubringen.
Fediverse / Mastodon / eX – Sie können diesen Blog im Fedivers – also z. B. auch in Mastodon – folgen. Nutzen Sie dazu bitte die folgende Adresse:
https://notes.jan-oliver-ruediger.de/@me
oder:
@me@notes.jan-oliver-ruediger.de
Bitte beachten Sie: Nachdem Sie dem Blog folgen, erhalten Sie alle neuen Beiträge in ihrer Timeline. Ältere Beiträge werden i. d. R. von Mastodon nicht angezeigt.
CorpusExplorer (Update Aug/Sep/Okt 2018) – Favoriten, Formate, Flexibilität und neue Funktionen
Das August/September/Oktober Update des CorpusExploreres bringt eine ganze Liste neuer Funktionen mit sich. Einige vereinfachen die Bedienung, einige erlauben zusätzliche Dateiformate und andere bringen neue Funktionen für Nutzer*innen und Entwickler*innen. Auf...
Repository „notesjor/WatsonWebserver“ auf GitHub veröffentlicht
"notesjor/WatsonWebserver" By notesjor A simple C# async web server for processing RESTful HTTP/HTTPS requests. September 14, 2018 at 06:39PM via GitHub https://ift.tt/2NLYzpY
CorpusExplorer (Update Juni/Juli 2018) – Sentiment-Detection, Layer wählbar, verbesserte Analysen
Das Update für Juni/Juli 2018 bringt folgende Neuerungen und Verbesserungen mit sich: Sentiment-Detection: Unter den Spezialfunktionen gibt es jetzt das neue Analysemodul "Sentiment Detection". Damit lassen sich vordefinierte SD-Wörterbücher auf ein(en)...
CorpusExplorer (Update Mai 2018)
Folgende Funktionen wurden in der Mai 2018-Version des CorpusExplorers hinzugefügt/verbesser: Neue annotierbare Dateiformate: Deutscher Bundestag Plenarprotokolle OpenAccess Deutscher Bundestag Drucksachen OpenAccess Deutscher Wortschatz Universität Leipzig PostgreSQL...
CorpusExplorer (Update April 2018) – schneller, exportfreudiger & neue Sprachmodelle
Auch wenn erst Ende März ist, so ist das April Update bereits fertig. Neue Funktionen / Verbesserungen: UDPipe - Teil 1: Der CorpusExplorer kann ab jetzt eine bestehende UDPipe inkl. Universal Dependencies Sprachmodelle ansprechen (Herstellerwebseite). UDPipe muss...
Korpus: Deutscher Bundestag Plenarprotokolle
Die anstehende DHd2018 (Köln) ist ein guter Anlass eine bestehende Korpus-Ressource zu veröffentlichen. Der Deutsche Bundestag veröffentlicht unter https://www.bundestag.de/service/opendata die Plenarprotokolle OpenAccess in einem sehr rudimentären XML-Format. Die...
DHd2018 – CorpusExplorer Workshop
Am 26.02.2018 findet im Rahmen der DHd2018 ein Workshop mit dem Titel "CorpusExplorer v2.0 - Seminartauglich in einem halben Tag" statt. Wer schon jetzt einen Blick auf die Workshopinhalte werfen möchte, kann dies...
CorpusExplorer (Dezember Update 2017) – Erster Erfolg durch Telemetrie
Eigentlich war für 2017 kein weiteres Update nach November geplant. Mit dem November Update wurde die neue Telemetrie-Funktion des CorpusExplorers aktiviert. Damit lassen sich Fehler und Performance auf den Rechnern der Nutzer*innen anonym in Echtzeit ermitteln (mehr...
CorpusExplorer (NOV2017) – SQL-Datenbanken / LinqConnect
An dieser Stelle zuerst ein großes Dankeschön für den Projekt-Rabatt von devart für LinqConnect. Im Rahmen des CorpusExplorer-Projekts habe ich viele ORM-Mapper getestet, auch das neue Entity-Framework (Core). Was aber Funktionalität und Flexibilität anbelangt, ist...
Karten-Visualisierungen im CorpusExplorer ganz einfach
Lange habe ich nach einer Lösung gesucht, wie man Karten einfach und effizient im CorpusExplorer integrieren kann. Sowohl kommerzielle als auch OpenSource Lösungen wurden geprüft - von klassischen WinForm- und WPF-Lösungen bis hin zu HTML5/JS. Zwei Dinge störten mich...