Notes – das sind meine persönlichen Notizen zur Sprachwissenschaft, gemischt mit Quellcode, Ideen und Dingen, die mich sonst so bewegen. Der fragmentarische Charakter einer Sammelbox ist daher gewollt. Bilder, Fotos und Illustrationen sind nicht nur bunt, sondern visualisieren mein Denken. Daher ist der Blog nicht nur Sammelbox, sondern auch im ursprünglichen Sinn ein gedankliches Tagebuch.

CorpusExplorer – Ein Programm, das aus meiner Magisterarbeit erwachsen ist und im aktuellen Promotionsprojekt weiterentwickelt wird. Der CorpusExplorer vereint eine Vielzahl bekannter computer-/korpuslinguistischer Tools. Er vereinfacht das Arbeiten mit großen Textmengen und erlaubt es, Korpora als Wissensquelle neu zu entdecken … Das Ziel: Sprache und Technik ein Stück näher zusammenzubringen.

Korpus: Deutscher Bundestag Plenarprotokolle

Die anstehende DHd2018 (Köln) ist ein guter Anlass eine bestehende Korpus-Ressource zu veröffentlichen. Der Deutsche Bundestag veröffentlicht unter https://www.bundestag.de/service/opendata die Plenarprotokolle OpenAccess in einem sehr rudimentären XML-Format. Die...

mehr lesen

CorpusExplorer (November Update 2017)

So langsam gewöhnt sich der CorpusExplorer an einen dreimonatigen Update-Zyklus. Über einige ausgewählte Funktionen wird es in den kommenden Tagen noch zusätzliche Blog-Beiträge geben. Neue Funktionen: Unterstützung von anderen Encodings/Codepages als UTF-8. Dies kann...

mehr lesen

CorpusExplorer (August Update 2017)

Das August-Update bringt nicht nur kleine Verbesserungen sondern auch drei große Neuerungen mit sich. 1. Öffnung der Konfigurations-Schnittstelle / Abschaltung der Advanced/PC-Poolraum Edition Bisher gab es drei Versionen für den CorpusExplorer - Zukünftig nur noch...

mehr lesen