Gepostet im Februar, 2018

Korpus: Deutscher Bundestag Plenarprotokolle

Die anstehende DHd2018 (Köln) ist ein guter Anlass eine bestehende Korpus-Ressource zu veröffentlichen. Der Deutsche Bundestag veröffentlicht unter https://www.bundestag.de/service/opendata die Plenarprotokolle OpenAccess in einem sehr rudimentären XML-Format. Die vorhandenen Metadaten wurden extrahiert und der Text wurde korpuslinguistisch aufbereitet. Der Text wurde hierzu bereinigt, und mittels TreeTagger annotiert (POS, Lemma, Phrasen). Da das Korpus sehr umfangreich ist, wurde für jede Wahlperiode ein eigenes Korpus erstellt. Das analysefertige Gesamtkorpus (für den CorpusExplorer) kann unter [Korpora] herunter geladen werden.

Mehr

DHd2018 – CorpusExplorer Workshop

Am 26.02.2018 findet im Rahmen der DHd2018 ein Workshop mit dem Titel „CorpusExplorer v2.0 – Seminartauglich in einem halben Tag“ statt.
Wer schon jetzt einen Blick auf die Workshopinhalte werfen möchte, kann dies unter: https://lernen-mit.jan-oliver-ruediger.de/course/view.php?id=20
Der Workshop ist auf für Nicht-Teilnehmer*innen offen. Man kann sich also auch ohne DHd2018-Teilnahme am Workshopmaterial bedienen.
Anmeldung als Gast ist anonym – das Gast-Passwort lautet: dhd2018
Wer sich über die Webseite registriert (Registrierung nur mit Uni-Mailaccounts möglich), kann sogar den gesamten moodle-Kurs herunterladen (inkl. IMS-Alternative für z. B. BlackBoard oder ILIAS).
Hinweis: Nach der DHd2018 werde ich am Kurs noch einige Ergänzungen vornehmen. Daher lohnt ein erneuter Blick ab 05.03.2018.

Anregungen und Kritik sind immer willkommen.

Mehr

Folge mir auf Twitter