Notes – das sind meine persönlichen Notizen zur Sprachwissenschaft, gemischt mit Quellcode, Ideen und Dingen, die mich sonst so bewegen. Der fragmentarische Charakter einer Sammelbox ist daher gewollt. Bilder, Fotos und Illustrationen sind nicht nur bunt, sondern visualisieren mein Denken. Daher ist der Blog nicht nur Sammelbox, sondern auch im ursprünglichen Sinn ein gedankliches Tagebuch.
CorpusExplorer – Ein Programm, das aus meiner Magisterarbeit erwachsen ist und im aktuellen Promotionsprojekt weiterentwickelt wird. Der CorpusExplorer vereint eine Vielzahl bekannter computer-/korpuslinguistischer Tools. Er vereinfacht das Arbeiten mit großen Textmengen und erlaubt es, Korpora als Wissensquelle neu zu entdecken … Das Ziel: Sprache und Technik ein Stück näher zusammenzubringen.
Fediverse / Mastodon / eX – Sie können diesen Blog im Fedivers – also z. B. auch in Mastodon – folgen. Nutzen Sie dazu bitte die folgende Adresse:
https://notes.jan-oliver-ruediger.de/@me
oder:
@me@notes.jan-oliver-ruediger.de
Bitte beachten Sie: Nachdem Sie dem Blog folgen, erhalten Sie alle neuen Beiträge in ihrer Timeline. Ältere Beiträge werden i. d. R. von Mastodon nicht angezeigt.
Workshop 12.06.2019 – JLU Gießen – „CorpusExplorer“
Am 12.06.2019 gibt es an der JLU Gießen einen ganztägigen CorpusExplorer-Workshop. Die Teilnahme ist kostenfrei nach vorheriger Anmeldung (per E-Mail).
Neues Add-on: DTA::CAB
DTA::CAB ist ein orthographischer Normalisierer für historische Sprachstufen des Deutschen (entwickelt von Bryan Jurish, Zentrum für digitale Lexikographie, Berlin-Brandenburgische Akademie der Wissenschaften). Mit diesem Add-on können Sie frühneuhochdeutsche und...
CorpusExplorer (Update Q2 2019)
Das Mai Update des CorpusExplorers bringt einige Verbesserungen und Korrekturen. Neu: In Kooperation mit Bryan Jurish wird es ein Add-on für DTA::CAB geben. Dazu am Wochenende mehr. Verbesserungen: Die Performance des TreeTagger-Moduls wurde verbessert. Das...
Repository „notesjor/ExperimentalChatGame“ auf GitHub veröffentlicht
"notesjor/ExperimentalChatGame" By notesjor Plattform zum Erstellen von interaktiven Chat-Games (Universität Siegen / Germanistik / Einführung in die Programmierung für Linguist*innen) May 16, 2019 at 10:15AM via GitHub http://bit.ly/2VGltnd
CorpusExplorer (Update Q1 2019 + März SP1)
Heute wurde ein kleines Zusatzupdate (SP) für den CorpusExplorer veröffentlicht. Folgendes wird dadurch verbessert: Unterstützung für CoraXML 0.8 und CoraXML 1.0 - Damit können Dateien von https://www.linguistics.rub.de/comphist/resources/cora/index.html geöffnet...
CorpusExplorer (Update Q1 2019)
Es ist soweit - ein großes Update wartet auf alle Nutzer*innen des CorpusExplorers. Hier eine Zusammenfassung der Neuerungen/Verbesserungen: Eine persönliche Angelegenheit zuerst: Seit mehreren Versionen unterstützen mich viele Nutzer*innen bei der Entwicklung, indem...
Workshop 19.03./20.02.2019 – „Information Extraction aus frühneuhochdeutschen Texten“
Die automatisierte Erschließung historischer Texte, deren Sprache und Orthografie noch keiner Standardisierung unterliegt, ist schwierig. Am Zentrum für Informationsmodellierung laufen zur Zeit drei Projekte, die sprachlich im Frühneuhochdeutschen angesiedelt sind:...
Repository „notesjor/OpenSourceTelemetrie“ auf GitHub veröffentlicht
"notesjor/OpenSourceTelemetrie" By notesjor Client/Server infrastructure to collect telemetric data - OpenSource and privacy friendly (self hosted) January 3, 2019 at 03:06PM via GitHub http://bit.ly/2DCT31F
CorpusExplorer (XMAS Update Dez/Jan 2018/19)
Erstmal wünsche ich allen Nutzer*innen des CorpusExplorers frohe Feiertage und einen guten Rutsch ins Jahr 2019. Die letzten Tage des Jahres nutze ich, um ein paar Dinge im CorpusExplorer zu verbessert. Folgendes hat sich getan: Übersichtsanzeige wurde verbessert....
CorpusExplorer (Update Nov/Dez 2018) – Reguläre Ausdrücke und CutOff-Phrasen
Auf einem Workshop in Würzburg (2018-11-09) baten mich mehrere Teilnehmer*innen, dass ich Reguläre Ausdrücke (Regular Expression - kurz RegEx) im CorpusExplorer ermöglichen soll. Bisher habe ich RegEx vermieden - oder zumindest in der Oberfläche gut versteckt. Auch...