Gepostet von Jan Oliver Rüdiger am 2020-08-03 in InAppNote, Vorträge | Kommentare deaktiviert für Summer School (RUB Bochum) – 24. bis 28. August 2020: „tl;dr“ Too long; didn’t read (?) Große Textmengen computergestützt analysieren
Die Summer School beschäftigt sich mit computergestützten Verfahren, um große Mengen digitaler Texte, wie z. B. Internet-Blogs, Social Media-Einträge oder twitter Posts, zu extrahieren (Web Scraping), zu analysieren und für empirischen Forschungsprojekte und Abschlussarbeiten zu nutzen. Von korpuslinguistischen Verfahren (Frequenz- und Kollokationsanalysen) bis zu Machine Learning-Algorithmen werden methodische Ansätze aus vielfältigen Disziplinen zusammengebracht und aus der jeweils fachwissenschaftlichen Sicht diskutiert und in Hands-on Sessions in kleinen Gruppen an konkreten Fragestellungen praktisch eingeübt. Die Ergebnisse werden abschließend im Plenum präsentiert und diskutiert. Zur Vorbereitung der Summer School werden den Studierenden 1-2 tägige Workshops angeboten, um sich mit den theoretischen Grundlagen (Lektüre) und den erforderlichen Software-Tools Vertraut zu machen.
mehr
Gepostet von Jan Oliver Rüdiger am 2019-11-13 in InAppNote, Vorträge | Kommentare deaktiviert für Vortrag am 25.11.2019: „Erstellen und Erschließen von Korpusdaten mittels CorpusExplorer“ im Rahmen des „Digillu-Workshop: Zusammenstellung und Erschließung von Korpusdaten“ an der BBAW
Methoden zur Zusammenstellung und Erschließung von Texten werden nicht nur in der Linguistik, sondern allgemein in den Geisteswissenschaften und jenseits von fachlichen Grenzen vielseitig eingesetzt, nicht zuletzt seit dem empirical turn. Ohne maschinell gestützte Herangehensweisen sind manche Textsammlungen nicht mehr produktiv für die Forschung zu greifen, zu überprüfen oder zu durchleuchten. Es wird nicht mehr nur gelesen, es wird immer häufiger auch eingelesen, wobei diese Entwicklung und die damit einhergehenden Denkverfahren, Arbeitsschritte und Standards hinterfragt und eingeordnet werden sollten.
Der am 25.11. an der BBAW stattfindende Workshop bietet eine interdisziplinäre, mehrsprachige Bühne für einen wissenschaftlich fundierten Austausch. Im Blickpunkt stehen verschiedene Prozesse des Lesens, zum Beispiel die Erfassung von Keilschrift und Frakturschrift, bis hin zum tatsächlichen Einlesen mithilfe korpus- und computerlinguistischer Werkzeuge. Das breite fachliche Spektrum (u.a. Amerikanistik, Linguistik, Philosophie) und der Fokus auf junge, international aktive Forscher*innen werden dem Workshop ein besonderes Momentum verleihen.
mehr
Gepostet von Jan Oliver Rüdiger am 2019-11-10 in InAppNote, Vorträge | Kommentare deaktiviert für Vortrag am 19.11.2019: „Was heißt und zu welchem Ende studiert man Korpuslinguistik?“ im Rahmen der „Ringvorlesung: Sprache und Kommunikation“ an der Universität Siegen
In dieser Ringvorlesung haben Sie die Möglichkeit, zahlreiche DozentInnen aus der Anglistik, der Germanistik und der Romanistik kennenzulernen. Sie werden Ihnen zentrale Bereiche aus der Linguistik und der Sprachlehr-/lernforschung vorstellen.
Eine Liste der DozentInnen und Themen sehen Sie unten..
Das Material zur Ringvorlesung finden Sie auf der Lernplattform Moodle (http://moodle.uni-siegen.de) – für den Zugriff ist ein ZIMT-Benutzerkonto (studentische E-Mail Adresse) erforderlich (für die Veranstaltung benötigen Sie kein gesondertes Passwort).
Bitte beachten Sie für die abzugegebenden Aufgaben die technisch terminierten Einreichungsfristen in moodle.
Die Dokumente, die Sie hochladen, sollten – sofern von den Dozierenden nicht anders verlangt – entweder im pdf-Format (bei Libre/Open Office können Sie diese z.B. aus dem Dokument erstellen) oder als doc-Datei (altes Word-Format) vorliegen und müssen folgende Benennung aufweisen: „Dozentennachname – Matrikelnummer“. Zudem müssen Sie in den Dokumenten selbst Ihren Namen und Ihre Matrikelnummer angeben.
Um erfolgreich an der Ringvorlesung teilzunehmen, müssen insgesamt drei schriftliche Arbeiten nach je einem Drittel der Veranstaltung zu einem der Sitzungstermine im vorangegangenen Veranstaltungsdrittel elektronisch via moodle abgegeben werden. Jede/r DozentIn, wird dazu eine Aufgabe formulieren.
Die Abgabefrist für die Aufgaben endet je eine Woche nach dem Veranstaltungsdrittel und eine spätere Abgabe ist nicht möglich. Ggf. verlangen einzelne Dozierende eine nicht-elektronische Abgabe. Darauf wird aber dann von diesen explizit zu dem Veranstaltungstermin hingewiesen. An der Abgabefrist ändert sich dann nichts, aber zur Abgabe müssen Sie dann die Postfächer der jeweiligen Dozierenden nutzen. Bei allen anderen Dozierenden ist ausschließlich die elektronische Einreichung via moodle möglich.
Für die elektronische Noteneintragung müssen Sie sich zu gegebener Zeit (siehe Erinnerungsmail seitens der Fakultät) in unisono für die Studienleistung anmelden.
Es müssen min. 2 von 3 Aufgaben bestanden sein. Wenn 2 Aufgaben nicht bestanden wurden (das steht bis zum Ende des Semesters fest), besteht die Möglichkeit, eine der beiden Aufgaben einmalig zu überarbeiten. Diese Überarbeitung muss bzgl. Inhalt, Abgabetermin und Abgabeform mit der/dem jeweiligen Dozentin/Dozenten abgesprochen werden. Sollte die Aufgabe auch nach dieser Überarbeitung nicht bestanden sein (oder von Beginn an alle 3 Aufgaben nicht bestanden sein), ist die Veranstaltung insgesamt nicht bestanden und muss in einem späteren Wintersemester wiederholt werden. (Die freiwillige Abgabe von mehr als 3 Aufgaben hat keinen positiven Einfluss auf die Benotung; es wird je nur die erste Aufgabe des jeweiligen Veranstaltungsdrittels gewertet; zudem ist keine Überarbeitung von mehr als einer Aufgabe möglich.)
Plagiierte Arbeiten (z.B. von KommilitonInnen abgeschriebene Aufgabenbearbeitungen) führen bei allen (!) daran Beteiligten zu einem Nichtbestehen („n.b.“). Die Ringvorlesung gilt damit als nicht bestanden und kann frühestens in einem späteren Wintersemester wiederholt werden.
Eine Liste (ohne Namen, Matrikelnummer-sortiert) mit den bereits bewerteten Aufgaben wird regelmäßig aktualisiert (sobald Noten mehrerer DozentInnen vorliegen) in moodle hochgeladen.
Selbstverständlich können Sie, wenn Sie Fragen zum Thema und/oder zur Benotung haben, die jeweiligen DozentInnen in der Sprechstunde aufsuchen (bitte beachten Sie dafür ggf. im Vorfeld zu vereinbarende Gesprächstermine je nach DozentIn).
Falls Sie noch Fragen haben: In der ersten Sitzung werden Ihnen die Modalitäten der Veranstaltung genau erläutert.
mehr
Gepostet von Jan Oliver Rüdiger am 2019-10-30 in InAppNote, Vorträge | Kommentare deaktiviert für Vortrag: „Maschinelle Sprachverarbeitung in der Diskursanalyse – Ein Überblick“ im Rahmen der „Ringvorlesung: Kommunikative Strategien des Politischen – Einblicke in die computergestützte Diskursforschung“ (Universität Siegen)
Die Entwicklung neuer Forschungsmethoden in der Korpus- und Computerlinguistik, Sprachinformatik oder auch in neueren Varianten der Medienwissenschaft erlauben uns heute die induktive Auswertung großer Datenmengen (mehrere Tausend bis Millionen von Texten), etwa zur Beschreibung von Sprachgebrauchsmustern, massenmedialen Images oder sozialen Netzwerken. Die Ergebnisse dieser algorithmisierten Forschung finden ihrerseits Anwendung in verschiedenen Bereichen, etwa in der Mensch-Computer-Interaktion (z.B. mit Einsatz von Sprachassistenten in immer mehr Haushalten und Gerätekategorien), in der automatisierten Erkennung von „Spam“/“Junk“-Nachrichten oder „Hatespeech“, in digitalen Nachschlagewerken oder Expertensystemen zur Optimierung von Gesetzesentwürfen in der Legislative. Nicht nur für angehende Geistes-, Sozial- und KulturwissenschaftlerInnen innerhalb der Universität, auch in der Alltagspraxis von Unternehmen und Verwaltung wird es zukünftig immer wichtiger, Kompetenzen zum Umgang mit algorithmisierter Sprachverarbeitung aufzubauen. Dies erfordert ein grundlegendes Verständnis der Funktionsweise und der Grenzen ihres Einsatzes, um die Methoden kritisch zu hinterfragen und aktiv zur Weiterentwicklung maschineller Sprachverarbeitung beizutragen.
Besonders deutlich wird dies in der computergestützten Kommunikation öffentlicher Diskurse: Ist es wirklich möglich, Wahlen mit „Chatbots“ zu beeinflussen? Wie funktioniert User-Tracking, staatliche Überwachung oder die automatisierte Auswahl von Job-BewerberInnen mithilfe algorithmisierter Sprachanalyse und welche Risiken ergeben sich daraus für den demokratischen Alltag des Einzelnen? Oder umgekehrt: Wie lassen sich computergestützte Analysemethoden fruchtbar machen, um die Verfasstheit von Diskursen – die Denk- und Machtmuster – in digitalisierten Gesellschaften zu untersuchen und Formen strategischer Kommunikation (von verdeckter Werbung, über Fake-News und Lobbyismus bis hin zu Propaganda) sichtbar(er) zu machen?
mehr
Gepostet von Jan Oliver Rüdiger am 2019-06-06 in InAppNote, Vorträge | Kommentare deaktiviert für Workshop 12.06.2019 – JLU Gießen – „CorpusExplorer“
Am 12.06.2019 gibt es an der JLU Gießen einen ganztägigen CorpusExplorer-Workshop. Die Teilnahme ist kostenfrei nach vorheriger Anmeldung (per E-Mail).
mehr
Gepostet von Jan Oliver Rüdiger am 2019-02-15 in InAppNote, Vorträge | Kommentare deaktiviert für Workshop 19.03./20.02.2019 – „Information Extraction aus frühneuhochdeutschen Texten“
mehr
Gepostet von Jan Oliver Rüdiger am 2018-02-21 in CorpusExplorer, Seminar, Vorträge | Kommentare deaktiviert für DHd2018 – CorpusExplorer Workshop
mehr
Gepostet von Jan Oliver Rüdiger am 2014-08-07 in Rätsel | Kommentare deaktiviert für #LinguRätsel – Alle Lösungen
mehr
Gepostet von Jan Oliver Rüdiger am 2014-08-06 in Rätsel | Kommentare deaktiviert für #LinguRätsel #08 – Lagern Sie NOMEN bei normaler NOMEN und bewahren Sie NOMEN in NOMEN auf.
mehr
Gepostet von Jan Oliver Rüdiger am 2014-08-05 in Rätsel | Kommentare deaktiviert für #LinguRätsel #07 – Bei wiederkehrenden NOMEN sollte mit der Einnahme von NOMEN bei ersten NOMEN erneut begonnen werden.
mehr