Veranstaltungen

Digitale Analyse großer Textkorpora (DAGT)

Hate-Speech-Erkennung auf Telegram? Metaphernanalyse in Superheldenfilmen? Automatisierte Transkription und Annotation historischer Texte? Die Lieblings-Emojis der Top-Influencer:innen auf Instagram? Wenn du Interesse an solchen Themen hast, dann ist dieses Seminar genau richtig für dich! Hier lernst du ohne Druck und ohne Vorkenntnisse die Programmiersprache Python kennen und erhältst Einblicke in Forschungsgebiete der Digital Humanities.

Die digitale Analyse großer Textkorpora zählt zu den wichtigsten Methoden der Digital Humanities. Die Korpusanalyse ermöglicht die Untersuchung von unterschiedlichsten Texten und Textsammlungen vor dem Hintergrund verschiedener disziplinärer Ausrichtungen – linguistisch, literaturwissenschaftlich, kulturwissenschaftlich – und bietet darüber hinaus zahlreiche Transfer- und Anwendungsoptionen: forensische Verwendung, soziologische Analyse, Politik- und Sprachberatung u.v.m.

Das Modul besteht aus drei Teilen:
  • 2-wöchiges Blockseminar Python zum Erwerb grundlegender Programmierkenntnisse
    16.–20.09.2024 und 23.–27.09.2024, jeweils 10–16 Uhr
  • Inputsitzungen mit Hands-on-Übungsphasen
    WiSe 2023/24, 14-tägig freitags 10:15–13:15 Uhr, Beginn 25.10.2024
  • Forschungs- oder Praxisprojektphase (SoSe 2025), in der du unter Anleitung eigenständig arbeitest. (Optional)
Flyer zum Download: DAGT_Flyer_WiSe24_SoSe25.pdf

Anrechnungsmöglichkeiten

Das Modul kann kreditiert werden:
  • NEU: Die ersten beiden Teile (Programmierkurs und Inputsitzungen) können im Optionalbereich als 5-CP-Modul kreditiert werden
  • In allen Fächern der Philologie (außer VAMoS) und in der Sozialwissenschaft im Master (8-10 CP)

Für weitere Anrechnungsmöglichkeiten wendet euch bitte an stephanie.heimgartner@rub.de und/oder eure Studienfachberatung, bei inhaltlichen Fragen an oliver.deck@rub.de.

Anmeldung

Anmeldung ab sofort über eCampus, Veranstaltungsnr. 050010

Du lernst in diesem Modul:

  • die für das eigene Fach relevanten Methoden und digitalen Tools im Umgang mit großen Korpora und du erhältst Einblick in die Fragestellungen und Verfahrensweisen benachbarter Fächer.
  • Du lernst von Grund auf (keine Vorkenntnisse nötig!) Anwendungskenntnisse in der Programmiersprache Python mit Fokus auf korpusanalytische Verfahren und du wirst vertraut mit der Nutzung von relevanten Python-Bibliotheken (Spacy, NLTK, Pandas, etc.).
  • Du lernst verschiedene Datenerhebungs-, -aufbereitungs- und -analyseverfahren kennen: z.B. Webscraping, Tokenisierung, Annotation, Kookkurrenz-, Frequenzanalyse.
  • Du lernst Bearbeitungsmöglichkeiten für komplexe Korpora kennen (z.B. Transkription oraler oder sprachlich heterogener Korpora, multimodale Korpora, Übersetzung).

Zielgruppe

Das Modul ist geeignet für:

  • Studierende im M.A. und im fortgeschrittenen B.A. (inklusive Projektteil)
  • Studierende im B.A. über den Optionalbereich

Zeitrahmen und Inhalte

Wintersemester 2024/25

Block-Workshop Python (Programmiersprache)

  • 16.–20.09.2024 und 23.–27.09.2024 jeweils 10:00–16:00 Uhr

Ab dem 25.10.2024 freitags (14-tägig), 10.15–13.15 Uhr Blocktermine mit Input von Forschenden der Fakultät und Hands-on-Phasen mit Programmieraufgaben:

  • 25.10.2024
  • 08.11.2024
  • 22.11.2024
  • 06.12.2024
  • 20.12.2024
  • 17.01.2025
  • 31.01.2025

Sommersemester 2025 (nicht für Studierende aus dem Optionalbereich)

  • Arbeit an den Forschungs- oder Praxisvorhaben
  • Regelmäßige Feedbackgespräche mit betreuenden Lehrenden
  • Juli 2025: Präsentation der Abschlussergebnisse der Projekte