Topic Modeling Workshop

5. May 2020

Am 12. Mai 2020 von 9:00-12:30 Uhr findet im Rahmen von MiMoText ein
Workshop zum Thema Topic Modeling statt. Der Workshop wird online
stattfinden (über Zoom) und in zwei Sessions geteilt sein, mit einer
Erholungspause in der Mitte (also 9:00-10:30 und 11:00-12:30 Uhr). Anlass
für den Workshop ist, dass Topic Modeling Teil des Methodenrepertoires
in MiMoText sein wird; der Workshop steht aber allen Interessierten offen.

 

Topic Modeling ist ein quantitatives Verfahren der Textanalyse, mit dem
man in größeren Textbeständen wiederkehrende "Themen" (in einem sehr
weiten Sinne) entdecken kann. Die Themen sind dabei als Gruppen von
Wörtern modelliert, die immer wieder in ähnlichen Kontexten auftreten
und zwischen denen eine semantische Beziehung besteht. Neben den "Word
Embeddings" ist Topic Modeling wohl eine der populärsten Methoden in den
Digital Humanities, in denen Prinzipien der distributionellen Semantik
zum Tragen kommen.

 

Der erste Teil des Workshops führt sowohl in die Grundidee des Topic
Modeling ein als auch zumindest ein Stück weit in die Statistik, die
hinter der Methode steht. Der zweite Teil ist dann praxisorientiert und
erläutert, wie Topic Modeling in Python konkret umgesetzt werden kann.
Grundkenntnisse in Python oder einer anderen Programmiersprache sind für
den zweiten Teil auf jeden Fall hilfreich, aber keine Voraussetzung.

 

Bitte melden Sie sich bis zum 7. Mai bei Prof. Schöch an, wenn Sie am Workshop teilnehmen möchten. Auch eine Teilnahme nur am ersten Teil ist möglich.

 

Einige Hinweise vorab:

 

(1) Die Präsentation zum Workshop ist online verfügbar. Die Folien sind
für einen Workshop im Sommer 2019 entstanden und sind auf Englisch, aber
der Workshop wird auf Deutsch stattfinden. Link:
https://christofs.github.io/riga/#/ (online, aktueller) oder
https://www.dropbox.com/s/kt3w5b8lonywchw/Schoech_2019_Topic-Modeling-Riga.pdf?dl=0 (PDF, Stand Juli 2019).

 

(2) Für den praktischen Teil ist etwas Vorbereitung notwendig. Hinweise
dazu finden sich in dem entsprechenden Github-Repository:
https://github.com/dh-trier/topicmodeling. Dort gibt es einerseits
Installationshinweise ("HOWTO"-Datei), außerdem einen Ordner ("test")
mit Hinweisen zum Testen der Installation. Bitte installieren Sie Python
und alle notwendigen Libraries und testen Sie die Installation vor dem
Workshop. Bei Problemen mit der Installation gerne vor dem Workshop per
Email melden!

 

Anmeldung hier