Über Mimotext

Mining and Modeling Text

Interdisziplinäre Anwendungen, informatische Weiterentwicklung, rechtliche Perspektiven (MiMo Text)


Die Wissensgewinnung aus großen, nicht mehr durch einzelne Menschen zu bewältigenden Text- und Datenmengen gewinnt durch die Möglichkeiten der Digitalisierung stetig an Bedeutung. Für die Geisteswissenschaften heißt das insbesondere, dass digitale Volltexte und reichhaltige Metadaten nicht nur verfügbar sein müssen, sondern dies auch in einer Form der Fall sein muss, die den geisteswissenschaftlichen Erkenntnisgewinn fördert.


Ziel des Vorhabens MiMoText ist deshalb der Aufbau eines aus unterschiedlichen Quellen gespeisten Informationsnetzwerks für die Geisteswissenschaften, das durch die Bereitstellung als Linked Open Data nicht nur frei verfügbar und mit anderen Wissensressourcen des Semantic Web verknüpfbar ist, sondern auch neuartige und effiziente Zugriffsmöglichkeiten auf fachwissenschaftliche Informationen bietet. Quellen zur Geschichte des französischen Romans von 1751 bis 1800 stehen im Fokus, wobei auf teils bestehende Volltextdigitalisate (z.B. aus Gallica) zurückgegriffen werden kann.


Als Informationsquellen dienen bibliographische Verzeichnisse, Fachliteratur und Primärtexte. Aus diesen werden zunächst Metadaten, konkrete Texteigenschaften und beschreibende oder wertende Aussagen über relevante Entitäten, wie beispielsweise Autoren und Werke, extrahiert. Dafür müssen quantitative Methoden zur automatischen Textanalyse sowie zur Extraktion und Modellierung von Daten aus umfangreichen Textsammlungen weiter- und teils neu entwickelt werden. Anschließend werden die Informationen in ein Linked Open Data-Format überführt und können untereinander sowie nach außen verknüpft werden. Hinzu tritt von Projektbeginn an die Untersuchung rechtlicher Rahmenbedingungen, um die urheber- und datenschutzrechtliche Konformität von Aufbau und Bereitstellung des Wissensnetzwerks gewährleisten zu können.

Das Projekt wurde von 2019-2023 durch die Forschungsinitiative Rheinland-Pfalz gefördert.

Sprecher des Vorhabens: Prof. Dr. Christof Schöch

Stellvertretende Sprecherin: Prof. Dr. Claudine Moulin

Referenzpublikation: “Smart Modeling for Literary History

Kooperationen

  • Servicezentrum eSciences der Universität Trier
  • Fachinformationsdienst Romanistik
  • FID Germanistik (UB Frankfurt)
  • FID Allgemeine und Vergleichende Literaturwissenschaft (UB Frankfurt)
  • Universitätsbibliothek Trier
  • Verbundprojekt Musterhaftigkeit des Trier Center for Language and Communication
  • Zentrum für Philologie und Digitalität “Kallimachos”
  • Ubiquitous Knowledge Processing Lab, Technische Universität Darmstadt