Invited Talk by Marco Büchler

2011/06/10

Title: Text Mining in den eHumanities

Time: Monday, July 11, 2011, 13:00

Location: Room S2|02|B002 (Hochschulstr. 10)

Speaker: Marco Büchler arbeitet seit 2006 als wissenschaftlichen Mitarbeiter am Lehrstuhl fü r Automatische Sprachverarbeitung an der Universität Leipzig. Zwischen April 2008 und März 2011 war er Technischer Projektmanager von eAQUA und wird die gleiche Rolle ab Juli 2011 für das eTRACES-Projekt übernehmen. Seine Forschungsinteressen reichen von den schriftlichen Überlieferungslinien über Text-Bildintegration bis hin zur Archäologie-Informatik. Herr Büchler betreut neben den genannten wissenschaftlichen Projekten auch die Leipzig Linguistic Services. Des Weiteren ist er beratend für verschiedene Industriepartner tätig.

Abstract

Interdisziplinäres Arbeiten und Forschen ist und wird zukünftig immer bedeutender. Die eHumanities sind eine solche Zusammenarbeit mit sowohl den Geisteswissenschaften, der Informatik als auch den Digital Humanities. Der Vortrag gibt einen Überblick über vergangene und anlaufende Aktivitäten der Leipziger Arbeitsgruppe aus dem Bereich der eHumanities. Der generelle Kontext umfasst die aus Leipzig koordinierten eHumanities-Projekte eAQUA sowie eTRACES. Im Speziellen gibt der Vortrag Einblicke sowohl in Technologie- als auch Wechselwirkungsaspekte. Aus technologischer Sicht liegt der Schwerpunkt auf Text Mining im Allgemeinen sowie dem Finden von Informationen in jahrhundertealten Texten, der Textvervollständigung von antiken Papyri oder dem Korrigieren von OCR-Fehlern sowie dem Text Re-use im Sinne einer Zitationsspurenanalyse. Am Fallbeispiel des Forschungsschwerpunktes Text Re-use wird abschließend aufgezeigt, mit welchen Fragestellungen sich ein Geisteswissenschaftler, ein eHumanist, ein Digital Humanist sowie ein Informatiker beschäftigen. Hierbei liegt der Fokus nicht auf den technischen Umsetzungen, sondern vielmehr auf dem Kontrast der Forschungsinteressen und daraus resultierenden Wechselwirkungschancen.