Die Arbeitsgruppe von Dr. Iryna Gurevych und Prof. Dr. Max Mühlhäuser erhält den IBM UIMA Innovation Award
Mit dem Darmstadt Knowledge Processing Repository wollen Informatiker an der TU Darmstadt ein Werkzeugkasten zum Bau von Textmining-Systemen weltweit zur Verfügung stellen. Solche Systeme dienen der Gewinnung von Wissen aus unstrukturierten Texten im Web 2.0.
IT-Riese IBM verleiht der Darmstädter Arbeitsgruppe „Ubiquitous Knowledge Processing“ (UKP Lab) den begehrten Preis „UIMA Innovation Award“ für Ihre Forschung im Bereich Textmining. Mit diesem Begriff bezeichnet man den Versuch, Texte im Internet oder Firmennetzwerk vom Computer automatisch durchforsten und analysieren zu lassen, wobei der Computer versucht, den Sinn des Geschriebenen teilweise zu verstehen.
Der Preis ist mit 24.000 US-Dollar dotiert und dient der finanziellen Unterstützung des Projekts "Enhancing the Darmstadt Knowledge Processing Repository to Meet Emerging Challenges in NLP Research", das von Dr. Iryna Gurevych und Prof. Max Mühlhäuser gemeinsam geleitet wird. Die Gruppe ist am Fachbereich Informatik der Technischen Universität Darmstadt angesiedelt. IBM ist die älteste und noch immer eine der größten IT-Firmen weltweit.
Die Ergebnisse des von IBM unterstützten Darmstädter Projekts sollen der Textmining-Forschung weltweit wichtige Impulse verleihen - Wissenschaftler des UKP Lab stellen dazu einen Werkzeugkasten auf der Grundlage von IBM’s offener Plattform UIMA (Unstructured Information Management Architecture) zur Verfügung, der auf neuesten Forschungsergebnissen der Darmstädter Gruppe basiert. Dieser Werkzeugkasten steht zur freien Nutzung in der Forschung zur Verfügung. Viele bislang aufwändige Schritte bei der Entwicklung von Textmining-Systemen werden so wesentlich vereinfacht. Neue Erkenntnisse können auf dieser Grundlage deutlich schneller und effizienter gewonnen werden. Das System wird insbesondere fit gemacht für die Analyse von so genannten Community-Texten aus dem neuen kooperativen Internet, dem so genannten Web 2.0. Darin kommen Fehlerarten, spezielle Abkürzungen und besondere Elemente vor, die den herkömmlichen Textmining-Programmen große Schwierigkeiten bereiten.
Das mit dem IBM’s UIMA Innovation Award ausgezeichnete Projekt wird von Dr. Iryna Gurevych und Prof. Max Mühlhäuser gemeinsam geleitet. Gurevych ist Leiterin der im Sommer 2006 gegründeten Forschungsgruppe UKP Lab, deren Forschung im Rahmen des Emmy-Noether Exzellenzprogramms für Nachwuchswissenschaftler und weiterer Forschungsprojekte von der Deutschen Forschungsgemeinschaft sowie im Rahmen des deutschen Informatik-Leuchtturmprojekts THESEUS finanziert wird. Mühlhäuser leitet das drittmittelstarke Fachgebiet Telekooperation im Fachbereich Informatik der TU Darmstadt, das an mehreren prestigeträchtigen Informatik-Projekten im Bereich des Ubiquitous Computing beteiligt ist.
Das Team von Gurevych und Mühlhäuser arbeitet daran, interessante und wichtige Fakten aus rohen Texten mit Hilfe der Techniken des semantischen Informationsmanagements und des Textmining auszufiltern. „Darmstadt Knowledge Processing Repository (DKPro)“ bezeichnet dabei eine Softwaretechnik zur Entwicklung von komplexen Textmining-Programmen, die große Ansammlungen von textuellen Dokumenten im Web „verstehen“, beispielsweise natürlichsprachliche Beschreibungen von Dienstleistungen, Berufen, oder auch so genannte Community-Inhalte, wie Forenbeiträge, Blogs oder FAQs. Ein prägendes Merkmal des Projekts ist es, dass die kollaborativ erstellte Enzyklopädien wie beispielsweise Wikipedia genutzt werden, um das menschliche Wissen und das Sprachverstehen nachzubilden.
Software-Komponenten aus dem DKPro-Projekt werden in die Lage versetzt, mit den Besonderheiten von Community-Inhalten, wie z.B. Schreibfehlern oder Smileys effizient umzugehen. So können anschließend beispielsweise Meinungen von Studierenden über eine Vorlesung oder ihre Bestandteile in einem Forum automatisch gefunden und zur Rückmeldung an den Dozenten automatisch zusammengefasst werden. Textmining-Forscher profitieren vom DKPro, weil es die Anpassung von Algorithmen und Verfahren auf neue Anwendungsfelder oder Textarten wesentlich erleichtert. Damit könnte das beispielsweise die oben beschriebene Software leicht von Vorlesungs-Bewertungen auf Hotel- und Produktbewertungen angepasst werden.
Die UIMA Innovation Awards werden von IBM seit 2006 weltweit an die führenden Wissenschaftler im Bereich des Unstructured Information Management in einem strikten Auswahlverfahren vergeben.
Kontakt: Iryna Gurevych gurevych@tk.informatik.tu-darmstadt.de
Website: UKP Lab http://www.ukp.tu-darmstadt.de/, Darmstadt Knowledge Processing Repository http://www.ukp.tu-darmstadt.de/software/repository
Forschungsstudenten gesucht: Für die Mitarbeit am Projekt „Darmstadt Knowledge Processing Repository“ auf der Grundlage von IBM’s UIMA werden zurzeit exzellente Informatik-Studierende gesucht. Helfen Sie uns, in der Flut an Informationen Sinnzusammenhänge zu finden. Wenn Sie Interesse an der Mitarbeit in diesem Projekt haben, nehmen Sie bitte mit uns Kontakt auf: gurevych(a-t)tk.informatik.tu-darmstadt.de.
Allgemeine News, Presse






