ERC Advanced Grant für Prof. Iryna Gurevych

Europäische Union fördert KI-Projekt zur innovativen Analyse von Texten

26.04.2022

Professorin Iryna Gurevych gewinnt einen der hoch begehrten „ERC Advanced Grants” und erhält 2,5 Millionen Euro vom Europäischen Forschungsrat (European Research Council – ERC) für ihr Projekt „InterText – Modeling Text as a Living Object in Cross-Document Context”.

Professorin Iryna Gurevych ist Gründerin und Leiterin des Ubiquitous Knowledge Processing Lab der TU Darmstadt.

In dem Forschungsvorhaben sollen über fünf Jahre KI-Methoden entwickelt werden, die die Verarbeitung und Analyse von Texten und ihren Beziehungen ermöglichen. Die Beziehungen zwischen den Texten können zum Beispiel Widersprüche, Übereinstimmungen oder Kommentare sein. Im Zeitalter der allgegenwärtigen Informationsflut soll die neue Technologie den Nutzenden eine effiziente Auswertung komplexer Informationen zu einem bestimmten Thema verschaffen, um beispielsweise Falschnachrichten zu überprüfen.

Natural Language Processing

Der Bereich der KI-Forschung, der sich mit der Verarbeitung von Sprache und Text beschäftigt, wird als „Natural Language Processing” (NLP) bezeichnet. Während die Anfänge in regelbasierten Ansätzen wie zum Beispiel den von Noam Chomsky geprägten kontextfreien Grammatiken liegen, hat mittlerweile das „Deep Learning” NLP revolutioniert und dazu geführt, dass vor allem neuronale Netzwerke und Maschinelles Lernen zur Lösung der gestellten Probleme verwendet werden. Dabei haben neue Netzwerk-Architekturen in Verbindung mit größeren Rechner-Ressourcen zu ungeahnten Leistungssprüngen geführt. Diese sind in Anwendungen wie der automatischen Übersetzung oder Beantwortung von Fragen weithin sichtbar.

Navigation im Dschungel der Information

Im Internet ist zu fast jedem Thema eine große Menge an oftmals widersprüchlichen Informationen zu finden. Diese Informationen befinden sich zum Großteil in Text-Quellen. Um sich ein umfassendes Bild über ein komplexes Thema zu verschaffen, müssen Nutzende oftmals verschiedene Quellen miteinander in Bezug setzen. Eine Reihe von Beziehungen zwischen solchen Texten sind denkbar. So kann es zum Beispiel sein, dass mehrere Texte die gleiche Grundaussage haben. Ebenso ist es aber möglich, dass sich die Informationen in zwei Texten nicht vereinbaren lassen, oder ein Text dem anderen sogar explizit widerspricht.

Während aktuelle NLP-Verfahren bereits gut darin sind, einfache Faktenfragen zu beantworten, scheitern sie daran, solche komplexen Bezüge zu erkennen. Dies liegt unter anderem daran, dass sich die derzeitige NLP-Forschung vor allem mit der Verarbeitung und Analyse einzelner, kurzer Texte befasst und die Beziehungen zwischen diesen Texten außer Acht lässt.

Texte in Beziehung

Im jetzt geförderten InterText-Projekt von Professorin Gurevych soll diese Lücke geschlossen werden. Dabei konzentriert sich die Arbeit auf drei weit verbreitete Phänomene, bei denen Texte in unterschiedlicher Art und Weise miteinander in Verbindung stehen: Als erstes die Beziehung zwischen einem Dokument und den Kommentaren zu diesem Dokument, wie man es von Textverarbeitungsprogrammen oder PDF-Dokumenten kennt. Zweitens die Beziehung zwischen zwei längeren Texten, wie zum Beispiel einem Blogeintrag über einen Zeitungsartikel oder einem Peer-Review-Gutachten über einen wissenschaftlichen Artikel. Und zuletzt die Beziehungen zwischen verschiedenen Versionen desselben Textes.

Dafür werden im Projekt unter anderem neue Datensätze erstellt und auf dem Deep-Learning-Transformer basierende Methoden entwickelt, die neben den eigentlichen Texten auch ihre Struktur mit Überschriften, Abschnitten, etc. berücksichtigen können. In zwei Probandenstudien mit realen Nutzenden kommen die neuen Methoden schon während des Projekts zur Anwendung. Aus den Studien erhält das Forschungsteam wertvolles Feedback, um die Ergebnisse optimal nutzbar zu machen.

Zur Person

Iryna Gurevych ist die erste LOEWE-Spitzenprofessorin des Landes Hessen, Vizepräsidentin der Association for Computational Linguistics (ACL), Gründungsmitglied des Hessischen Zentrums für Künstliche Intelligenz (hessian.AI) sowie W3-Professorin am Fachbereich Informatik und Gründerin und Leiterin des Ubiquitous Knowledge Processing Lab der TU Darmstadt. Sie promovierte 2001 an der Universität Duisburg-Essen in Computerlinguistik und war Postdoktorandin am European Media Lab in Heidelberg. 2006 wechselte sie an die TU Darmstadt, wo sie zunächst als Gruppenleiterin und Assistenzprofessorin und seit 2009 als W3-Professorin tätig war und ist. Im Rahmen ihrer Arbeit wurde sie mit einer Emmy-Noether-Nachwuchsgruppe und einer Lichtenberg-Professur ausgezeichnet. Iryna Gurevych ist ACL 2020 Fellow (< 0,2 Prozent der wissenschaftlichen Community) sowie Fellow von ELLIS (European Laboratory for Learning and Intelligent Systems).

Hintergrund

Die ERC Advanced Grants werden vom Europäischen Forschungsrat an Forschende aus allen Disziplinen vergeben. Zielgruppe der ERC Advanced Grants sind etablierte, aktive Wissenschaftlerinnen und Wissenschaftler mit einer herausragenden wissenschaftlichen Leistungsbilanz. In der aktuellen Runde wurden 253 Grants vergeben, 1.735 Anträge waren eingereicht worden. Neben Professorin Gurevych wurde von der TU Darmstadt auch Professor Ahmad-Reza Sadeghi mit einem ERC Advanced Grant ausgezeichnet.