So versteht KI ganze Sätze
UKP Lab überträgt Weiterentwicklung von Sentence Transformers an Hugging Face
22.10.2025 von UKP Lab
Das Ubiquitous Knowledge Processing (UKP) Lab der Technischen Universität Darmstadt hat die Wartung und Weiterentwicklung von Sentence Transformers, einer der weltweit meistgenutzten Open-Source-Bibliotheken für semantische Embeddings, offiziell an die Plattform Hugging Face übertragen. Die Open-Source-Software ging 2019 aus der Forschung am UKP Lab hervor und hat sich seither als eine der wichtigsten Ressourcen für Künstliche Intelligenz (KI) in der Sprachverarbeitung (Natural Language Processing, kurz NLP) etabliert. Sie ermöglicht es, ganze Sätze so darzustellen, dass Computer deren Bedeutung erfassen und vergleichen können.
 
Sentence Transformers wurde von Dr. Nils Reimers und Professorin Iryna Gurevych am UKP Lab ins Leben gerufen und hat sich seither von einem innovativen Forschungsprojekt zu einer Schlüsseltechnologie entwickelt, die heute weltweit von mehr als einer Million Nutzer:innen pro Monat eingesetzt wird. In den vergangenen Jahren ist die Sammlung auf mehr als 16.000 vortrainierte Sentence-Transformers-Modelle angewachsen, die über Hugging Face unmittelbar genutzt werden können. Damit zählt Sentence Transformers zu den erfolgreichsten Open-Source-Projekten im Bereich der Sprachverarbeitung und der KI weltweit.
Tom Aarsen von Hugging Face, der die Bibliothek seit Ende 2023 betreut, wird die Weiterentwicklung auch künftig leiten. Mit der offiziellen Übergabe sind nun die Voraussetzungen geschaffen, dass Sentence Transformers von der leistungsfähigen Infrastruktur von Hugging Face profitiert, darunter eine kontinuierliche Integration, umfassende Testkapazitäten und Support-Strukturen auf Unternehmensebene.
Der Transfer verdeutlicht, wie Forschungsergebnisse der TU Darmstadt in enger Zusammenarbeit mit internationalen Partnern nachhaltige Wirkung entfalten. Er markiert zugleich einen wichtigen Meilenstein für die Zukunft des wegweisenden NLP- und KI-Werkzeugs, das die Arbeit im Bereich semantische Suche, Textähnlichkeit und Information Retrieval maßgeblich geprägt hat. In Zeiten großer Sprachmodelle sind Sentence Transformers aktueller denn je: Sie bilden die Grundlage für sogenannte RAG-Anwendungen (Retrieval-Augmented Generation), bei denen Sprachmodelle durch externe Wissensquellen ergänzt werden und so präzisere und nachvollziehbarere Antworten liefern.
Stimmen zum Transfer
Professorin Iryna Gurevych, Leiterin des UKP Lab an der TU Darmstadt 
„Sentence Transformers ist eine große Erfolgsgeschichte und das Ergebnis unserer langjährigen Forschung zur Berechnung semantischer Ähnlichkeiten im gesamten Lab. Nils Reimers hat sehr frühzeitig ein zentrales Problem erkannt und mit herausragenden Forschungsergebnissen wie auch mit einem hochgradig nutzbaren Werkzeug eine stark nachgefragte Lösung geschaffen. Dies beeinflusst bis heute Generationen von Studierenden und Praktiker:innen in der Sprachverarbeitung und der Künstlichen Intelligenz.“
Clem Delangue, Mitgründer & CEO von Hugging Face
„Wir freuen uns sehr, Sentence Transformers offiziell in der Hugging-Face-Familie willkommen zu heißen! In den vergangenen zwei Jahren war es beeindruckend zu sehen, wie dieses Projekt weltweit enorme Verbreitung gefunden hat – dank der starken Grundlagenarbeit des UKP Labs und der großartigen Community. Und das ist erst der Anfang: Wir werden uns weiterhin stark für das Wachstum und die Weiterentwicklung einsetzen und dabei dem offenen, kollaborativen Geist treu bleiben, der den Erfolg überhaupt erst möglich gemacht hat.“
Das UKP Lab
Das UKP Lab an der Technischen Universität Darmstadt ist international für seine herausragende Forschung im Bereich NLP und maschinelles Lernen anerkannt. Unter der Leitung von Professorin Iryna Gurevych hat das Lab zahlreiche einflussreiche Datensätze, Benchmarks und Open-Source-Werkzeuge entwickelt, die sowohl die Forschung als auch praktische Anwendungen in der KI voranbringen.
Hugging Face
Hugging Face ist die führende Plattform für maschinelles Lernen und Kollaboration und hostet die weltweit größte Sammlung von Modellen, Datensätzen und Anwendungen. Das Unternehmen verfolgt die Mission, KI durch Open Source und Open Science zu demokratisieren, und bietet dafür Werkzeuge und Infrastruktur, die maschinelles Lernen für alle zugänglich machen.
 
