Dr. Benjamin Hilprecht erhält renommierten ACM Jim Gray Dissertation Award 2023

02.06.2023

Dr. Benjamin Hilprecht, Alumnus des Fachbereichs, wurde mit einer lobenden Erwähnung für den renommierten ACM Jim Gray Dissertation Award 2023 ausgezeichnet. Der jährlich auf der SIGMOD-Konferenz verliehene Award würdigt hervorragende Forschungsarbeiten von Doktorand*innen im Bereich Datenbanken. Die lobende Erwähnung (honorable Mention) entspricht einem zweiten Platz und wird für ein bis drei weitere exzellente Doktorarbeiten vergeben. Dabei zählen vor allem die Neuartigkeit, fachliche Tiefe und Bedeutung des Forschungsbeitrags, potenzielle Auswirkungen auf Theorie und Praxis sowie Qualität der Präsentation. Die SIGMOD-Konferenz ist eine der wichtigsten und selektivsten im Bereich Datenbankmanagementsysteme und Datenverwaltungstechnologie.

In seiner Dissertation mit dem Titel „Data-Efficient Learned Database Components“ (Daten-effiziente gelernte Datenbankkomponenten) schlägt Hilprecht neuartige Techniken vor, um hohe Kosten für sogenannte gelernte Datenbankkomponenten zu reduzieren und gleichzeitig die Leistung zu optimieren.

Während Datenbanken das stabile Rückgrat vieler Softwaresysteme bilden, müssen Datenbankkomponenten wie der Optimierer oft neu entworfen werden, um der zunehmenden Vielfalt anWorkloads, Daten und Hardwaredesigns gerecht zu werden. Dies bedeutet einen erheblichen technischen Aufwand für die Anpassung ihres Designs.

Ein aktueller Ansatz sieht vor, Datenbankkomponenten wie Optimierer oder Kardinalitätsschätzer durch Modelle des maschinellen Lernens (ML) zu ersetzen, wodurch nicht nur der Entwicklungsaufwand entfällt, sondern auch eine bessere Leistung für viele Komponenten erzielt wird. Allerdings benötigen diese Ansätze große Mengen an Trainingsdaten in Form von Abfrageausführungen, was gerade bei größeren Datenmengen zu erheblichem Aufwand führt.

Hilprecht entwirft daher in seiner Dissertation neue Ansätze, die diesen Aufwand entweder ganz eliminieren oder die Modelle für eine breitere Anzahl an Datenbanken nutzbar machen und so den Aufwand nur einmalig entstehen lassen. Dadurch wird der Einsatz von ML für Datenbanken nicht nur effizienter, sondern es lässt sich auch oft der Stand der Technik bei Problemen wie Kardinalitätsschätzung verbessern.

Der Informatiker stellt drei Ansätze vor: die Reduzierung der Trainingsabfragen durch Simulationsmodelle, das Einbauen von Domänenwissen durch differenzierbare Programmierung und datengetriebenes Lernen durch die Verwendung von Datenverteilungen in der Datenbank. Auch Zero-Shot-gelernte Datenbankkomponenten werden gezeigt, die auf eine breitere Palette von Aufgaben anwendbar sind.

Zur Person

Benjamin Hilprecht promovierte 2022 zum Dr. rer. nat. am Fachgebiet Datenmanagement von Prof. Dr. Binnig an der TU Darmstadt. Zuvor absolvierte er ein Masterstudium der Mathematik an der Fernuniversität in Hagen und ein duales Bachelorstudium der Wirtschaftsinformatik an der DHBW Mannheim und der SAP SE. Nach seiner Promotion nahm er eine Stelle bei Everest Systems an.

Über SIGMOD

Die ACM Special Interest Group on Management of Data (SIGMOD) befasst sich mit den Prinzipien, Techniken und Anwendungen von Datenbankmanagementsystemen und Datenverwaltungstechnologie. Zu den Mitgliedern gehören Softwareentwickler, akademische und industrielle Forscher, Praktiker, Benutzer und Studenten. SIGMOD sponsert die jährliche SIGMOD/PODS-Konferenz, eine der wichtigsten und selektivsten in diesem Bereich.

Empfohlener externer Content

Wir haben für Sie einen externen Inhalt von Twitter ausgewählt und möchten Ihnen diesen hier zeigen. Dazu müssen Sie ihn mit einem Klick einblenden. Mit einem weiteren Klick können Sie den externen Inhalt jederzeit ausblenden.

Ich bin damit einverstanden, dass mir externe Inhalte von Twitter angezeigt werden. Dadurch ist es möglich, dass personenbezogene Daten an Drittplattformen übermittelt werden. Weitere Informationen finden Sie in unserer Datenschutzerklärung.