The content of this page is only available in German. Please go to German version of this page.

Dr. Benjamin Hilprecht erhält renommierten ACM Jim Gray Dissertation Award 2023

2023/06/02

Dr. Benjamin Hilprecht, Alumnus des Fachbereichs, wurde mit einer lobenden Erwähnung für den renommierten ACM Jim Gray Dissertation Award 2023 ausgezeichnet. Der jährlich auf der SIGMOD-Konferenz verliehene Award würdigt hervorragende Forschungsarbeiten von Doktorand*innen im Bereich Datenbanken. Die lobende Erwähnung (honorable Mention) entspricht einem zweiten Platz und wird für ein bis drei weitere exzellente Doktorarbeiten vergeben. Dabei zählen vor allem die Neuartigkeit, fachliche Tiefe und Bedeutung des Forschungsbeitrags, potenzielle Auswirkungen auf Theorie und Praxis sowie Qualität der Präsentation. Die SIGMOD-Konferenz ist eine der wichtigsten und selektivsten im Bereich Datenbankmanagementsysteme und Datenverwaltungstechnologie.

In seiner Dissertation mit dem Titel “Data-Efficient Learned Database Components” (Daten-effiziente gelernte Datenbankkomponenten) schlägt Hilprecht neuartige Techniken vor, um hohe Kosten für sogenannte gelernte Datenbankkomponenten zu reduzieren und gleichzeitig die Leistung zu optimieren.

Während Datenbanken das stabile Rückgrat vieler Softwaresysteme bilden, müssen Datenbankkomponenten wie der Optimierer oft neu entworfen werden, um der zunehmenden Vielfalt anWorkloads, Daten und Hardwaredesigns gerecht zu werden. Dies bedeutet einen erheblichen technischen Aufwand für die Anpassung ihres Designs.

Ein aktueller Ansatz sieht vor, Datenbankkomponenten wie Optimierer oder Kardinalitätsschätzer durch Modelle des maschinellen Lernens (ML) zu ersetzen, wodurch nicht nur der Entwicklungsaufwand entfällt, sondern auch eine bessere Leistung für viele Komponenten erzielt wird. Allerdings benötigen diese Ansätze große Mengen an Trainingsdaten in Form von Abfrageausführungen, was gerade bei größeren Datenmengen zu erheblichem Aufwand führt.

Hilprecht entwirft daher in seiner Dissertation neue Ansätze, die diesen Aufwand entweder ganz eliminieren oder die Modelle für eine breitere Anzahl an Datenbanken nutzbar machen und so den Aufwand nur einmalig entstehen lassen. Dadurch wird der Einsatz von ML für Datenbanken nicht nur effizienter, sondern es lässt sich auch oft der Stand der Technik bei Problemen wie Kardinalitätsschätzung verbessern.

Der Informatiker stellt drei Ansätze vor: die Reduzierung der Trainingsabfragen durch Simulationsmodelle, das Einbauen von Domänenwissen durch differenzierbare Programmierung und datengetriebenes Lernen durch die Verwendung von Datenverteilungen in der Datenbank. Auch Zero-Shot-gelernte Datenbankkomponenten werden gezeigt, die auf eine breitere Palette von Aufgaben anwendbar sind.

Zur Person

Benjamin Hilprecht promovierte 2022 zum Dr. rer. nat. am Fachgebiet Datenmanagement von Prof. Dr. Binnig an der TU Darmstadt. Zuvor absolvierte er ein Masterstudium der Mathematik an der Fernuniversität in Hagen und ein duales Bachelorstudium der Wirtschaftsinformatik an der DHBW Mannheim und der SAP SE. Nach seiner Promotion nahm er eine Stelle bei Everest Systems an.

Über SIGMOD

Die ACM Special Interest Group on Management of Data (SIGMOD) befasst sich mit den Prinzipien, Techniken und Anwendungen von Datenbankmanagementsystemen und Datenverwaltungstechnologie. Zu den Mitgliedern gehören Softwareentwickler, akademische und industrielle Forscher, Praktiker, Benutzer und Studenten. SIGMOD sponsert die jährliche SIGMOD/PODS-Konferenz, eine der wichtigsten und selektivsten in diesem Bereich.

Recommended external content

We have selected external content from Twitter for you and would like to show it to you right here. To do this, you must reveal it with one click. You can hide the external content at any time with another click.

I agree to external content from X being shown to me. This may result in personal data being transmitted to third-party platforms. You can find more information in our Privacy Policy.