Auszeichnung für herausragende Forschungsarbeit

Preis für KI-Forscher Patrick Schramowski auf der NeuroIPS 2022

25.11.2022 von

Doktorand Patrick Schramowski aus der Forschungsgruppe „Künstliche Intelligenz und Maschinelles Lernen“ erhält zusammen mit weiteren Wissenschaftler*innen den „Outstanding Paper Award“ in der Kategorie „Outstanding Datasets and Benchmarks Papers“ auf der NeurIPS 2022, einer der angesehensten KI-Konferenzen weltweit. Die Veröffentlichung präsentiert LAION-5B, einen der größten offenen Datensätze der Welt zum Training neuer Bild-Text-Modelle.

Ein internationales Forschungsteam, dem auch Doktorand Patrick Schramowski aus dem Fachbereich Informatik angehört, wird für die Veröffentlichung „LAION-5B: An open large-scale dataset for training next generation image-text models“ mit einem der angesehenen Outstanding Paper Awards ausgezeichnet. Bei LAION-5B handelt es sich um einen offenen KI-Trainingsdatensatz mit über fünf Milliarden Bild-Text-Paaren in verschiedenen Sprachen. Er enthält Bilder und Bildunterschriften aus dem Internet und ist 14-mal größer als der Vorgänger LAION-400M. Damit ist es der aktuell größte frei verfügbare Bild-Text-Datensatz. Patrick Schramowski beschäftigte sich im Rahmen der Veröffentlichung mit der Filterung von unangemessenen Inhalten.

Das gemeinnützig arbeitende LAION-Team hofft, mit dem neuen Text-Bild-Diffusionsmodell die multimodale KI-Forschung zu demokratisieren. Der Datensatz ist bereits im Einsatz, um aktuelle Text-zu-Bild-Systeme wie Stable Diffusion zu trainieren, das die Erzeugung von fotorealistischen Bildern auf der Basis beliebiger Texteingaben ermöglicht. Der Preis wird im Rahmen der 36. Conference on Neural Information Processing Systems (NeurIPS 2022) vergeben, die von 28.11 – 9.12.2022 in New Orleans, USA, stattfindet. Die Konferenz ist eine der weltweit führenden im Bereich der Künstlichen Intelligenz und wird im CORE-Ranking mit der höchsten Kategorie A* bewertet.

Publikation

LAION-5B: An open large-scale dataset for training next generation image-text models (2022)

von Christoph Schuhmann, Romain Beaumont, Richard Vencu, Cade Gordon, Ross Wightman, Mehdi Cherti, Theo Coombes, Aarush Katta, Clayton Mullis, Mitchell Wortsman, Patrick Schramowski, Srivatsa Kundurthy, Katherine Crowson, Ludwig Schmidt, Robert Kaczmarczyk und Jenia Jitsev.

URL: https://openreview.net/pdf?id=M3Y74vmsMcY

Über Patrick Schramowski

Patrick Schramowski ist Doktorand und wissenschaftlicher Mitarbeiter im Fachgebiet Künstliche Intelligenz und Maschinelles Lernen von Professor Kristian Kersting. Er arbeitet zudem im TU-Forschungsverbund „Third Wave of Artificial Intelligence“ (3AI) des Hessischen Zentrums für Künstliche Intelligenz (hessian.AI) mit Sitz an der TU Darmstadt.

Mehr erfahren