Kennen Sie schon DALL·E?
Alle Jahre wieder werfen wir zu Beginn des Jahres einen Blick auf neue Techniken in der Bilderwelt, auf Deep Learning und Künstliche Intelligenz in unserer Branche. Vor zwei Jahren etwa berichteten wir über den „Hyperrealistic Face Generator“, der nach Vorlage von ein paar hundert Porträts künstliche Menschen „fotografieren“ kann. Und erinnern Sie sich noch an thispersondoesnotexist oder auch an die von einem Künstlerkollektiv erschaffenen Fake Faces – Stockfotos von Gesichtern, die allesamt künstlich generiert worden sind?
Künstliche Intelligenz (KI) kreiert mittlerweile schon neue Biersorten oder schafft Kunstwerke, die beim Auktionshaus Christie’s versteigert werden. Oder nehmen wir Hyper Bowl, das Studio aus München mit revolutionärer Technik made in Hollywood: Unter dem Motto „The way we killed the green screen“ wird der traditionelle Hintergrund durch eine gigantische LED ersetzt, die virtuelle Welten zeigt und das Set beleuchtet. Und auf universitärer Ebene wird weiterhin fleißig daran geforscht, Bilder aus längeren Texten zu generieren – zum Beispiel Rezepte.
Apropos Bilder aus Texten generieren – auch DALL·E wurde für diesen Zweck erschaffen. DALL·E? Klingt in seiner Schreibweise verdächtig nach WALL·E, dem kleinen Pixar-Disney-Roboter. Und tatsächlich: DALL·E = WALL·E + Dalí, Meister des Surrealismus. Ganz so surreal mutet die Neuerung in unserer digitalisierten Welt nicht mehr an: ein neuronales Netzwerk, das aus Textbausteinen Bilder generiert. Spannend an dem sogenannten Transformer Language Model ist, dass es sowohl mit Bildern als auch mit Text trainiert wird.
Entsprungen ist das GPT-3-basierte neuronale Netzwerk aus der KI-Schmiede OpenAI. Tiefer gehende Details über die Funktionsweise wurden noch nicht veröffentlicht, aber dieser Blogeintrag veranschaulicht in einer knappen halben Stunde Lesezeit, wie das Netzwerk auf Hunderte von Beispielabfragen reagiert hat. Besonders hervorzuheben ist, dass DALL·E dabei auch mit anthropomorphisierten Gegenständen, Tieren oder Nahrung in ungewöhnlichen Situationen zurechtkommt. Eine illustrierte Karotte im pinken Tutu, die mit einem Hund Gassi geht? Here we go:
Nicht nur zur Bilderstellung kann DALL·E eingesetzt werden, sondern auch zur Veränderung von vorhandenem Bildmaterial, zum Rendern von Text oder zur Transformation einer Fotografie in eine Zeichnung.
OpenAI gibt zu, dass der Grad an Zuverlässigkeit noch starken Schwankungen unterliegt. Einfache Wünsche wie „Foto blau eingefärbt“ oder „Foto gespiegelt“ sind in der Regel zuverlässiger als komplizierte Aufgabenstellungen. Da können dann schon mal lustige Verwechslungen zustande kommen, wenn DALL·E das Wort „kaputt“ mit „verflucht“ übersetzt und die kaputte Teekanne dann entsprechend dargestellt wird …
Dafür kann DALL·E beispielsweise verschiedene Telefonarten generieren, die zum gewünschten Jahrzehnt passen. Der Grund: Das Netzwerk wurde auch mit historischem Wissen gefüttert.
Mit den ethischen Fragen zum künstlich intelligenten Netzwerk will sich OpenAI eigenen Angaben zufolge noch beschäftigen. Wir halten die Augen auf. Und wenn auch Sie spannende Technologien finden, die den Bildermarkt der Zukunft revolutionieren könnten: Immer her damit! Ansonsten gilt wie gehabt: Wir bleiben am Ball und halten Sie auf dem Laufenden.
Wenn Sie möchten, einmal pro Monat als Magazin per Email.
Weitere News:
-
Investieren Sie in Kluges!
Monday, 18.11.2024 | Tipps & Tricks
Ihr Rest-Budget für Fortbildung oder Ihre Planung für 2025: Da haben wir etwas wirklich Kluges für Sie: 10% Rabatt auf unsere Schulungen und Trainings!
Weiterlesen... -
Webinare: Neue Termine für 2025
Monday, 18.11.2024 | Tipps & Tricks
Sie lohnen sich, unsere Webinare. Das sagten alle Teilnehmenden dieses Jahr. Deshalb hier die Termine für 2025!
Weiterlesen... -
Zukunft neu gestalten
Saturday, 02.11.2024 | Thema des Monats
Aufregende Zeiten, Marktschreier und die Rezession: Wie werden Sie im nächsten Jahr kommunizieren? Wo kann Ihnen die Erfahrung der Bildbeschaffer helfen?
Weiterlesen...
Eine Einladung zum Gespräch! -
Was steht an bei den Bildbeschaffern?
Tuesday, 08.10.2024 | Thema des Monats
Der September war ziemlich prall und richtig gut zu uns Bildbeschaffern. Lass uns einige der Insights teilen, die diesen Monat für uns besonders gemacht haben.
Weiterlesen...