OpenAI aktualisiert Bildgenerator in ChatGPT: Webzugriff und erweiterte Reasoning-Funktion

OpenAI hebt seinen Bildgenerator auf ein neues Level: Mit ChatGPT Images 2.0 und dem zugrundeliegenden GPT Image 2 Modell hält erstmals eine Thinking-Funktion Einzug in die Bildgenerierung – inklusive Echtzeit-Webzugriff und verbesserter Konsistenz über ganze Bildserien hinweg.

OpenAI aktualisiert seinen Bildgenerator – ChatGPT Images 2.0 mit Webzugriff und erweiterter Reasoning-Funktion

OpenAI hat eine neue Version seines KI-gestützten Bildgenerators vorgestellt. ChatGPT Images 2.0 basiert auf dem neuen GPT Image 2 Modell und verfügt erstmals über eine sogenannte Thinking-Funktion, die es dem System ermöglicht, vor der Bildgenerierung aktiv im Web zu recherchieren.


Neue Fähigkeiten im Überblick

Die wesentliche Neuerung liegt in der Integration von Reasoning-Funktionen in den Bildgenerierungsprozess. Wird ein Thinking-Modell ausgewählt, kann der Generator:

  • Informationen aus dem Internet in Echtzeit abrufen
  • Hochgeladene Dateien als visuelle Grundlage nutzen
  • Die Struktur eines Bildes vor der eigentlichen Erstellung gedanklich durcharbeiten

OpenAI verspricht eine verbesserte Instruktionstreue, präzisere Detailerhaltung und eine deutlich höhere Textgenauigkeit innerhalb generierter Bilder – ein Bereich, an dem KI-Bildgeneratoren bislang regelmäßig gescheitert sind.


Seriengenerierung und Stilkonsistenz

Ein weiteres Merkmal ist die Möglichkeit, bis zu acht Bilder in einem einzigen Durchlauf zu erstellen – bei konsistenter Darstellung von Charakteren, Objekten und Stilen über alle Szenen hinweg.

Für Anwendungsfälle wie Storyboards, Produktkataloge oder Kampagnenmaterial ist das eine relevante Verbesserung: Bislang musste Konsistenz über mehrere Bilder hinweg mühsam manuell nachgearbeitet werden.


Verfügbarkeit und Zugangsstufen

Die Thinking-Funktion steht zunächst ausschließlich ChatGPT-Abonnenten der Stufen Plus, Pro, Business und Enterprise zur Verfügung. Grundfunktionen des aktualisierten Bildgenerators sind auch ohne kostenpflichtiges Abonnement nutzbar – Websuche und erweiterte Reasoning-Fähigkeiten bleiben jedoch zahlenden Kunden vorbehalten.

OpenAI setzt damit ein mittlerweile etabliertes Muster fort: Leistungsstarke Funktionen werden zunächst im Premium-Segment eingeführt, bevor sie schrittweise breiter zugänglich gemacht werden.


Marktkontext

Mit dem Update reagiert OpenAI auf zunehmenden Wettbewerbsdruck im Segment der KI-Bildgenerierung. Anbieter wie Midjourney, Stability AI und zuletzt auch Google mit Imagen positionieren sich in diesem Segment aktiv weiter.

Die Einbindung von Echtzeit-Webdaten in den Generierungsprozess ist dabei ein klares Differenzierungsmerkmal – eines, das ChatGPT Images 2.0 von den meisten Konkurrenzprodukten abhebt, zumindest zum aktuellen Zeitpunkt.


Einordnung für deutsche Unternehmen

Für Marketing- und Kommunikationsabteilungen dürfte vor allem die Kombination aus Webzugriff und Seriengenerierung praktisch relevant sein: Kampagnenmotive lassen sich schneller und konsistenter produzieren, ohne auf externe Agenturen oder aufwendige Nachbearbeitung angewiesen zu sein.

Wer ChatGPT bereits im Business- oder Enterprise-Tarif nutzt, erhält diese Funktionen ohne zusätzliche Kosten. Unternehmen, die den Einsatz KI-gestützter Bildproduktion bislang zurückgestellt haben, sollten das Update zum Anlass nehmen, eigene Workflows neu zu bewerten –

insbesondere im Hinblick auf Compliance-Anforderungen beim Einsatz von Werkzeugen mit Internetzugriff.


Quelle: The Verge AI

Scroll to Top