OpenAI hebt seinen Bildgenerator auf ein neues Level: Mit ChatGPT Images 2.0 und dem zugrundeliegenden GPT Image 2 Modell hält erstmals eine Thinking-Funktion Einzug in die Bildgenerierung – inklusive Echtzeit-Webzugriff und verbesserter Konsistenz über ganze Bildserien hinweg.
OpenAI aktualisiert seinen Bildgenerator – ChatGPT Images 2.0 mit Webzugriff und erweiterter Reasoning-Funktion
OpenAI hat eine neue Version seines KI-gestützten Bildgenerators vorgestellt. ChatGPT Images 2.0 basiert auf dem neuen GPT Image 2 Modell und verfügt erstmals über eine sogenannte Thinking-Funktion, die es dem System ermöglicht, vor der Bildgenerierung aktiv im Web zu recherchieren.
Neue Fähigkeiten im Überblick
Die wesentliche Neuerung liegt in der Integration von Reasoning-Funktionen in den Bildgenerierungsprozess. Wird ein Thinking-Modell ausgewählt, kann der Generator:
- Informationen aus dem Internet in Echtzeit abrufen
- Hochgeladene Dateien als visuelle Grundlage nutzen
- Die Struktur eines Bildes vor der eigentlichen Erstellung gedanklich durcharbeiten
OpenAI verspricht eine verbesserte Instruktionstreue, präzisere Detailerhaltung und eine deutlich höhere Textgenauigkeit innerhalb generierter Bilder – ein Bereich, an dem KI-Bildgeneratoren bislang regelmäßig gescheitert sind.
Seriengenerierung und Stilkonsistenz
Ein weiteres Merkmal ist die Möglichkeit, bis zu acht Bilder in einem einzigen Durchlauf zu erstellen – bei konsistenter Darstellung von Charakteren, Objekten und Stilen über alle Szenen hinweg.
Für Anwendungsfälle wie Storyboards, Produktkataloge oder Kampagnenmaterial ist das eine relevante Verbesserung: Bislang musste Konsistenz über mehrere Bilder hinweg mühsam manuell nachgearbeitet werden.
Verfügbarkeit und Zugangsstufen
Die Thinking-Funktion steht zunächst ausschließlich ChatGPT-Abonnenten der Stufen Plus, Pro, Business und Enterprise zur Verfügung. Grundfunktionen des aktualisierten Bildgenerators sind auch ohne kostenpflichtiges Abonnement nutzbar – Websuche und erweiterte Reasoning-Fähigkeiten bleiben jedoch zahlenden Kunden vorbehalten.
OpenAI setzt damit ein mittlerweile etabliertes Muster fort: Leistungsstarke Funktionen werden zunächst im Premium-Segment eingeführt, bevor sie schrittweise breiter zugänglich gemacht werden.
Marktkontext
Mit dem Update reagiert OpenAI auf zunehmenden Wettbewerbsdruck im Segment der KI-Bildgenerierung. Anbieter wie Midjourney, Stability AI und zuletzt auch Google mit Imagen positionieren sich in diesem Segment aktiv weiter.
Die Einbindung von Echtzeit-Webdaten in den Generierungsprozess ist dabei ein klares Differenzierungsmerkmal – eines, das ChatGPT Images 2.0 von den meisten Konkurrenzprodukten abhebt, zumindest zum aktuellen Zeitpunkt.
Einordnung für deutsche Unternehmen
Für Marketing- und Kommunikationsabteilungen dürfte vor allem die Kombination aus Webzugriff und Seriengenerierung praktisch relevant sein: Kampagnenmotive lassen sich schneller und konsistenter produzieren, ohne auf externe Agenturen oder aufwendige Nachbearbeitung angewiesen zu sein.
Wer ChatGPT bereits im Business- oder Enterprise-Tarif nutzt, erhält diese Funktionen ohne zusätzliche Kosten. Unternehmen, die den Einsatz KI-gestützter Bildproduktion bislang zurückgestellt haben, sollten das Update zum Anlass nehmen, eigene Workflows neu zu bewerten –
insbesondere im Hinblick auf Compliance-Anforderungen beim Einsatz von Werkzeugen mit Internetzugriff.
Quelle: The Verge AI