Google erweitert seinen KI-Assistenten Gemini um die Fähigkeit, interaktive Diagramme, Datenvisualisierungen und dreidimensionale Modelle direkt im Chat zu erzeugen – und greift damit Anthropics Claude und OpenAIs ChatGPT in einem der meistdiskutierten Funktionsbereiche der KI-Branche frontal an.
Google Gemini generiert interaktive Visualisierungen und 3D-Modelle direkt im Chat
Vom Text zur interaktiven Grafik
Die neue Funktion erlaubt es Nutzern, Gemini per natürlichsprachlicher Eingabe zur Generierung von Diagrammen, Datenvisualisierungen und dreidimensionalen Modellen aufzufordern – ohne die Chat-Oberfläche verlassen oder externe Tools hinzuziehen zu müssen. Die Ausgaben sind nicht als statische Bilder konzipiert, sondern als interaktive Elemente, die sich direkt im Browser erkunden lassen.
Konkret bedeutet das: Wer einen Datensatz erläutert oder eine technische Struktur beschreiben möchte, erhält neben dem erklärenden Text eine manipulierbare Visualisierung, die sich drehen, zoomen oder filtern lässt. Der Ansatz verringert die Anzahl der Arbeitsschritte, die bislang zwischen Dateneingabe und visueller Ausgabe lagen, erheblich.
Visualisierungen per Prompt – ohne Entwickler, ohne externes Tool, ohne Medienbruch.
Wettbewerb um den integrierten Workflow
Der Schritt ist Teil eines erkennbaren Musters im Markt für Large Language Models: Anbieter erweitern ihre Plattformen zunehmend in Richtung vollständiger Arbeitsabläufe, statt sich auf reine Textgenerierung zu beschränken.
- Anthropic Claude hatte mit vergleichbaren Artefakt-Funktionen früh Maßstäbe gesetzt
- OpenAI ChatGPT bietet über den Code-Interpreter ähnliche Ausgabemöglichkeiten
- Google Gemini positioniert sich nun als direkte Konkurrenz – insbesondere im professionellen Segment
Für Unternehmen, die Google Workspace bereits als zentrale Arbeitsumgebung nutzen, könnte die Funktion besondere Relevanz entfalten, da die Integration in bestehende Google-Dienste naheliegt.
Technischer Hintergrund
Gemini generiert die Visualisierungen durch die Ausgabe von Code – typischerweise in Formaten wie HTML, JavaScript oder WebGL –, der dann direkt im Browser gerendert wird. Das Modell übernimmt dabei sowohl die inhaltliche Interpretation der Nutzeranfrage als auch die technische Umsetzung in lauffähigen Code.
Fehler oder Anpassungswünsche lassen sich per Folge-Prompt korrigieren, ohne den Prozess von vorn zu beginnen.
Dieser Ansatz unterscheidet sich konzeptionell von klassischen Business-Intelligence-Tools, bei denen Visualisierungen über vordefinierte Templates und feste Datenanbindungen entstehen. Die KI-gestützte Variante ist flexibler – aber auch weniger vorhersehbar in Bezug auf Konsistenz und Formatierung.
Einordnung für deutsche Unternehmen
Für deutschsprachige Unternehmen, die Gemini im Rahmen von Google Workspace oder über die API nutzen, erweitert die Funktion die Einsatzmöglichkeiten insbesondere in folgenden Bereichen:
- Reporting – Daten schnell visuell aufbereiten ohne BI-Tool
- Produktpräsentation – 3D-Modelle und interaktive Grafiken auf Anfrage
- Datenanalyse – explorative Visualisierungen ohne Entwicklerressourcen
⚠️ Wichtiger Hinweis: KI-generierter Code kann fehleranfällig sein. Verantwortliche sollten Ausgaben vor dem produktiven Einsatz auf inhaltliche Korrektheit prüfen. Die genaue Verfügbarkeit für alle Gemini-Tarife sowie eine mögliche tiefere Integration in Google-Unternehmensprodukte dürfte Google in den kommenden Wochen kommunizieren.
Quelle: The Decoder