Datenvisualisierung auf einem Monitor mit komplexen Charts und Grafiken
KI-Benchmarks, wt

Neuer Benchmark zeigt: KI-Modelle scheitern an komplexen Diagrammen

Ein neuer Benchmark namens RealChart2Code testet, wie gut führende KI-Modelle in der Lage sind, komplexe Datenvisualisierungen aus realen Datensätzen in ausführbaren Code umzuwandeln. Das Ergebnis ist ernüchternd: Selbst die leistungsstärksten proprietären Modelle verlieren dabei im Vergleich zu einfacheren Tests nahezu die Hälfte ihrer Leistungsfähigkeit.