Neuer Benchmark zeigt: KI-Modelle scheitern an komplexen Diagrammen
Ein neuer Benchmark namens RealChart2Code testet, wie gut führende KI-Modelle in der Lage sind, komplexe Datenvisualisierungen aus realen Datensätzen in ausführbaren Code umzuwandeln. Das Ergebnis ist ernüchternd: Selbst die leistungsstärksten proprietären Modelle verlieren dabei im Vergleich zu einfacheren Tests nahezu die Hälfte ihrer Leistungsfähigkeit.