Anthropics Sicherheitsbericht zu Claude: Messlücken beim eigenen System
Anthropic hat mit dem Sicherheitsbericht zu seinem neuesten Modell Claude Mythos ungewöhnlich offen eingeräumt, dass die eigenen Evaluierungsmethoden mit der Leistungsfähigkeit des Systems nicht mehr Schritt halten. Der Bericht dokumentiert konkrete Risiken – und offenbart dabei ein strukturelles Problem, das weit über dieses einzelne Modell hinausgeht.