KI-Sicherheit

KI-Sicherheitsforschung: Automatisiertes Alignment-Testing
KI-Sicherheit, wt

KI-Sicherheitsforschung automatisieren: Wenn Modelle ihre eigene Ausrichtung prüfen

Die Idee, Alignment-Forschung mithilfe von KI-Systemen zu beschleunigen, gewinnt in Fachkreisen zunehmend an Gewicht. Das Prinzip ist einfach formuliert, aber schwer umzusetzen: Statt dass Menschen mühsam prüfen, ob ein Modell die gewünschten Werte und Verhaltensweisen korrekt verinnerlicht hat, sollen KI-Systeme dabei helfen, eben diese Prüfprozesse selbst zu übernehmen oder zumindest zu unterstützen.

Digitale Gesichtserkennung und KI-Manipulation als Sicherheitsbedrohung
KI-Sicherheit, wt

Deepfakes in der Unternehmenskommunikation: Ein unterschätztes Sicherheitsrisiko

KI-generierte Fälschungen von Audio, Video und Text haben eine Qualität erreicht, die selbst geschulte Fachkräfte vor ernsthafte Erkennungsprobleme stellt. Für Unternehmen entstehen dadurch konkrete Risiken – von manipulierten CEO-Statements bis hin zu gefälschten Kundenanfragen und Lieferantenkorrespondenz. Die technische Einstiegshürde für solche Angriffe sinkt dabei kontinuierlich.

Sicherheitsprüfung und digitale Compliance
KI-Sicherheit, wt

Sicherheitsvorfälle bei KI-Compliance-Startup Delve nehmen zu

Das US-amerikanische Compliance-Startup Delve steht nach einem weiteren Sicherheitsvorfall bei einem seiner Kunden unter erheblichem Druck. TechCrunch bestätigte, dass Delve das Unternehmen war, das die Sicherheitszertifizierungen für das KI-Startup Context AI durchgeführt hatte – kurz bevor dieses selbst einen schwerwiegenden Sicherheitsvorfall öffentlich machen musste.

Sicherheitsforscher analysiert Code auf mehreren Monitoren in abgedunkeltem Serverraum
KI-Sicherheit, wt

Anthropic untersucht unbefugten Zugriff auf intern gesperrtes KI-Sicherheitsmodell

Anthropic, der US-amerikanische KI-Entwickler hinter dem Sprachmodell Claude, hat Ermittlungen eingeleitet, nachdem Berichte über einen nicht autorisierten Zugriff auf ein intern entwickeltes Modell mit dem Codenamen „Mythos” aufgetaucht sind. Das berichtet The Guardian unter Berufung auf Insiderinformationen. Besondere Brisanz erhält der Vorfall dadurch, dass Mythos offenbar explizit für die Erforschung von Cyberangriffsmethoden entwickelt wurde und regulären Nutzern nicht zugänglich sein sollte.

Netzwerk-Tunnel und digitale Verbindungen
KI-Sicherheit, wt

OpenClaw: Windscribe ermöglicht KI-Agenten den Zugriff auf VPN-Netzwerke

Der kanadische VPN-Anbieter Windscribe hat mit „OpenClaw” ein Framework vorgestellt, das autonomen KI-Agenten ermöglicht, sich in VPN-Netzwerke einzuwählen und diese eigenständig zu nutzen. Das Projekt markiert einen Schritt in der Entwicklung sogenannter Agentic AI – also KI-Systemen, die selbstständig Aufgaben im Netz ausführen, ohne menschliche Eingriffe.

Scroll to Top