Shadow IT 2.0: Wie Mitarbeiter mit KI-Tools unbemerkt Millionenbudgets verbrauchen

(Symbolbild)

Shadow IT 2.0: Wie Mitarbeiter mit KI-Tools unbemerkt Millionenbudgets verbrauchen

Unternehmen stehen vor einem neuen Kostenproblem: Mitarbeiter nutzen zunehmend eigene AI-Accounts für kleinteilige Aufgaben und treiben damit die Ausgaben für Large Language Models in ungeplante Höhen. Die kurze Ära des sorglosen “Tokenmaxxings” – der maximalen Nutzung von AI-Kapazitäten – scheint vorbei, Unternehmen reagieren mit strikteren Kontrollmechanismen.

Von der Freigabe zur Rationierung

Die anfängliche Euphorie um generative AI hat viele Firmen dazu verleitet, Mitarbeitern weitreichende Freiheiten bei der Nutzung von Tools wie ChatGPT, Claude oder Gemini einzuräumen. Doch die Rechnung folgt prompt: Einzelne Prompts mögen nur Cent-Beträge kosten, aggregiert über Tausende Mitarbeiter und Millionen Anfragen entstehen erhebliche Budgetposten. TechCrunch berichtet von einem Phänomen, das als “Tokenmaxxing” bezeichnet wurde – der unreflektierten Maximierung von Token-Verbrauch für marginale Produktivitätsgewinne (TechCrunch AI). Die Konsequenz ist eine rasche Rückkehr zu kontrollierteren Modellen.

Die Governance-Lücke in deutschen Unternehmen

Für deutschsprachige Unternehmen verschärft sich das Problem durch regulatorische Besonderheiten. Während US-Firmen primär Kosten im Blick haben, müssen europäische Organisationen zusätzlich DSGVO-Konformität, Datensouveränität und die EU-AI-Verordnung beachten. Mitarbeiter, die private AI-Accounts für geschäftliche Zwecke nutzen, verarbeiten potenziell personenbezogene oder vertrauliche Daten außerhalb kontrollierter Infrastrukturen. Diese Form von “Shadow AI” erinnert an die Shadow-IT-Problematik der frühen Cloud-Ära, nur mit höheren finanziellen und rechtlichen Risiken.

Strategien zur Kostenkontrolle

Erste Unternehmen setzen auf technische und organisatorische Maßnahmen: zentrale AI-Gateways mit Usage-Tracking, Budget-Caps pro Abteilung oder verpflichtende Freigabeprozesse für Premium-Modelle. Accenture wird in dem Zusammenhang als Beispiel für eine Beratungsfirma genannt, die aktiv an Governance-Frameworks arbeitet (TechCrunch AI). Kritisch bleibt die Balance zwischen Kontrolle und Nutzbarkeit – zu strenge Restriktionen treiben Mitarbeiter zurück in nicht überwachte private Nutzung. Erfolgreiche Unternehmen etablieren transparente Metriken, die Kosten pro AI-gestütztem Prozess sichtbar machen und so bewusstere Entscheidungen ermöglichen.

Die Token-Rationierung markiert einen Reifungsprozess der AI-Nutzung im Unternehmenskontext. Für deutsche Führungskräfte bedeutet dies: Die Phase des unkoordinierten Experimentierens endet, strukturierte AI-Governance wird zum Wettbewerbsfaktor. Wer früh klare Regeln für Modellauswahl, Datenflüsse und Kostenverantwortung definiert, vermeidet nicht nur Budgetüberschreitungen, sondern positioniert sich auch regulatorisch robust.