Zum Hauptinhalt springen
KI-Integration9 min Lesezeit

Shadow AI im KMU: Wie Ihre Mitarbeiter Firmendaten teilen, ohne es zu wissen, und wie Sie die Kontrolle zurückgewinnen

78 % der KI-Anwender nutzen nicht freigegebene Tools. Shadow AI im KMU erkennen, bewerten und mit lokaler KI via Ollama die Kontrolle zurückgewinnen.

B
Berkan Demir
|

Die kurze Antwort zuerst

Shadow AI bezeichnet die unkontrollierte Nutzung von KI-Tools durch Mitarbeiter ohne Wissen der IT. Laut Microsoft/Civey-Studie November 2025 nutzen 78 % der KI-Anwender am Arbeitsplatz nicht freigegebene Tools. In KMUs ohne eigene IT-Abteilung ist de facto jede KI-Nutzung unkontrolliert.

Das Risiko: Firmendaten, Kundendaten, vertrauliche Inhalte verlassen das Unternehmensnetz. Ohne Auftragsverarbeitungsvertrag, ohne Kontrolle, ohne dass jemand es bemerkt.

Die Lösung, die in meiner Praxis funktioniert: Lokale KI mit Ollama auf eigener Hardware. Keine Daten verlassen das Netz. Kein Auftragsverarbeitungsvertrag nötig. Hardware-Einstieg ab 300 Euro. Einrichtung: 4-8 Stunden.

Was ich in den letzten Monaten in Berliner KMUs sehe

Seit Anfang 2026 ist in fast jedem Berliner KMU, das ich besuche, dasselbe Muster zu beobachten: Mitarbeiter nutzen KI, aber das Unternehmen hat keine KI eingeführt.

Ein Vertriebsmitarbeiter formuliert Angebote mit ChatGPT. Eine Buchhalterin fasst Monatsberichte mit Notion AI zusammen. Ein Projektleiter lässt E-Mails von Grammarly verbessern. Das Bemerkenswerte: Alle tun das in gutem Glauben. Sie wollen produktiver sein, denken nicht an Datenschutz und wissen meistens nicht, was passiert, wenn Firmendaten in einem Cloud-Dienst landen.

Die IHK-Berlin-Digitalisierungsumfrage 2026 (252 Berliner Unternehmen befragt) zeigt: 80 % der Berliner Unternehmen sind mit generativen KI-Tools wie Copilot, ChatGPT oder Mistral ausgestattet, aber nur 40 % sagen, dass sie KI offiziell einsetzen. Die Differenz ist Shadow AI.

Das ist kein Berliner Problem. Bitkom hat für 2025 erhoben, dass 40 % der deutschen Unternehmen davon ausgehen, von Shadow AI betroffen zu sein. Aber nur 26 % haben KI überhaupt offiziell freigegeben.

Die 5 typischen Anzeichen für Shadow AI in Ihrem Unternehmen

Aus meinen Bestandsaufnahmen erkenne ich Shadow AI an diesen Signalen:

  1. Plötzlich fehlerfreie, formelle E-Mails: Mitarbeiter, deren Schreiben früher holprig war, produzieren auf einmal stilsichere Texte. KI-Assistenten wie Grammarly oder ChatGPT sind der häufigste Grund.
  2. Aufgaben werden unerwartet schnell erledigt: Eine Analyse, die früher halbe Tage dauerte, ist in 30 Minuten fertig. Das ist nicht immer schlechte Zeiterfassung, manchmal ist es KI.
  3. Mitarbeiter nutzen private Accounts für berufliche Aufgaben. ChatGPT Free läuft auf dem privaten Google-Konto, das Firmen-Laptop wird dafür genutzt, und private Kreditkarten zahlen die Lizenzen.
  4. Die IT-Abteilung kennt keine KI-Tools, Mitarbeiter berichten aber davon: Wenn Sie Ihre Mitarbeiter fragen, ob sie KI nutzen, sagen viele ja. Wenn Sie die IT fragen, heißt es: „Nicht offiziell freigegeben." Beides stimmt.
  5. Im Browser-Verlauf tauchen KI-Dienste auf: api.openai.com, claude.ai, gemini.google.com, grammarly.com. Diese Domains im Browser-Verlauf oder in DNS-Protokollen sind klare Indikatoren.

Warum das ein ernstes Problem ist. Ohne Panikmache

Ich sage das selten mit dieser Direktheit: Shadow AI ist kein theoretisches Risiko. Es ist ein konkretes Problem, das ich in Berliner KMUs dokumentiert habe.

Was passiert, wenn Mitarbeiter Unternehmensdaten in kostenlose oder persönliche KI-Accounts eingeben:

  • Szenario Vertrieb gibt Kundenliste in ChatGPT Free ein: Personenbezogene Daten (Namen, E-Mails, Umsätze) landen auf OpenAI-Servern in den USA. Ob dafür ein Auftragsverarbeitungsvertrag vorliegt und ob die datenschutzrechtlichen Anforderungen für Drittlandtransfers erfüllt sind. Diese Fragen muss Ihr Datenschutzbeauftragter beantworten. Kostenlose ChatGPT-Accounts haben in der Regel keinen solchen Vertrag.
  • Szenario HR-Mitarbeiterin fasst Bewerbungsunterlagen zusammen: Bewerberdaten gehören zu besonders schutzwürdigen Informationen. Wer sie ohne entsprechende Grundlage in Cloud-Dienste eingibt, hat ein Problem. Eines, das erst auffällt, wenn eine Datenschutzbehörde nachfragt.
  • Szenario Steuerfachkraft nutzt Grammarly für Mandantenschreiben: § 57 StBerG schreibt Verschwiegenheit vor. Grammarly verarbeitet Texte auf US-Servern. Das eine schließt das andere aus. Das wissen die meisten Steuerfachangestellten nicht.

Laut IBM Cost of a Data Breach Report 2025 kosten Datenschutzvorfälle, die durch Shadow AI ausgelöst werden, durchschnittlich 4,63 Millionen USD, rund 670.000 USD mehr als konventionelle Datenschutzverletzungen. Für ein KMU ist das keine abstrakte Zahl.

Achtung

Ein gut gemeintes Verbot löst das Problem übrigens nicht. Samsung verbannte ChatGPT nach dem bekannten Datenleck von 2023. Mitarbeiter wichen auf private Geräte aus. Das Risiko verlagerte sich in unkontrolliertere Bereiche.

Welche Tools am häufigsten unkontrolliert genutzt werden

Aus meinen Bestandsaufnahmen und aktuellen Studien:

  • ChatGPT (Free/Plus): Eingaben landen im Training; 63 % aller Eingaben enthalten personenbezogene Daten (drkpi.com 2026)
  • Microsoft Copilot: EU-Datenresidenz standardmäßig deaktiviert; CLOUD Act greift für US-Behördenzugriff
  • Grammarly (Gratis): Texte und E-Mails gehen an US-Server; kein Auftragsverarbeitungsvertrag für Gratisnutzer
  • Notion AI: Alle Inhalte auf Notion-Servern (USA); automatische KI-Vorschläge aktiviert
  • Google Gemini: Ohne Workspace Enterprise landen Daten im Google-Training
  • DeepSeek: Daten nachweislich nach China geleitet; vollständige Meidung empfohlen
  • Perplexity AI: Anfragen werden gespeichert; kein Datenschutzvertrag für Gratisnutzer

So sieht ein Shadow AI-Audit aus

Bevor Sie handeln, müssen Sie wissen, wo Sie stehen. In meiner Praxis gehe ich in dieser Reihenfolge vor:

  1. Anonyme Mitarbeiterbefragung: Anonym, ohne Konsequenzen. Frage: „Welche KI-Tools nutzen Sie regelmäßig, privat oder beruflich?" Die Antworten überraschen meistens.
  2. DNS-Protokoll-Analyse: DNS-Protokolle des Routers oder der Firewall auf KI-Dienste-Domains auswerten: api.openai.com, claude.ai, gemini.google.com, grammarly.com, notion.so. Zehn Minuten Arbeit, die Klarheit schafft.
  3. Browser-Erweiterungs-Inventar auf Firmengeräten: KI-Browser-Erweiterungen sind ein häufiger, unsichtbarer Kanal. Eine kurze Kontrolle zeigt, was installiert ist.
  4. Netzwerk-Datenverkehr-Analyse: Für tiefergehende Analyse: Netzwerkverkehr auf KI-Programmierschnittstellen-Endpunkte prüfen. Das erfordert etwas mehr technischen Aufwand, ist aber der vollständigste Ansatz.

Das Software-Inventar für Shadow IT allgemein ist Teil einer vollständigen IT-Bestandsaufnahme. Alles dazu: Gewachsene IT dokumentieren: Die Schritt-für-Schritt-Anleitung.

Die Alternative: Lokale KI mit Ollama

Verbote ohne Alternativen funktionieren nicht. Das ist die Lektion aus Samsung und zahlreichen anderen Fällen.

Die Alternative, die ich in meinen KMU-Projekten einsetze: Ollama. Eine Open-Source-Software, die Sprachmodelle vollständig lokal auf Ihrer eigenen Hardware ausführt.

Was das bedeutet:

  • Kein Byte an Daten verlässt Ihr Netz
  • Kein Auftragsverarbeitungsvertrag nötig
  • Keine Drittlandtransfer-Fragen
  • Kein CLOUD-Act-Risiko
  • Keine laufenden Kosten pro Anfrage

Ollama ist aktiv in Entwicklung: aktuelle Version v0.23.2 vom 7. Mai 2026, über 4.500 Modelle verfügbar, MIT-Lizenz. Die OpenAI-kompatible Programmierschnittstelle bedeutet: Bestehende Integrationen laufen oft ohne Code-Änderung weiter.

Die Modelle, die 2026 für KMUs funktionieren

Nicht jedes Modell ist für jeden Einsatzfall geeignet. Was aus meinen Projekten und der aktuellen Forschungslage hervorgeht:

  • Qwen3 8B - erste Wahl für den Einstieg: Hersteller Alibaba Cloud (Open Source, Apache 2.0, unbegrenzte kommerzielle Nutzung). VRAM-Bedarf 6 GB (passt auf RTX 4060 mit 8 GB VRAM). Geschwindigkeit 40-55 Tokens/Sek auf RTX 4060 bzw. 45-60 Tokens/Sek auf Mac Mini M4. Sehr gutes Deutsch, starke Instruktionsbefolgung, ressourceneffizient. Anwendungsfälle: E-Mail-Entwürfe, Dokumentenzusammenfassung, Übersetzungen, Code-Hilfe. Befehl: ollama pull qwen3:8b
  • Llama 4 Scout - zweite Wahl für mehr Aufgaben: Hersteller Meta (Open Source, Llama Community License, für KMU uneingeschränkt nutzbar). VRAM-Bedarf 10 GB (passt auf RTX 4060 Ti 16 GB). Multimodal (Text + Bild), sehr lange Kontextfenster, starkes Schlussfolgern. Anwendungsfälle: Dokumentenanalyse inkl. Bilder/Scans, komplexe Analysen, dokumentenbasierte Suche. Befehl: ollama pull llama4:scout
  • Mistral Small 3.2 (24B) - für sensible Branchen: Hersteller Mistral AI (europäisches Unternehmen). VRAM-Bedarf 16 GB, kein US-amerikanischer Hintergrund. Anwendungsfälle: Hochwertige Texterstellung, Kundenkommunikation. Befehl: ollama pull mistral-small

Realistische Hardware: Was es kostet und was es kann

Aus meinen Projekten und den aktuellen Marktpreisen (Stand Mai 2026):

  • Einstieg: Bestehender PC + GPU-Upgrade (150-300 Euro): Vorhandener Büro-PC + NVIDIA RTX 4060 (ca. 280-320 Euro). Geeignet für 1-3 Mitarbeiter, Modelle bis 8B. Geschwindigkeit: 40-55 Tokens/Sek. Einrichtungszeit: 2-4 Stunden.
  • KMU-Standard: Dedizierter Mini-PC (600-1.000 Euro): Minisforum UM790 Pro, Beelink SER8 (Ryzen 9, 32 GB DDR5) oder Mac Mini M4 (699 Euro, 16 GB RAM). Geeignet für 3-10 Mitarbeiter über Open WebUI, Modelle 8B-14B. Geschwindigkeit: 35-60 Tokens/Sek. Einrichtungszeit: 4-8 Stunden inkl. Mehrbenutzer-Einrichtung. Beste Balance Preis/Leistung für ein typisches Berliner KMU.
  • Produktiv: Workstation für Team (2.500-5.000 Euro): PC mit NVIDIA RTX 4090 (24 GB VRAM) oder RTX 5080, 64 GB RAM. Geeignet für 10-30 Mitarbeiter, Modelle 32B-70B, produktive dokumentenbasierte Suche. Laufende Kosten: ca. 40-60 Euro Strom pro Monat.

Hinweis

Was das im Vergleich zu Cloud-KI kostet: ChatGPT Plus kostet 20 Euro/Monat pro Person. Bei 10 Mitarbeitern: 2.400 Euro/Jahr. Lokale Lösung: Mac Mini M4 (699 Euro) + 3 Stunden Einrichtung. Laufende Kosten: ca. 2 Euro/Monat Strom. Amortisation: ca. 3,5 Monate. Das sind Zahlen aus einem aktuellen Kostenvergleich von Skill-Sprinters (2026).

Die Benutzeroberfläche: Damit Mitarbeiter die lokale KI nutzen

Ollama allein ist ein Hintergrunddienst. Damit alle Mitarbeiter im Team darauf zugreifen können, braucht es eine Oberfläche:

  • Open WebUI: die vollständige ChatGPT-Alternative auf eigener Infrastruktur. Rollenbasierte Zugriffssteuerung, Einzelanmeldung, Nutzungsquoten, Admin-Dashboard. Läuft als Container im lokalen Netz. Alle Mitarbeiter greifen über den Browser zu. Beste Wahl für die meisten KMUs.
  • AnythingLLM: für dokumentenintensive Unternehmen. Arbeitsbereichsbasierte Dokumentensuche: Jede Abteilung hat ihren eigenen Dokumenten-Arbeitsbereich. Kanzleien, Beratungsunternehmen und Verwaltungen profitieren besonders. Ebenfalls als Container, vollständig lokal.

Ein Muster, das ich aus Gesprächen kenne

Aus meinen Gesprächen mit KMU-Geschäftsführern höre ich ein wiederkehrendes Muster: Mitarbeiter im Marketing oder Vertrieb nutzen Cloud-KI für Kundentexte, manchmal mit sensiblen Briefings, ohne dass ein Auftragsverarbeitungsvertrag dafür existiert. Spätestens bei einem Datenschutz-Audit auf Kundenseite wird das zum Thema. Die Folge ist nicht selten der Verlust des Auftrags. Konkrete Schadenshöhe variiert, aber selbst ein einzelner verlorener Kunde rechtfertigt die Investition in lokale KI.

Häufige Einwände und was dahinter steckt

  • „Lokale KI ist zu langsam." - Qwen3 8B auf einer RTX 4060 liefert 40-55 Tokens/Sek. ChatGPT GPT-4o liefert 40-80 Tokens/Sek. Für normale Büroaufgaben (E-Mails, Zusammenfassungen, interne Recherche) ist der Unterschied in der Praxis nicht spürbar.
  • „Das ist zu kompliziert." - Ollama installieren: Download, Doppelklick, fertig. Erstes Modell: ollama pull qwen3:8b in der Befehlszeile. Open WebUI: ein Container-Befehl. Gesamtaufwand für eine IT-affine Person: 2-4 Stunden. Gesamtaufwand für ein vollständiges Mehrbenutzer-KMU-Setup mit mir: ein Arbeitstag.
  • „Wir brauchen eine teure NVIDIA-GPU." - Für 7-8B-Modelle reicht ein Mini-PC mit 32 GB RAM, auch ohne dedizierte Grafikkarte. Die Geschwindigkeit (5-25 Tokens/Sek auf der CPU) ist für asynchrone Aufgaben ausreichend. Eine RTX 4060 für 280-320 Euro macht es für Echtzeit-Chat tauglich.
  • „ChatGPT Enterprise ist doch abgesichert." - Enterprise schützt vor OpenAI-Training-Nutzung. Der US CLOUD Act bleibt aber bestehen: US-Behörden können Zugriff auf Daten einfordern, unabhängig vom Serverstandort. Ob das für Ihre Branche und Ihre Daten relevant ist, ist eine Einschätzung für Ihren Datenschutzbeauftragten.

Was KI außerdem mit Backups zu tun hat

Wenn Sie lokale KI einrichten: Ollama-Modelle, Konfigurationen und eventuell dokumentenbasierte Datenbanken müssen in Ihre Backup-Strategie eingebunden sein. Das ist ein Punkt, der in meinen Projekten regelmäßig vergessen wird.

Mehr dazu: KMU-Backup-Strategie 2026.

Und wenn Sie noch keine vollständige IT-Bestandsaufnahme haben: Shadow AI-Audit und IT-Dokumentation gehen Hand in Hand. Mehr dazu: Gewachsene IT dokumentieren.

Mein Fazit

Shadow AI ist kein Skandal. Es ist die logische Konsequenz daraus, dass KI-Tools immer einfacher zugänglich sind und dass Unternehmen keine strukturierte Alternative anbieten.

Die Mitarbeiter sind nicht das Problem. Die fehlende Alternative ist das Problem.

Lokale KI mit Ollama ist in 2026 für die meisten KMU-Anwendungsfälle technisch ausgereift, wirtschaftlich sinnvoll und datenschutzrechtlich die unkomplizierteste Lösung. Man muss es wollen.

Was ich in meinen Projekten sehe: Wer erst eine lokale KI-Lösung einrichtet und dann klar kommuniziert „Das ist unser KI-Tool, das nutzen wir", der hat das Shadow AI-Problem in 90 % der Fälle gelöst. Ohne Verbot. Ohne Kontrollwahn. Mit einer guten Alternative.