Sensible Daten lokal verarbeiten — Cloud-KI nutzen ohne Datenleck

Ein Framework für Claude Code, das personenbezogene Daten ausschließlich auf deinem Rechner verarbeitet. Lokales LLM (Gemma) bleibt Wächter, Claude bekommt nur anonymisierte Aggregate.

Live-Demo ansehen So funktioniert's

Die Architektur

Drei Akteure, klar getrennt: User und lokales LLM kennen die echten Daten. Cloud-KI bekommt nur anonymisierte Aggregate.

Mensch
👤
User
Stellt Aufgabe
Lokal
🛡️
Gemma 4
Liest sensible Daten
Aggregiert / pseudonymisiert
Cloud
☁️
Claude Code
Bekommt nur
anonymisierte Daten
Lokal
🔓
Re-Mapping
Tokens zurück
in Klartext
Sieht alle echten Daten
Sieht alle echten Daten (lokal)
Sieht nur anonymisierte Aggregate

Wieso überhaupt Claude? Wieso nicht alles lokal?

Berechtigte Frage. Die ehrliche Antwort: Spezialisierung. Lokale und Cloud-KI sind nicht gleich gut — sie sind in verschiedenen Dingen brillant.

🛡️ Was Gemma 4 lokal gut kann

~4 Milliarden Parameter, läuft auf 16 GB RAM. Optimiert für strukturierte Aufgaben.

  • ✓ Daten aus Dateien extrahieren
  • ✓ Felder filtern und anonymisieren
  • ✓ Personenbezüge erkennen
  • ✓ Einfache Texte aus Vorlagen befüllen
  • ✓ Aggregate berechnen (Durchschnitt, Anzahl)

☁️ Was Claude (Cloud) viel besser kann

~200+ Milliarden Parameter, riesige Trainingsbasis. Spezialisiert auf komplexe Aufgaben.

  • Strategisches Planen mit vielen Constraints
  • Kreatives Schreiben (Briefe, Anträge, Berichte)
  • Strukturiertes Reasoning über komplexe Sachverhalte
  • Code-Generierung und Refactoring
  • Domänenwissen (Recht, Pädagogik, Verwaltung)

💡 Die Analogie

Gemma ist wie ein Anwaltsgehilfe: kennt die Akten, sortiert, schwärzt sensible Stellen, fasst zusammen.
Claude ist wie ein spezialisierter Anwalt: bekommt die geschwärzten Akten und schreibt darauf basierend strategisch durchdachte Plädoyers.

Niemand würde sagen "schick einfach den Anwaltsgehilfen vor Gericht" — beide haben ihre Rolle. Die Cloud-KI ist nicht ersetzbar bei strategischen Aufgaben. Aber sie braucht keinen Zugriff auf identifizierende Daten, um diese Aufgaben zu lösen.

Konkretes Beispiel: Wintersportwoche

Gemma macht:

Schülerdaten lesen → anonymisieren → Eltern-Brief mit Vorlage befüllen → Notfall-Liste ausdrucken

Claude macht:

Optimale Gruppeneinteilung mit Niveau- und Größen-Constraints, Brief-Vorlagen formulieren, komplette Förderanträge mit Begründung schreiben

Zwei Ansätze, ein Ziel

Das Framework bietet zwei Strategien, je nach Aufgabe und Datensensibilität.

🛡️ Delegation an Gemma

Claude weiß: "Da liegen sensible Daten, die ich nicht sehen darf." Es ruft Gemma als Tool auf — Gemma liest die Datei lokal, verarbeitet sie und gibt nur Aggregate zurück.

  • Sensible Datei nie in Cloud
  • Aggregate (Durchschnitt, Anzahl) sind sicher
  • Klare Audit-Spur
  • Permission-System verhindert Bypass

🔄 Pseudonymisierung

Wenn Claude doch mit Personen-Kontext arbeiten muss: Lokales Mapping ersetzt Namen durch Tokens wie [PERS_a3f2]. Claude arbeitet damit, lokal wird zurückübersetzt.

  • Klarnamen bleiben lokal
  • Claude versteht Person-Kontext
  • Reversibel über lokale Lookup-Tabelle
  • Leak-Detector als Sicherheitsnetz

Was das Framework liefert

Ein MCP-Server für Claude Code mit sechs Tools.

🔍

gemma_query

Lässt das lokale LLM eine Datei verarbeiten und gibt nur das anonymisierte Ergebnis an Claude zurück.

🎭

pseudonymize

Ersetzt echte Namen, E-Mails, Telefonnummern durch stabile Tokens. Lokale Lookup-Tabelle.

🔓

depseudonymize

Wandelt Tokens zurück in Klartext. Claude liefert Pseudo-Antwort, du siehst echte Namen.

📋

show_mappings

Zeigt die aktuelle Zuordnungstabelle: welcher echte Wert wurde welchem Token zugewiesen.

📜

show_audit_log

Vollständiges Audit-Log aller Verarbeitungen — DSGVO Art. 30 konform.

⚙️

system_status

Status der lokalen Ollama-Installation und verfügbarer Modelle.

Schnellstart

In drei Schritten startklar.

1. Repository klonen

git clone https://github.com/harubert/private_ai_bridge.git
cd private_ai_bridge

2. Installer ausführen (testet Hardware, lädt passendes Gemma-Modell)

./install.sh

3. Claude Code in diesem Verzeichnis starten

claude

Der MCP-Server wird automatisch erkannt. Sechs neue Tools stehen Claude zur Verfügung.

Sieh es in Aktion

Schritt-für-Schritt-Demo am Beispiel Wintersportwoche organisieren: 7 Schüler mit Sportwahl, Allergien, Medikamenten und Sozialermäßigungen. Echte Verwaltungsaufgabe, transparenter Datenfluss.

Zur Demo → Datenfluss visualisiert

Über dieses Projekt

private-ai-bridge ist eine technische Veröffentlichung von Thomas Schroffenegger, MSc MAS BEd — entstanden aus der praktischen Notwendigkeit, Claude Code im österreichischen Schulalltag DSGVO-konform einzusetzen.

Das Konzept und die Referenzimplementierung stehen als Open Source unter MIT-Lizenz zur freien Nutzung, Adaption und Weiterentwicklung. Anwendungsbereich weit über das Schulwesen hinaus: überall dort, wo personenbezogene Daten anfallen, die nicht in die Cloud dürfen — Personalwesen, Gesundheitsbereich, Recht, Beratung, Sozialarbeit.

Konzept & Realisierung: Thomas Schroffenegger, MSc MAS BEd
Erstveröffentlichung: April 2026
Lizenz: MIT (Code) + CC BY-SA 4.0 (Konzept) — beide mit Namensnennung
Repository: github.com/harubert/private_ai_bridge