Datenfluss-Visualisierung

Welche Daten bleiben lokal, welche dürfen zur Cloud? Hier die komplette Transparenz für jeden Datentyp.

Die drei Datenzonen

Jede Information lebt in genau einer Zone — und kann nur durch definierte Übergänge wechseln.

Zone 1
👤
User-Bereich
Browser, Terminal, Editor
📝 Klartext-Aufgabe
Finales Ergebnis
📊 Audit-Log lesbar
Zone 2 — LOKAL
🛡️
private-ai-bridge + Gemma
Auf deinem Rechner
🔒 JSON mit Klarnamen
📞 Telefonnummern
📧 E-Mail-Adressen
🏠 Adressen
🗂️ Lookup-Tabelle
📜 Audit-Log
Zone 3 — CLOUD
☁️
Claude API
Anthropic-Server
📊 Aggregate (Schnitte)
📈 Statistiken (Anzahl)
🎭 Tokens [PERS_a3f2]
📝 Generierter Text
Sensible Daten — bleiben in Zone 2
Sichere Daten — dürfen in Zone 3
Tokens — sicher, aber rückübersetzbar

Was ist sensibel?

Die Klassifizierung jeder Datenkategorie nach Sicherheitsstufe.

Kategorie Stufe Behandlung Token-Format
Vor- und Nachname L1 — Direkt identifizierend Immer pseudonymisieren oder weglassen [PERS_a3f2]
E-Mail-Adresse L1 — Direkt identifizierend Immer pseudonymisieren [EMAIL_b7c1]
Telefonnummer L1 — Direkt identifizierend Immer pseudonymisieren [TEL_d9e4]
Postadresse (Straße + Nr) L1 — Direkt identifizierend Immer pseudonymisieren [ADDR_e1f2]
SVNr L1 — Direkt identifizierend Niemals an Cloud — auch nicht pseudonymisiert
Geburtsdatum L2 — Quasi-identifizierend Alleine OK; mit Klasse + Schule = L1 [GEB_a1b2]
PLZ + Ort L2 — Quasi-identifizierend Bei kleinen Orten pseudonymisieren [ORT_c3d4]
Noten L3 — Sensibel im Kontext OK ohne Personenzuordnung
Bemerkungen (LRS, ADHS) L3 — Sensibel im Kontext OK ohne Personenzuordnung
Klassendurchschnitt L4 — Aggregiert Unbedenklich
Anzahl Schüler L4 — Aggregiert Unbedenklich

Zeitlicher Ablauf: Wintersportwoche planen

Was passiert in welcher Reihenfolge — und wer sieht was?

User

00:00 — Aufgabe gestellt

"Plane die Wintersportwoche der 3a — Gruppen, Begleiter, Notfall-Datenblätter, Eltern-Briefe."

Claude

00:01 — Klassifiziert die Teilaufgaben

Logistik (Gruppen, Bus) → ich kann das. Notfall-Datenblätter, Eltern-Briefe → nur lokal!

Gemma 4 lokal

00:02 — Liest sensible Datei

Volle Schülerdaten mit Allergien, Medikamenten, Adressen, Familienverhältnissen.

Gemma 4 lokal

00:08 — Erstellt anonymisierte Logistik-Profile

Nur Sportwahl, Niveau, Größen, Flags ("allergie_ja_nein"). Keine spezifischen Allergien.

Leak-Check

00:08 — Sicherheits-Scan

Prüft: enthält Gemmas Output Klarnamen oder spezifische Allergien? Falls ja → blockiert.

Claude API

00:09 — Plant Logistik

Bildet 4 Gruppen, weist Begleitlehrer zu, erstellt Bus-Sitzplan, Leihausrüstungs-Liste.

Gemma 4 lokal

00:15 — Generiert Notfall-Datenblatt

Mit echten Namen, Allergien, Medikamenten, Notfallkontakten. Nur für Begleitlehrer.

Gemma 4 lokal

00:25 — Generiert 7 personalisierte Eltern-Briefe

Mit echten Namen, individueller Packliste je nach Sportwahl, Hinweis auf Förderantrag.

private-ai-bridge

00:30 — Mappt Logistik-Pläne zu Namen

Claudes Gruppen-Plan (mit IDs) wird lokal mit echten Namen aufgelöst.

User

00:31 — Komplettes Paket

4 Gruppen, Bus-Plan, Notfall-Liste, 7 Eltern-Briefe, 2 Förderanträge — druckfertig.

Strategien je nach Aufgabe

Nicht jede Aufgabe braucht denselben Schutz. Drei typische Szenarien:

📊 Logistik / Aggregate

Strategie: Delegation an Gemma

"Bilde Gruppen, plane Bus-Sitzplan, berechne Leihausrüstung"

Gemma liest + extrahiert FelderClaude plant Logistik mit IDs

✓ Claude sieht nur Sportwahl/Niveau, keine Identitäten

🚑 Sensible Dokumente

Strategie: Komplett lokal

"Notfall-Datenblatt mit Allergien, Medikamenten, Notfallkontakten"

Gemma generiert DokumentDirekt zum User

✓ Claude sieht NICHTS — auch nicht Aufgabe oder Ergebnis

📨 Personalisierte Texte

Strategie: Lokal + Vorlage von Claude

"Eltern-Briefe mit individueller Packliste je nach Sportwahl"

Claude schreibt VorlageGemma füllt mit echten Daten

✓ Claude liefert nur Template, Namen kommen lokal rein

Wo das Framework an Grenzen stößt

Ehrlichkeit über die Limitierungen.

⚠️

Lokale Performance

Gemma 4 E4B braucht ~6 GB RAM und ist langsamer als Cloud-Claude. Bei sehr großen Datenmengen kann die lokale Verarbeitung Minuten dauern.

⚠️

Gemmas Sprachfähigkeit

Gemma ist gut, aber nicht so kreativ wie Claude. Anonymisierung und Aggregation klappt zuverlässig, komplexe Schreibaufgaben besser an Claude delegieren.

⚠️

Halluzinationen möglich

Selbst mit Leak-Check kann Gemma in Edge-Cases PII halluzinieren oder durchsickern lassen. Wichtige Daten zusätzlich über Permission-Deny absichern.

⚠️

Vertrauen in den User

Wenn der User Klardaten direkt in den Prompt tippt, ist das Framework machtlos. Optional kann ein UserPromptSubmit-Hook nachgerüstet werden.

Bereit loszulegen?

Klone das Repo, führe den Installer aus, starte Claude Code.

Auf GitHub → Demo nochmal ansehen