Startseite/ Blog/ Compliance
Compliance

DSGVO-konforme KI-Telefonie: Was Unternehmen wirklich wissen müssen

Christoph Scholz
Christoph Scholz Partner für Recht & Compliance
26. März 2026 16 min Lesezeit
DSGVO-konforme KI-Telefonie: Was Unternehmen wirklich wissen müssen

KI-Telefonie ist technologisch beeindruckend – aber rechtlich ein Minenfeld, wenn man es falsch angeht. Seit dem Inkrafttreten des EU AI Act im August 2025 gelten für KI-Systeme, die direkt mit Menschen interagieren, strenge Transparenz- und Dokumentationspflichten. Kombiniert mit der DSGVO entsteht ein Regelwerk, das viele Anbieter nur oberflächlich umsetzen. Dieser Artikel erklärt, was wirklich gilt, was du als Unternehmen beachten musst – und wie du auf der sicheren Seite bleibst.

DSGVO-Grundlagen: Was bei KI-Telefonaten gilt

Jedes KI-geführte Telefonat verarbeitet personenbezogene Daten. Allein die Telefonnummer des Anrufers ist ein personenbezogenes Datum. Dazu kommen potenziell: Name, Adresse, E-Mail, Anliegen und – je nach Gesprächsinhalt – auch besondere Kategorien wie Gesundheitsdaten oder finanzielle Informationen.

Die DSGVO verlangt für jede Verarbeitung eine Rechtsgrundlage. Für KI-Telefonie kommen in der Praxis drei Rechtsgrundlagen in Frage:

Wichtig: Die reine Sprachverarbeitung in Echtzeit (Speech-to-Text für die Gesprächsführung) ist keine Aufzeichnung. Die KI wandelt das Gesagte in Text um, verarbeitet es und antwortet – das Audio wird nicht gespeichert. Erst wenn eine explizite Aufnahme-Funktion aktiviert wird, greift die Einwilligungspflicht.

Technischer Datenfluss: Wo fließen die Daten hin?

Um DSGVO-Konformität wirklich zu verstehen, musst du wissen, welche Systeme bei einem KI-Telefonat beteiligt sind – und an welcher Stelle welche Daten verarbeitet werden. Hier ist der vollständige Datenfluss, Schritt für Schritt:

  1. Anrufer wählt die Nummer → Telefonie-Infrastruktur: Der Anruf wird über das öffentliche Telefonnetz (PSTN) an unseren SIP-Trunk geroutet. An diesem Punkt wird die Telefonnummer des Anrufers übermittelt (Caller-ID). Die Telefonie-Infrastruktur läuft auf EU-Servern – kein Routing über US-amerikanische Zwischenstationen. Die Verbindung wird per TLS 1.3 verschlüsselt.
  2. Telefonie → Speech-to-Text (STT): Das Audio-Signal des Anrufers wird in Echtzeit an das Spracherkennungsmodell gestreamt. Dieses Modell läuft auf EU-gehosteten Servern (Deutschland/Niederlande). Das Audio wird ausschließlich für die Echtzeit-Transkription verarbeitet und danach sofort verworfen – es wird kein Audio-Rohmaterial gespeichert. Was bleibt, ist der transkribierte Text.
  3. STT → Large Language Model (LLM): Der transkribierte Text wird zusammen mit dem Gesprächskontext (bisheriger Verlauf, CRM-Daten des Anrufers) an das Sprachmodell übergeben. Das LLM läuft ebenfalls auf EU-Servern. Es formuliert die Antwort basierend auf der konfigurierten Gesprächslogik und den verfügbaren Daten. Weder der Eingabetext noch die Antwort verlassen den EU-Rechtsraum.
  4. LLM → Text-to-Speech (TTS): Die Textantwort des LLM wird an das Sprachsynthesemodell übergeben, das daraus natürliche Sprache generiert. Auch dieses Modell läuft auf EU-Servern. Das generierte Audio wird direkt an den Anrufer gestreamt und nicht dauerhaft gespeichert.
  5. TTS → Anrufer: Das Audio wird über die verschlüsselte Telefonverbindung an den Anrufer ausgegeben. Die Latenz unserer Dualplex-Architektur liegt bei 300–600 Millisekunden – schnell genug für ein natürliches Gespräch.
  6. Post-Call → CRM (optional): Nach dem Gespräch werden die strukturierten Ergebnisse (Name, Anliegen, Termin, Aufgabe) an dein CRM übermittelt. Diese Übertragung erfolgt über verschlüsselte API-Verbindungen. Im CRM selbst unterliegen die Daten deiner eigenen Datenschutzpolitik.

Das entscheidende Prinzip: An keiner Stelle verlassen Daten den EU-Rechtsraum. Alle beteiligten Systeme – Telefonie, STT, LLM, TTS – laufen auf EU-gehosteter Infrastruktur in deutschen und niederländischen Rechenzentren. Es gibt keinen Datentransfer in die USA oder andere Drittländer. Damit entfallen sämtliche Problematiken rund um Schrems-II, Standard Contractual Clauses (SCCs) und Angemessenheitsbeschlüsse.

Automatisches Daten-Masking: Schutz sensibler Informationen

In Telefongesprächen werden regelmäßig sensible Daten genannt – oft unbeabsichtigt. Ein Anrufer diktiert seine Kreditkartennummer, nennt seine Personalausweisnummer oder teilt eine IBAN mit. Diese Informationen dürfen nicht ungeschützt in Gesprächsprotokollen oder CRM-Einträgen landen.

Unser System erkennt automatisch sensible Datenmuster in der Echtzeit-Transkription und maskiert sie, bevor sie gespeichert werden:

Das Masking greift auf zwei Ebenen: Erstens in der Echtzeit-Transkription, sodass das gespeicherte Gesprächsprotokoll von Anfang an keine vollständigen sensiblen Daten enthält. Zweitens in den CRM-Einträgen, die der Agent nach dem Gespräch automatisch erstellt. Du musst dich also nicht darauf verlassen, dass ein Mitarbeiter im Nachhinein sensible Daten aus Notizen löscht – das System macht es automatisch und zuverlässig.

Für den Fall, dass verschlüsselte Gesprächsaufzeichnungen (Audio) aktiviert sind, werden die Aufnahmen zusätzlich mit AES-256-Verschlüsselung im Ruhezustand gespeichert. Die Verschlüsselungsschlüssel werden getrennt von den Audiodaten verwaltet, sodass selbst bei einem hypothetischen Servereinbruch kein Zugriff auf die Aufnahmen möglich wäre.

DTMF-Eingabe: Datenschutzfreundliche Alternative für sensible Daten

Manche Informationen sollten gar nicht erst gesprochen werden – weil sie über das Mikrofon potenziell von Dritten im Raum mitgehört werden können oder weil die Spracherkennung bei komplexen Zeichenfolgen fehleranfällig ist. Für diese Fälle bieten wir eine DTMF-Eingabe über die Telefontastatur an.

DTMF steht für Dual-Tone Multi-Frequency – das klassische Tonwahlverfahren, das du von Hotlines kennst. Der KI-Agent kann den Anrufer gezielt auffordern, bestimmte Informationen über die Tastatur einzugeben:

Aus DSGVO-Perspektive hat DTMF einen entscheidenden Vorteil: Die eingegebenen Ziffern werden nicht über das Spracherkennungsmodell verarbeitet. Sie kommen als reine Signaldaten an und werden direkt an die Business-Logik übergeben. Das reduziert die Angriffsfläche und minimiert die Verarbeitungsschritte, in denen personenbezogene Daten exponiert sind.

EU AI Act: Neue Transparenzpflichten seit 2025

Der EU AI Act stuft KI-Systeme nach Risikokategorien ein. KI-Telefonagenten, die direkt mit Menschen interagieren, fallen unter die Transparenzpflichten nach Art. 50. Das bedeutet konkret:

  1. Offenlegungspflicht: Der Anrufer muss zu Beginn des Gesprächs darüber informiert werden, dass er mit einem KI-System spricht. Ein Satz wie „Du sprichst mit Lena, der virtuellen Assistentin von Immobilien Müller" reicht aus.
  2. Keine Täuschung: Das KI-System darf nicht den Eindruck erwecken, ein Mensch zu sein. Das betrifft sowohl den Gesprächsinhalt als auch die Stimmqualität. Unsere Agenten verwenden natürliche, aber klar als KI erkennbare Stimmen.
  3. Dokumentationspflicht: Als Anbieter eines KI-Systems müssen wir dokumentieren, wie das System funktioniert, welche Daten verarbeitet werden und welche Maßnahmen zur Risikominimierung getroffen wurden.

KI-Telefonagenten werden vom EU AI Act nicht als Hochrisiko-System eingestuft – sofern sie keine Entscheidungen treffen, die wesentliche rechtliche Auswirkungen auf Personen haben. Ein Agent, der Termine bucht und Informationen weitergibt, fällt in die Kategorie „begrenztes Risiko". Ein Agent, der eigenständig über Kreditvergaben entscheidet, wäre Hochrisiko. Unsere Agenten qualifizieren Leads und buchen Termine – sie treffen keine rechtsverbindlichen Entscheidungen.

Art. 50 im Detail: Was die Transparenzpflicht praktisch bedeutet

Die Transparenzpflicht nach Art. 50 EU AI Act klingt auf dem Papier einfach – in der Praxis gibt es aber viele Fragen. Hier die wichtigsten Antworten:

Wann genau muss die KI-Offenlegung erfolgen? Zu Beginn des Gesprächs, bevor substanzielle Inhalte ausgetauscht werden. In der Praxis heißt das: Der allererste Satz des Agenten muss die KI-Eigenschaft offenlegen. Ein späterer Hinweis (z. B. am Ende des Gesprächs) ist nicht ausreichend.

Wie implementieren wir das? Über eine konfigurierbare Begrüßung mit KI-Offenlegung. Im Prompt-Editor mit Gesprächsflüssen definierst du den exakten Begrüßungstext. Die Standardvorlage lautet beispielsweise: „Hallo, du sprichst mit [Name], der virtuellen Assistentin von [Firmenname]. Ich bin eine KI und helfe dir gerne weiter." Du kannst den Text an deinen Stil anpassen – solange die KI-Eigenschaft klar kommuniziert wird. Der Prompt-Editor verhindert, dass eine Begrüßung ohne KI-Hinweis gespeichert wird.

Was gilt bei einer Weiterleitung an einen Menschen? Wenn der KI-Agent einen Anruf an einen menschlichen Mitarbeiter weiterleitet (Warm Handoff), muss der Anrufer darüber informiert werden, dass er jetzt mit einem Menschen spricht. Unser Agent sagt in diesem Fall: „Ich verbinde dich jetzt mit [Name]. Er/sie wird das Gespräch persönlich mit dir weiterführen." Der menschliche Agent erhält dabei eine gesprochene Zusammenfassung des bisherigen Gesprächsverlaufs, damit der Anrufer nichts wiederholen muss.

Was passiert bei Verstößen gegen Art. 50? Der EU AI Act sieht für Verstöße gegen die Transparenzpflicht Bußgelder von bis zu 15 Millionen Euro oder 3 % des weltweiten Jahresumsatzes vor (Art. 99 Abs. 4). Die Durchsetzung erfolgt durch die nationalen Marktüberwachungsbehörden. In Deutschland ist das voraussichtlich die Bundesnetzagentur. Auch wenn die Praxis der Durchsetzung noch im Aufbau ist – das Risiko ist real und die Bußgelder empfindlich.

Auftragsverarbeitungsvertrag (AVV): Pflicht, nicht Kür

Wenn du als Unternehmen einen KI-Telefonassistenten einsetzt, verarbeitet der Anbieter (also wir) personenbezogene Daten in deinem Auftrag. Das macht einen Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO zwingend erforderlich.

Ein AVV regelt:

Bei AI Voice Impact ist der AVV standardmäßig in jedem Tarif enthalten. Du musst ihn nicht separat anfordern oder verhandeln. Er wird bei Vertragsabschluss automatisch bereitgestellt und ist sofort gültig. Damit erfüllst du als Unternehmen deine Pflicht nach Art. 28 DSGVO, ohne zusätzlichen Aufwand.

Compliance aus erster Hand erleben

Ruf unsere KI-Agentin Lena an und höre selbst, wie die Transparenzpflicht im Gespräch umgesetzt wird.

Testanruf anfordern

Datenspeicherung: EU-Server, Verschlüsselung, Löschfristen

Wo und wie Daten gespeichert werden, ist eine der häufigsten Fragen – zu Recht. Hier die Fakten:

Serverstandort

Alle Gesprächsdaten werden auf EU-Servern verarbeitet und gespeichert. Wir nutzen ausschließlich Rechenzentren in Deutschland und den Niederlanden. Kein Datentransfer in die USA, kein Drittland-Problem, keine Schrems-II-Diskussion.

Verschlüsselung

Daten werden sowohl bei der Übertragung (TLS 1.3) als auch im Ruhezustand (AES-256) verschlüsselt. Die Verschlüsselungsschlüssel werden getrennt von den Daten verwaltet. Selbst im unwahrscheinlichen Fall eines Servereinbruchs wären die Gesprächsdaten ohne die Schlüssel wertlos.

Aufbewahrungsfristen

Alle Fristen sind konfigurierbar. Wenn dein Datenschutzbeauftragter kürzere Fristen verlangt, setzen wir das um. Die Standardwerte orientieren sich an den Empfehlungen der Datenschutzkonferenz (DSK) und sind in der Praxis unauffällig.

Verfügbarkeit und Ausfallsicherheit

Datenschutz bedeutet nicht nur Schutz vor unbefugtem Zugriff – sondern auch Schutz vor Datenverlust und Systemausfällen. Unser System ist auf eine Verfügbarkeit von 99,9 % (Uptime-SLA) ausgelegt. Das bedeutet: maximal 8,7 Stunden ungeplante Ausfallzeit pro Jahr. Erreicht wird das durch redundante Infrastruktur in mehreren EU-Rechenzentren, automatisches Failover und kontinuierliches Monitoring. Für dich als Verantwortlichen nach Art. 32 DSGVO ist das relevant, weil du nachweisen musst, dass die von dir eingesetzten Systeme „die Fähigkeit besitzen, die Verfügbarkeit der personenbezogenen Daten [...] bei einem physischen oder technischen Zwischenfall rasch wiederherzustellen." Unsere 99,9 % Uptime-Garantie erfüllt diese Anforderung nachweislich.

Gesprächsaufzeichnung: Wann Einwilligung nötig ist

Die Frage nach der Aufzeichnung ist die heikelste im Bereich KI-Telefonie. Hier muss man sauber unterscheiden:

Keine Aufzeichnung (Standard)

Im Standardbetrieb wird kein Audio aufgezeichnet. Die KI verarbeitet die Sprache in Echtzeit: Speech-to-Text, Verarbeitung, Text-to-Speech. Das Audio wird nach der Echtzeitverarbeitung verworfen. Was bleibt, ist ein Textprotokoll des Gesprächs – keine Stimme, keine biometrischen Daten.

Mit Aufzeichnung (optional)

Wenn du Gespräche zu Qualitätssicherungszwecken aufzeichnen möchtest, ist eine ausdrückliche Einwilligung nach Art. 6 Abs. 1 lit. a DSGVO erforderlich. Der Agent fragt zu Beginn des Gesprächs: „Darf ich dieses Gespräch zu Qualitätssicherungszwecken aufzeichnen? Du kannst jederzeit widersprechen." Nur bei Zustimmung wird aufgezeichnet. Die Einwilligung wird dokumentiert und ist jederzeit widerrufbar.

Unsere Empfehlung: Verzichte auf Aufzeichnungen, es sei denn, du hast einen konkreten Grund. Die Textprotokolle sind für die allermeisten Zwecke ausreichend – und sie vermeiden die komplexe Einwilligungsproblematik.

Falls Aufzeichnungen aktiviert sind, werden sie durch mehrere Schutzschichten abgesichert: AES-256-Verschlüsselung im Ruhezustand, separate Schlüsselverwaltung, automatische Löschung nach 30 Tagen (konfigurierbar) und das bereits beschriebene automatische Daten-Masking, das sensible Informationen aus den Transkripten der Aufnahmen entfernt. Der Zugriff auf Aufnahmen ist auf autorisierte Benutzer beschränkt und wird protokolliert.

TÜV-NORD-Zertifizierung: Was sie bedeutet

AI Voice Impact arbeitet mit einem TÜV-NORD-zertifizierten Datenschutzbeauftragten. Das ist kein Marketing-Siegel, sondern hat konkrete Auswirkungen:

Für dich als Kunde bedeutet das: Du kannst bei einer Prüfung durch deine Landesdatenschutzbehörde nachweisen, dass dein Auftragsverarbeiter professionell arbeitet. Das reduziert dein eigenes Haftungsrisiko erheblich.

Darüber hinaus befindet sich unsere SOC2-Zertifizierung aktuell in Vorbereitung. SOC2 (Service Organization Control 2) ist ein international anerkannter Prüfstandard für Dienstleister, der die Bereiche Sicherheit, Verfügbarkeit, Verarbeitungsintegrität, Vertraulichkeit und Datenschutz abdeckt. Für Unternehmen, die ihren eigenen Kunden gegenüber Compliance-Nachweise erbringen müssen – etwa Finanzdienstleister, Versicherungen oder größere Immobilienunternehmen –, ist eine SOC2-zertifizierte Lieferkette ein erheblicher Vorteil.

"Datenschutz ist bei KI-Telefonie kein Add-on, sondern Grundvoraussetzung. Wer hier spart, riskiert nicht nur Bußgelder, sondern das Vertrauen seiner Kunden." – Christoph Scholz, Partner für Recht & Compliance

DSGVO-Checkliste für KI-Telefonie: 10 Punkte, die du abhaken musst

Du willst KI-Telefonie einsetzen und sicherstellen, dass alles rechtskonform läuft? Hier ist deine vollständige Checkliste – geordnet nach Priorität und zeitlichem Ablauf:

  1. AVV abschließen: Stelle sicher, dass ein Auftragsverarbeitungsvertrag mit dem KI-Anbieter vorliegt. Prüfe, ob alle Unterauftragnehmer (Cloud-Provider, STT/TTS-Anbieter) genannt sind. Bei uns ist der AVV im Tarif enthalten und deckt die gesamte Lieferkette ab.
  2. Verarbeitungsverzeichnis aktualisieren: Trage die KI-Telefonie als neue Verarbeitungstätigkeit in dein Verzeichnis nach Art. 30 DSGVO ein. Dokumentiere: Welche Daten werden verarbeitet? Auf welcher Rechtsgrundlage? Wer hat Zugriff? Welche Löschfristen gelten?
  3. Datenschutzerklärung ergänzen: Informiere auf deiner Website und in deiner telefonischen Warteschleife darüber, dass KI-gestützte Telefonie eingesetzt wird. Nenne den Zweck der Verarbeitung, die Rechtsgrundlage und die Speicherdauer.
  4. Transparenzpflicht umsetzen (EU AI Act Art. 50): Stelle sicher, dass der KI-Agent sich zu Beginn jedes Gesprächs als virtueller Assistent vorstellt. Konfiguriere die Begrüßung im Prompt-Editor so, dass die KI-Offenlegung im allerersten Satz erfolgt – nicht erst nach der Begrüßung oder am Ende.
  5. Aufzeichnungspolitik definieren: Entscheide, ob du Gespräche aufzeichnen willst. Wenn ja, implementiere eine Einwilligungsmechanik mit dokumentierter Zustimmung und Widerrufsmöglichkeit. Wenn nein, stelle sicher, dass die Aufzeichnungsfunktion deaktiviert ist.
  6. Löschfristen festlegen: Stimme die Aufbewahrungsfristen mit deinem Datenschutzbeauftragten ab. Unsere Empfehlung: Textprotokolle 90 Tage, Audio 30 Tage, anonymisierte Analysedaten 12 Monate. Kürzere Fristen sind jederzeit konfigurierbar.
  7. Daten-Masking prüfen: Stelle sicher, dass das automatische Masking für sensible Daten (Kreditkarten, Ausweisdaten, IBANs) aktiviert ist. Prüfe anhand einiger Test-Transkripte, ob das Masking zuverlässig greift.
  8. Mitarbeiter informieren: Dein Team muss wissen, dass ein KI-Agent eingesetzt wird und wie die Weiterleitung funktioniert. Dokumentiere die Schulung. Kläre insbesondere, wie das Warm Handoff abläuft und welche Informationen der Agent an den menschlichen Mitarbeiter weitergibt.
  9. Betroffenenrechte sicherstellen: Anrufer müssen Auskunft, Löschung und Widerspruch verlangen können. Definiere einen Prozess: Wer bearbeitet Anfragen? Innerhalb welcher Frist? Über welchen Kanal? Unser System ermöglicht die Löschung aller Daten eines Anrufers auf Knopfdruck.
  10. Regelmäßig prüfen: Datenschutz ist kein einmaliges Projekt. Plane jährliche Reviews deiner KI-Telefonie-Konfiguration ein. Prüfe, ob sich die Rechtsgrundlagen geändert haben, ob neue Datenarten verarbeitet werden und ob die Löschfristen noch angemessen sind.

Bonus-Punkt: Datenschutz-Folgenabschätzung (DSFA). Bei besonders sensiblen Daten (Gesundheitswesen, Finanzdienstleistungen) kann eine DSFA nach Art. 35 DSGVO erforderlich sein. Für Standard-Telefonie in der Immobilienbranche ist sie in der Regel nicht nötig. Wenn du unsicher bist, sprich uns an – unser TÜV-NORD-zertifizierter Datenschutzbeauftragter berät dich kostenlos im Rahmen deines Tarifs.

Klingt nach viel? In der Praxis sind die meisten Punkte in ein bis zwei Stunden erledigt – vor allem, wenn dein Anbieter den AVV, die TOMs und die Transparenzmechanik bereits mitliefert. Bei unseren Custom-Lösungen unterstützen wir dich bei jedem einzelnen Punkt persönlich.

DSGVO-konform von Tag 1

Teste unsere KI-Telefonie – mit AVV, EU-Servern und TÜV-NORD-zertifiziertem Datenschutz inklusive.

AVV inklusive EU-Server TÜV-geprüft
Jetzt Testanruf anfordern
Christoph Scholz
Christoph Scholz
Partner für Recht & Compliance

Volljurist mit tiefem Immobilien- und Versicherungs-Know-how. Sorgt für DSGVO-Konformität und rechtliche Belastbarkeit bei AI Voice Impact.