InSaaS.ai: DSGVO-Datenanonymisierung per API

Case Studies / InSaaS.ai

PROFESSIONAL SERVICES · DATENSCHUTZ & DSGVO

Automatisierung der DSGVO-konformen Datenanonymisierung für Marktforschung im großen Maßstab

InSaaS.ai verarbeitet enorme Mengen an Textdaten aus sozialen Medien, Online-Foren und Kundenquellen für Marktforschung und Produktplanung. Jeder Datensatz enthält potenziell personenbezogene Daten, die vor der Analyse entfernt werden müssen – eine manuelle Überprüfung war in diesem Umfang unmöglich. Wir haben ShareMedix als Anonymisierungs-API integriert, die automatisch personenbezogene Daten in der gesamten Datenpipeline erkennt und maskiert.

Kunde: InSaaS.ai – ein Datenanalyseunternehmen, das auf Erkenntnisse aus Marketing, Marktforschung und Produktentwicklung spezialisiert ist.

WICHTIGSTE ERGEBNISSE

DSGVO

Vollständige Einhaltung der europäischen Datenschutzvorschriften

API

Direkt in bestehende Datenpipelines integriert

Parallel

Verarbeitet mehrere gleichzeitige Anonymisierungsanfragen im großen Maßstab

Automatisch

Namen, Adressen, Telefonnummern, IBANs erkannt und maskiert

BRANCHE

Professional Services / Marktforschung

USE CASE

PII-Anonymisierung in Textdaten

KI-ANSATZ

NLP-basierte PII-Erkennung

DATENQUELLEN

Soziale Medien, Foren, Kundendaten

INTEGRATION

API (parallele Verarbeitung)

PRODUKT

Automating GDPR-compliant data anonymization for market research at scale - theblueai - Professional Services · Data Privacy & GDPR

Die Herausforderung

InSaaS.ai entwickelt Datenanalyselösungen für Marketing, Marktforschung und Produktentwicklung. Ihre Arbeit basiert auf der Analyse großer Mengen an Textdaten – Beiträge in sozialen Medien, Diskussionen in Online-Foren, Kundenfeedback und interne Datensätze. Die in diesen Daten verborgenen Erkenntnisse sind wertvoll, doch die Daten selbst sind voll von personenbezogenen Informationen: Namen, Adressen, Telefonnummern, IBAN-Nummern und andere sensible Details.

Gemäß der DSGVO dürfen diese Daten nicht in ihrer Rohform verarbeitet oder analysiert werden. Jede personenbezogene Information muss erkannt und entfernt werden, bevor die Daten in die Analysepipeline von InSaaS.ai gelangen. Eine manuelle Bearbeitung kam nicht in Frage – das Datenvolumen war viel zu groß, die Vielfalt der PII-Typen zu umfangreich und die regulatorischen Anforderungen zu hoch für einen manuellen Prozess.

Das Kernproblem: InSaaS.ai musste enorme Mengen an Textdaten DSGVO-konform machen, bevor sie analysiert werden konnten – doch das Volumen und die Vielfalt der personenbezogenen Daten machten eine manuelle Anonymisierung in diesem Umfang unmöglich.

Was wir entwickelt haben

Wir haben ShareMedix – unsere NLP-gestützte Datenanonymisierungsengine – direkt über eine API in die Datenverarbeitungspipeline von InSaaS.ai integriert. Das System erkennt und maskiert automatisch personenbezogene Daten in Textdaten, bevor diese die Analyseschicht erreichen.

Automatische PII-Erkennung für verschiedene Datentypen. ShareMedix identifiziert Namen, Adressen, Telefonnummern, IBAN-Nummern, E-Mail-Adressen und andere personenbezogene Daten mithilfe fortschrittlicher NLP-Techniken. Das System verarbeitet Daten aus unterschiedlichen Quellen – von Social-Media-Beiträgen in informeller Sprache bis hin zu strukturierten Kundendatensätzen und allem dazwischen.

API-first-Integration. Anstatt als eigenständiges Tool mit manueller Bedienung zu fungieren, wurde ShareMedix als API eingesetzt, die InSaaS.ai programmatisch in bestehende Datenpipelines einbindet. Daten fließen hinein, anonymisierte Daten fließen heraus – keine manuellen Schritte, keine separate Oberfläche.

Parallele Verarbeitung im großen Maßstab. Datensätze aus der Marktforschung können enorm groß sein. Die Anonymisierungs-API verarbeitet mehrere gleichzeitige Anfragen und bewältigt große Textmengen, ohne zum Flaschenhals im Datenvorbereitungsworkflow von InSaaS.ai zu werden.

Anpassbare Anonymisierungsregeln. Verschiedene Datenquellen und Anwendungsfälle erfordern unterschiedliche Behandlung. ShareMedix unterstützt Whitelists, Blacklists und konfigurierbare Anonymisierungsregeln – so kann InSaaS.ai genau steuern, was maskiert und was beibehalten wird, und sich anpassen, wenn sich Vorschriften und Datenquellen weiterentwickeln.

Die Ergebnisse

VORHER

Personenbezogene Daten über riesige Textdatensätze verstreut. Manuelle Überprüfung im großen Maßstab unmöglich. DSGVO-Konformität kaum zu garantieren. Datennutzung durch Datenschutzrisiken eingeschränkt.

NACHHER

Automatisierte PII-Erkennung und -Maskierung über API. DSGVO-Konformität fest in die Datenpipeline integriert. Vollständige Datensätze ohne Datenschutzrisiko zur Analyse verfügbar. Kein manueller Eingriff erforderlich.

InSaaS.ai kann nun das gesamte Datenvolumen verarbeiten und analysieren, in der Gewissheit, dass die DSGVO-Konformität automatisch gewährleistet ist. Der Anonymisierungsschritt – zuvor ein manueller Blocker, der die Datennutzung einschränkte – ist zu einem nahtlosen, unsichtbaren Teil der Pipeline geworden.

Dies hat auch Daten erschlossen, die zuvor zu risikoreich für die Nutzung waren. Kundendaten und andere sensible Quellen, für die früher eine umfangreiche manuelle Prüfung nötig gewesen wäre, können nun automatisch anonymisiert und in Analyse-Workflows eingespeist werden – und erweitern so den Umfang der Erkenntnisse, die InSaaS.ai seinen Kunden liefern kann.

Eingesetzte Technologien

Natural Language Processing Named Entity Recognition PII Detection API Integration
ShareMedix Platform GDPR Compliance

Mehr Case Studies

So haben wir anderen Unternehmen geholfen

ChatBot automatisierung - intelligent chatbot - ai agent answers questions

BEHÖRDE · POLNISCHE ÖFFENTLICHE INSTITUTION (UNTER NDA)

Multi-Agenten-Chatbot ersetzt manuelle Bürgeranfragen in 11 Themenbereichen

Bürger riefen die Behörde an, weil der bestehende Chatbot ihre Fragen nicht verstand. Wir haben ein neues System entworfen und prototypisiert, bei dem Bürger in einfacher Sprache fragen und automatisch zur richtigen Antwort geleitet werden – ohne zusätzliche Vorkenntnisse.

LLM RAG Vector DB

11

Themenbereiche

3

Dedizierte Tools

Cutting security questionnaire completion from one month to one week with GenAI

MEDTECH · APOQLAR

Bearbeitungszeit für Sicherheitsfragebögen von einem Monat auf eine Woche reduziert

Jeder neue Krankenhauspartner benötigte einen ausgefüllten Fragebogen – 8–10 Beteiligte, rund einen Monat, Antworten aus Richtlinien verschiedener Abteilungen. Jetzt entwirft ein KI-Assistent die Antworten automatisch und spart dabei geschätzte 90.000 $ pro Jahr.

RAG Azure OpenAI Compliance

-75%

Bearbeitungszeit

90.000 $

Jährliche Einsparungen

AI Use Cases - client stories

MEDTECH · APOQLAR

GenAI-Assistent ersetzt manuelle Dokumentensuche

Mitarbeiter verbrachten Stunden damit, hunderte von Produktdokumenten zu durchsuchen, um Kunden- und Compliance-Fragen zu beantworten. Jetzt stellen sie Fragen in natürlicher Sprache und erhalten in Sekunden quellenbasierte Antworten.

LLM RAG Vector DB

RAG

Integriert

Kontextverwaltung

Optimiert

Sagen Sie uns, welcher Prozess Sie am meisten kostet

Beschreiben Sie den Prozess – wir melden uns innerhalb eines Werktages mit einer ersten Einschätzung und einem Vorschlag für ein 30-minütiges Scoping-Gespräch.






    Informationen zum Verantwortlichen: Verantwortlich für die Verarbeitung Ihrer personenbezogenen Daten ist die theBlue.ai GmbH mit Sitz in Hamburg, Deutschland. Mit dem Absenden dieses Formulars erklären Sie sich damit einverstanden, dass Ihre Daten zum Zweck der Bearbeitung Ihrer Anfrage verarbeitet werden. Ihre Einwilligung können Sie jederzeit widerrufen – ohne dass die Rechtmäßigkeit der bis zum Widerruf erfolgten Verarbeitung berührt wird. Auf Grundlage unseres berechtigten Interesses können wir Ihnen zudem Informationen zu unseren Dienstleistungen und Lösungen zusenden, sofern sie im Zusammenhang mit Ihrer Anfrage stehen. Wenn Sie solche Mitteilungen nicht erhalten möchten, können Sie dem jederzeit widersprechen. Weitere Informationen zur Verarbeitung Ihrer Daten und zu Ihren Rechten finden Sie in unserer Informationsklausel und Datenschutzerklärung.

    * Erforderliche Felder.