InSaaS.ai: Anonimizacja danych RODO przez API

Case Studies / InSaaS.ai

USŁUGI PROFESJONALNE · OCHRONA DANYCH & RODO

Automatyzacja anonimizacji danych zgodnej z RODO dla badań rynkowych na dużą skalę

InSaaS.ai przetwarza ogromne ilości danych tekstowych z mediów społecznościowych, forów internetowych i źródeł klientów na potrzeby badań rynkowych i planowania produktów. Każdy zestaw danych potencjalnie zawiera dane osobowe, które muszą zostać usunięte przed analizą – ręczne przeglądanie wszystkich danych w tej skali było niemożliwe. Zintegrowaliśmy ShareMedix jako API do anonimizacji, które automatycznie wykrywa i maskuje dane osobowe w całym potoku danych.

Klient: InSaaS.ai – firma analityczna specjalizująca się w dostarczaniu informacji z zakresu marketingu, badań rynku i rozwoju produktów.

Kluczowe wyniki

RODO

Pełna zgodność z europejskimi przepisami o ochronie danych

API

Zintegrowane bezpośrednio z istniejącymi potokami danych

Równolegle

Obsługuje wiele jednoczesnych żądań anonimizacji na dużą skalę

Automatycznie

Imiona i nazwiska, adresy, numery telefonów, numery IBAN wykrywane i maskowane

BRANŻA

Usługi profesjonalne / Badania rynku

PRZYPADEK UŻYCIA

Anonimizacja danych osobowych w danych tekstowych

PODEJŚCIE AI

Wykrywanie danych osobowych oparte na NLP

ŹRÓDŁA DANYCH

Media społecznościowe, fora, dane klientów

INTEGRACJA

API (przetwarzanie równoległe)

PRODUKT

Automating GDPR-compliant data anonymization for market research at scale - theblueai - Professional Services · Data Privacy & GDPR

Wyzwanie

InSaaS.ai tworzy rozwiązania analityczne dla marketingu, badań rynku i rozwoju produktów. Ich praca opiera się na analizie dużych ilości danych tekstowych – postów w mediach społecznościowych, dyskusji na forach internetowych, opinii klientów i wewnętrznych zbiorów danych. Informacje ukryte w tych danych są cenne, ale same dane pełne są danych osobowych: imion i nazwisk, adresów, numerów telefonów, numerów IBAN i innych wrażliwych szczegółów.

Zgodnie z RODO dane te nie mogą być przetwarzane ani analizowane w surowej postaci. Każda informacja osobowa musi zostać wykryta i usunięta, zanim dane trafią do potoku analitycznego InSaaS.ai. Ręczne przetwarzanie nie wchodziło w grę – wolumen danych był zbyt duży, różnorodność typów danych osobowych zbyt szeroka, a konsekwencje regulacyjne zbyt poważne dla procesu manualnego.

Kluczowy problem Główny problem: InSaaS.ai musiało sprawić, by ogromne ilości danych tekstowych były zgodne z RODO, zanim można je było analizować – jednak wolumen i różnorodność danych osobowych uniemożliwiały ręczną anonimizację w tej skali.

Co zbudowaliśmy

Zintegrowaliśmy ShareMedix – nasz silnik anonimizacji danych oparty na NLP – bezpośrednio z potokiem przetwarzania danych InSaaS.ai za pośrednictwem API. System automatycznie wykrywa i maskuje dane osobowe w danych tekstowych, zanim trafią do warstwy analitycznej.

Automatyczne wykrywanie danych osobowych w różnych typach danych. ShareMedix identyfikuje imiona i nazwiska, adresy, numery telefonów, numery IBAN, adresy e-mail i inne dane osobowe przy użyciu zaawansowanych technik NLP. System obsługuje dane z różnych źródeł – od postów w mediach społecznościowych pisanych w nieformalnym języku po ustrukturyzowane rekordy klientów i wszystko pomiędzy.

Integracja oparta na API. Zamiast działać jako samodzielne narzędzie wymagające ręcznej obsługi, ShareMedix zostało wdrożone jako API wywoływane przez InSaaS.ai programistycznie w ramach istniejących potoków danych. Dane wchodzą, anonimizowane dane wychodzą – żadnych ręcznych kroków, żadnego oddzielnego interfejsu.

Przetwarzanie równoległe na dużą skalę. Zestawy danych do badań rynkowych mogą być ogromne. API do anonimizacji obsługuje wiele jednoczesnych żądań, przetwarzając duże ilości tekstu bez stawania się wąskim gardłem w przepływie pracy przygotowania danych InSaaS.ai.

Konfigurowalne reguły anonimizacji. Różne źródła danych i przypadki użycia wymagają różnego podejścia. ShareMedix obsługuje białe listy, czarne listy i konfigurowalne reguły anonimizacji – pozwalając InSaaS.ai precyzyjnie dostosować, co jest maskowane, a co zachowane, dostosowując się do zmian w przepisach i źródłach danych.

Wyniki

PRZED

Dane osobowe rozproszone po ogromnych zbiorach tekstowych. Ręczna weryfikacja niemożliwa na dużą skalę. Zgodność z RODO trudna do zagwarantowania. Wykorzystanie danych ograniczone ryzykiem naruszenia prywatności.

PO

Automatyczne wykrywanie i maskowanie danych osobowych przez API. Zgodność z RODO wbudowana w potok danych. Pełne zestawy danych dostępne do analizy bez ryzyka naruszenia prywatności. Nie jest wymagana ręczna interwencja.

InSaaS.ai może teraz przetwarzać i analizować cały wolumen danych z pewnością, że zgodność z RODO jest utrzymywana automatycznie. Etap anonimizacji – wcześniej ręczna blokada ograniczająca możliwość korzystania z danych – stał się płynną, niewidoczną częścią potoku.

Odblokowano również dane, które wcześniej były zbyt ryzykowne w użyciu. Dane klientów i inne wrażliwe źródła, które wymagałyby rozległego ręcznego przeglądu, mogą teraz być automatycznie anonimizowane i wprowadzane do przepływów analitycznych – poszerzając zakres wglądu, jaki InSaaS.ai może dostarczać swoim klientom.

Użyte technologie

Natural Language Processing Named Entity Recognition PII Detection API Integration
ShareMedix Platform GDPR Compliance

Więcej case studies

Zobacz, jak pomogliśmy innym firmom

ChatBot automatisierung - intelligent chatbot - ai agent answers questions

URZĄD · POLSKA INSTYTUCJA PUBLICZNA (NDA)

Zbudowanie platformy AI automatyzującej monitoring polityczny – od PoC do pełnego rozwiązania

Analitycy public affairs ręcznie śledzili miliony dokumentów politycznych w różnych krajach i językach. Zbudowaliśmy warstwę AI automatyzującą monitoring, analizę i alerty – od pierwszego prototypu do premiery rynkowej.

LLM RAG Vector DB

11

Obszarów wiedzy

3

Dedykowane toole

case study - Cutting security questionnaire completion from one month to one week with GenAI - medtech

LOGISTYKA · FR. MEYER’S SOHN

Wyeliminowanie ręcznej ekstrakcji danych z tysięcy dziennych e-maili wysyłkowych

Pracownicy operacyjni codziennie ręcznie czytali e-maile logistyczne po niemiecku i angielsku, aby wyodrębnić dane tras i harmonogramów. Zbudowaliśmy pipeline AI, który automatycznie ekstrahuje, strukturyzuje i dostarcza dane.

GPT-4 Email Processing On-premise

-80%

Nakład pracy ręcznej

2 języki

DE i EN

On-prem

Wdrożenie

AI Use Cases - client stories

MEDTECH · APOQLAR

Wirtualny asystent GenAI zastępujący ręczne wyszukiwanie dokumentów

Pracownicy wsparcia spędzali godziny na przeszukiwaniu setek dokumentów produktowych, aby odpowiedzieć na pytania klientów i compliance. Teraz zadają pytania w języku naturalnym i otrzymują odpowiedzi z odniesieniami do źródeł w ciągu sekund.

LLM RAG Vector DB

RAG

Zintegrowany

Zarządzanie kontekstem

Zoptymalizowane

Powiedz nam, który proces kosztuje Cię najwięcej

Opisz proces, a my odpowiemy w ciągu jednego dnia roboczego z wstępną oceną i propozycją 30-minutowej rozmowy wstępnej.






    Administratorem Twoich danych osobowych jest theBlue.ai GmbH z siedzibą w Hamburgu, Niemcy. Przesyłając ten formularz, wyrażasz zgodę na przetwarzanie swoich danych osobowych w celu udzielenia odpowiedzi na Twoje zapytanie. Możesz wycofać swoją zgodę w dowolnym momencie, bez wpływu na zgodność z prawem przetwarzania dokonanego przed jej wycofaniem. Na podstawie naszego prawnie uzasadnionego interesu możemy również przesyłać Ci informacje o naszych usługach i rozwiązaniach, ale wyłącznie wtedy, gdy są one powiązane z tematem Twojej wiadomości. Jeśli nie chcesz otrzymywać takich informacji, masz prawo w dowolnym momencie wnieść sprzeciw. Więcej informacji o sposobie przetwarzania Twoich danych osobowych oraz przysługujących Ci prawach znajdziesz w naszej klauzuli informacyjnej oraz polityce prywatności.

    * Pola wymagane.