Case Studies / InSaaS.ai
USŁUGI PROFESJONALNE · OCHRONA DANYCH & RODO
Automatyzacja anonimizacji danych zgodnej z RODO dla badań rynkowych na dużą skalę
InSaaS.ai przetwarza ogromne ilości danych tekstowych z mediów społecznościowych, forów internetowych i źródeł klientów na potrzeby badań rynkowych i planowania produktów. Każdy zestaw danych potencjalnie zawiera dane osobowe, które muszą zostać usunięte przed analizą – ręczne przeglądanie wszystkich danych w tej skali było niemożliwe. Zintegrowaliśmy ShareMedix jako API do anonimizacji, które automatycznie wykrywa i maskuje dane osobowe w całym potoku danych.
Klient: InSaaS.ai – firma analityczna specjalizująca się w dostarczaniu informacji z zakresu marketingu, badań rynku i rozwoju produktów.
Kluczowe wyniki
RODO
Pełna zgodność z europejskimi przepisami o ochronie danych
API
Zintegrowane bezpośrednio z istniejącymi potokami danych
Równolegle
Obsługuje wiele jednoczesnych żądań anonimizacji na dużą skalę
Automatycznie
Imiona i nazwiska, adresy, numery telefonów, numery IBAN wykrywane i maskowane
BRANŻA
Usługi profesjonalne / Badania rynku
PRZYPADEK UŻYCIA
Anonimizacja danych osobowych w danych tekstowych
PODEJŚCIE AI
Wykrywanie danych osobowych oparte na NLP
ŹRÓDŁA DANYCH
Media społecznościowe, fora, dane klientów

Wyzwanie
InSaaS.ai tworzy rozwiązania analityczne dla marketingu, badań rynku i rozwoju produktów. Ich praca opiera się na analizie dużych ilości danych tekstowych – postów w mediach społecznościowych, dyskusji na forach internetowych, opinii klientów i wewnętrznych zbiorów danych. Informacje ukryte w tych danych są cenne, ale same dane pełne są danych osobowych: imion i nazwisk, adresów, numerów telefonów, numerów IBAN i innych wrażliwych szczegółów.
Zgodnie z RODO dane te nie mogą być przetwarzane ani analizowane w surowej postaci. Każda informacja osobowa musi zostać wykryta i usunięta, zanim dane trafią do potoku analitycznego InSaaS.ai. Ręczne przetwarzanie nie wchodziło w grę – wolumen danych był zbyt duży, różnorodność typów danych osobowych zbyt szeroka, a konsekwencje regulacyjne zbyt poważne dla procesu manualnego.
Kluczowy problem Główny problem: InSaaS.ai musiało sprawić, by ogromne ilości danych tekstowych były zgodne z RODO, zanim można je było analizować – jednak wolumen i różnorodność danych osobowych uniemożliwiały ręczną anonimizację w tej skali.
Co zbudowaliśmy
Zintegrowaliśmy ShareMedix – nasz silnik anonimizacji danych oparty na NLP – bezpośrednio z potokiem przetwarzania danych InSaaS.ai za pośrednictwem API. System automatycznie wykrywa i maskuje dane osobowe w danych tekstowych, zanim trafią do warstwy analitycznej.
Automatyczne wykrywanie danych osobowych w różnych typach danych. ShareMedix identyfikuje imiona i nazwiska, adresy, numery telefonów, numery IBAN, adresy e-mail i inne dane osobowe przy użyciu zaawansowanych technik NLP. System obsługuje dane z różnych źródeł – od postów w mediach społecznościowych pisanych w nieformalnym języku po ustrukturyzowane rekordy klientów i wszystko pomiędzy.
Integracja oparta na API. Zamiast działać jako samodzielne narzędzie wymagające ręcznej obsługi, ShareMedix zostało wdrożone jako API wywoływane przez InSaaS.ai programistycznie w ramach istniejących potoków danych. Dane wchodzą, anonimizowane dane wychodzą – żadnych ręcznych kroków, żadnego oddzielnego interfejsu.
Przetwarzanie równoległe na dużą skalę. Zestawy danych do badań rynkowych mogą być ogromne. API do anonimizacji obsługuje wiele jednoczesnych żądań, przetwarzając duże ilości tekstu bez stawania się wąskim gardłem w przepływie pracy przygotowania danych InSaaS.ai.
Konfigurowalne reguły anonimizacji. Różne źródła danych i przypadki użycia wymagają różnego podejścia. ShareMedix obsługuje białe listy, czarne listy i konfigurowalne reguły anonimizacji – pozwalając InSaaS.ai precyzyjnie dostosować, co jest maskowane, a co zachowane, dostosowując się do zmian w przepisach i źródłach danych.
Wyniki
PRZED
Dane osobowe rozproszone po ogromnych zbiorach tekstowych. Ręczna weryfikacja niemożliwa na dużą skalę. Zgodność z RODO trudna do zagwarantowania. Wykorzystanie danych ograniczone ryzykiem naruszenia prywatności.
PO
Automatyczne wykrywanie i maskowanie danych osobowych przez API. Zgodność z RODO wbudowana w potok danych. Pełne zestawy danych dostępne do analizy bez ryzyka naruszenia prywatności. Nie jest wymagana ręczna interwencja.
InSaaS.ai może teraz przetwarzać i analizować cały wolumen danych z pewnością, że zgodność z RODO jest utrzymywana automatycznie. Etap anonimizacji – wcześniej ręczna blokada ograniczająca możliwość korzystania z danych – stał się płynną, niewidoczną częścią potoku.
Odblokowano również dane, które wcześniej były zbyt ryzykowne w użyciu. Dane klientów i inne wrażliwe źródła, które wymagałyby rozległego ręcznego przeglądu, mogą teraz być automatycznie anonimizowane i wprowadzane do przepływów analitycznych – poszerzając zakres wglądu, jaki InSaaS.ai może dostarczać swoim klientom.
Użyte technologie
Więcej case studies
Zobacz, jak pomogliśmy innym firmom

URZĄD · POLSKA INSTYTUCJA PUBLICZNA (NDA)
Zbudowanie platformy AI automatyzującej monitoring polityczny – od PoC do pełnego rozwiązania
Analitycy public affairs ręcznie śledzili miliony dokumentów politycznych w różnych krajach i językach. Zbudowaliśmy warstwę AI automatyzującą monitoring, analizę i alerty – od pierwszego prototypu do premiery rynkowej.
11
Obszarów wiedzy
3
Dedykowane toole

LOGISTYKA · FR. MEYER’S SOHN
Wyeliminowanie ręcznej ekstrakcji danych z tysięcy dziennych e-maili wysyłkowych
Pracownicy operacyjni codziennie ręcznie czytali e-maile logistyczne po niemiecku i angielsku, aby wyodrębnić dane tras i harmonogramów. Zbudowaliśmy pipeline AI, który automatycznie ekstrahuje, strukturyzuje i dostarcza dane.
-80%
Nakład pracy ręcznej
2 języki
DE i EN
On-prem
Wdrożenie

MEDTECH · APOQLAR
Wirtualny asystent GenAI zastępujący ręczne wyszukiwanie dokumentów
Pracownicy wsparcia spędzali godziny na przeszukiwaniu setek dokumentów produktowych, aby odpowiedzieć na pytania klientów i compliance. Teraz zadają pytania w języku naturalnym i otrzymują odpowiedzi z odniesieniami do źródeł w ciągu sekund.
RAG
Zintegrowany
Zarządzanie kontekstem
Zoptymalizowane

