Case Studies / arvato Bertelsmann
TELEKOMMUNIKATION · CALL-CENTER-BETRIEB
Manuelle Gesprächsnotizen ersetzen durch automatisierte KI-Zusammenfassung
Die Call-Center-Mitarbeiter von arvato verbrachten erhebliche Zeit damit, nach jeder Kundeninteraktion manuell Gesprächszusammenfassungen zu verfassen. Wir entwickelten eine automatisierte Speech-to-Text- und Zusammenfassungs-Pipeline, die den Prozess standardisiert und den manuellen Aufwand vollständig eliminiert hat.
Kunde: arvato – Teil der Bertelsmann-Gruppe, ein führender internationaler Dienstleister mit Call-Center-Aktivitäten in mehreren Märkten.
PROJEKTÜBERSICHT
100%
Gesprächszusammenfassung vollständig automatisiert – null manuelle Notizen
Polnisch
Individuelle KI-Modelle für die polnische Sprachverarbeitung trainiert
Cloud
Skalierbare Cloud-Infrastruktur für die Verarbeitung hoher Volumina
Einheitlich
Standardisiertes Notizformat für alle Mitarbeiter und Teams
BRANCHE
Telekommunikation
USE CASE
Automatisierte Gesprächszusammenfassung
KI-ANSATZ
NLP + individuelle ML-Modelle
SYSTEME
Gesprächsaufzeichnung, CRM
SPRACHE
Polnisch
ENGAGEMENT
Proof of Concept → Produktion

Der Kontext
Das Call Center von arvato bewältigte täglich ein hohes Volumen an Kundeninteraktionen. Nach jedem Gespräch mussten die Mitarbeiter manuell eine Zusammenfassung erstellen – die das Anliegen des Kunden, den Gesprächsinhalt und eventuelle Folgeaktionen festhielt. Dies war zeitaufwendig, inkonsistent und erzeugte einen Informationsengpass innerhalb der Organisation.
Täglich entstanden Hunderte von Stunden an Gesprächsdaten, doch die Extraktion strukturierter, verwertbarer Informationen aus diesen Daten erfolgte vollständig manuell. Die Qualität der Zusammenfassungen variierte von Mitarbeiter zu Mitarbeiter – was es erschwerte, Trends zu verfolgen, Kontext zwischen Teams zu teilen oder Gesprächsdaten für betriebliche Verbesserungen zu nutzen.
Das Kernproblem: Die Mitarbeiter verbrachten einen erheblichen Teil ihrer Zeit mit administrativem Notizenschreiben, anstatt den nächsten Kunden zu betreuen. Und die entstandenen Zusammenfassungen waren inkonsistent genug, um ihren Mehrwert im weiteren Prozess zu begrenzen.
Was wir entwickelt haben
Wir entwickelten eine durchgängige Pipeline, die rohe Gesprächsaufzeichnungen entgegennahm und strukturierte, standardisierte Zusammenfassungen produzierte – ohne jegliches manuelles Eingreifen der Mitarbeiter.
Spracherkennung (Speech-to-Text). Die erste Stufe konvertierte Gesprächsaudio in Text. Die Arbeit mit gesprochenem Polnisch brachte spezifische Herausforderungen mit sich: schwankende Audioqualität, Unterbrechungen, Umgangssprache und begrenzte Out-of-the-Box-Sprachunterstützung im Vergleich zu Englisch oder Deutsch. Wir entwickelten maßgeschneiderte Nachbearbeitungstechniken, um die Transkriptionsgenauigkeit zu verbessern und diese Randfälle zuverlässig zu behandeln.
KI-gestützte Zusammenfassung. Nach der Transkription generierte das System prägnante Zusammenfassungen auf Basis der internen Verfahren und des Notizformats von arvato. Wir trainierten individuelle ML-Modelle, um die relevantesten Informationen zu extrahieren – Kundenabsicht, Problemkategorie, ergriffene Maßnahmen und nächste Schritte – und in einer einheitlichen Struktur darzustellen, unabhängig davon, welcher Mitarbeiter das Gespräch geführt hatte.
Cloud-basierte Verarbeitungsinfrastruktur. Die gesamte Pipeline wurde auf einer Cloud-Infrastruktur bereitgestellt, um das tägliche Gesprächsvolumen effizient zu verarbeiten. Dies ermöglichte dem System, mit der Nachfrage zu skalieren – mehr Gespräche in Spitzenstunden zu verarbeiten, ohne an Leistung einzubüßen.
Die Ergebnisse
VORHER
Mitarbeiter verfassten nach jeder Interaktion manuell Gesprächszusammenfassungen. Die Qualität variierte je nach Person. Gesprächsdaten wurden für Analysen oder Prozessverbesserungen kaum genutzt.
NACHHER
Zusammenfassungen wurden automatisch in einem standardisierten Format erstellt. Mitarbeiter konnten sofort das nächste Gespräch annehmen. Gesprächsdaten wurden zu einem strukturierten, durchsuchbaren Informationsbestand.
Der manuelle Aufwand für die Gesprächszusammenfassung wurde vollständig eliminiert. Jedes Gespräch erzeugte eine konsistente, strukturierte Notiz – unabhängig vom Mitarbeiter, der Gesprächskomplexität oder der Tageszeit. Dies gab den Mitarbeitern die Freiheit, sich auf Kundeninteraktionen statt auf administrative Aufgaben zu konzentrieren.
Über die unmittelbaren Zeiteinsparungen hinaus eröffneten die standardisierten Zusammenfassungen neue Möglichkeiten für die Datenanalyse – wiederkehrende Probleme zu identifizieren, Lösungsmuster zu verfolgen und interne Prozesse auf Basis tatsächlicher Gesprächsdaten statt fragmentierter manueller Notizen zu verbessern.
Eingesetzte Technologien
Mehr Case Studies
So haben wir anderen Unternehmen geholfen

BEHÖRDE · POLNISCHE ÖFFENTLICHE INSTITUTION (UNTER NDA)
Multi-Agenten-Chatbot ersetzt manuelle Bürgeranfragen in 11 Themenbereichen
Bürger riefen die Behörde an, weil der bestehende Chatbot ihre Fragen nicht verstand. Wir haben ein neues System entworfen und prototypisiert, bei dem Bürger in einfacher Sprache fragen und automatisch zur richtigen Antwort geleitet werden – ohne zusätzliche Vorkenntnisse.
11
Themenbereiche
3
Dedizierte Tools

MEDTECH · APOQLAR
Bearbeitungszeit für Sicherheitsfragebögen von einem Monat auf eine Woche reduziert
Jeder neue Krankenhauspartner benötigte einen ausgefüllten Fragebogen – 8–10 Beteiligte, rund einen Monat, Antworten aus Richtlinien verschiedener Abteilungen. Jetzt entwirft ein KI-Assistent die Antworten automatisch und spart dabei geschätzte 90.000 $ pro Jahr.
-75%
Bearbeitungszeit
90.000 $
Jährliche Einsparungen

MEDTECH · APOQLAR
GenAI-Assistent ersetzt manuelle Dokumentensuche
Mitarbeiter verbrachten Stunden damit, hunderte von Produktdokumenten zu durchsuchen, um Kunden- und Compliance-Fragen zu beantworten. Jetzt stellen sie Fragen in natürlicher Sprache und erhalten in Sekunden quellenbasierte Antworten.
RAG
Integriert
Kontextverwaltung
Optimiert

