← Aktualności

AML / CFT

Data Quality w AML: dlaczego jakość danych decyduje o skuteczności całego systemu

Najlepszy algorytm AI do wykrywania prania pieniędzy jest bezużyteczny, jeśli zasilają go złe dane. "Garbage in, garbage out" to prawda szczególnie dotkliwa w AML - bo błędne dane to albo przeoczone przypadki, albo lawina fałszywych alarmów. Jak budować i utrzymywać wysoką jakość danych w systemach AML?

Klaudia Pokrzywko-Weremjewicz 2026-04-11 3 min czytania
Data Quality w AML: dlaczego jakość danych decyduje o skuteczności całego systemu

Wprowadzenie

Analityk AML przegląda alert. System zaflaga transakcję jako podejrzaną ze względu na "niespójność profilu klienta". Analityk sprawdza dane i odkrywa, że klient ma w systemie wpisany błędny kod PKD (branży) z onboardingu sprzed 5 lat. Firma jest deweloperem, a system "myśli" że to fryzjerstwo - stąd alarm.

To trywialny, ale realistyczny przykład, jak złe dane generują fałszywe alarmy. Bardziej poważne konsekwencje: przeoczenie prawdziwego podejrzanego, bo jego transakcja "wygląda normalnie" przy błędnych danych profilu.

Wymiary jakości danych w kontekście AML

Jakość danych to złożone pojęcie. W kontekście AML ma kilka kluczowych wymiarów:

Kompletność: czy wszystkie wymagane pola są wypełnione? Brakujące dane o kliencie (np. brak daty urodzenia, brak beneficjenta rzeczywistego) to nie tylko problem compliance - to dziura w systemie AML.

Aktualność: czy dane odzwierciedlają aktualny stan? Klient, który zmienił działalność, adres lub beneficjenta rzeczywistego 3 lata temu - a dane nie zostały zaktualizowane - to fałszywy profil ryzyka.

Dokładność: czy dane są poprawne? Błędy we wprowadzaniu (literówki w nazwisku, błędny NIP, błędna branża) to codzienność w instytucjach z dużymi bazami klientów.

Spójność: czy dane z różnych systemów są ze sobą zgodne? Dane klienta w CRM, w systemie KYC i w systemie monitorowania transakcji powinny być identyczne - ale w praktyce często nie są.

Unikalność: duplikaty klientów w systemie (ta sama osoba w bazie kilka razy, z różnymi danymi) to poważny problem dla AML.

Typowe problemy z jakością danych w instytucjach finansowych

Na podstawie audytów i wdrożeń systemów AML można zidentyfikować kilka typowych problemów:

"Zombie clients": klienci nieaktywni od lat, z danymi sprzed dekady, nieodświeżanymi, nieweryfikowanymi. Stanowią ryzyko regulacyjne (brak aktualnego KYC) i operacyjne (zaśmiecają analizę ryzyka).

Fragmentacja systemów: instytucja ma 5 różnych systemów (CRM, core banking, system leasingowy, konta oszczędnościowe, hipoteki) - i w każdym nieco inne dane tego samego klienta. Bez systemu "master data management" (MDM) - spójność jest niemożliwa.

Brak standardów: różni pracownicy, różne działy, różne oddziały - wpisują dane w różnych formatach. "Jan Kowalski", "KOWALSKI Jan", "kowalski, j" - to ta sama osoba, ale system może jej nie identyfikować.

Jak budować program Data Quality dla AML

Krok 1 - Data audit: systematyczny przegląd istniejących danych, identyfikacja problemów (brakujące pola, duplikaty, niespójności). Dla dużych baz klientów - narzędzia automatycznej analizy jakości danych.

Krok 2 - Data standards: ustalenie standardów formatu i kompletności danych - co jest obowiązkowe, w jakim formacie, jak jest walidowane przy wprowadzaniu.

Krok 3 - Master Data Management: jedno "źródło prawdy" dla danych klienta, z którym synchronizują się wszystkie inne systemy.

Krok 4 - Ongoing monitoring: ciągłe monitorowanie jakości danych - alerty przy wykryciu niespójności lub brakujących wymaganych danych.

Krok 5 - Customer data refresh program: systematyczne odświeżanie danych klientów - szczególnie tych, których dane są stare lub niepełne.

Podsumowanie

Data Quality to niewidoczna ale fundamentalna warstwa systemu AML. Instytucje inwestujące w AI i zaawansowane systemy monitorowania, ale ignorujące jakość danych, budują zaawansowaną nadbudowę na słabym fundamencie.

Pytanie: kiedy twoja instytucja przeprowadzała ostatni kompleksowy audyt jakości danych klientów w systemach AML? Ile procent klientów ma kompletne, aktualne i zweryfikowane dane?

Dyskusja