Software zur Sanktionslistenprüfung bewerten (Leitfaden 2026)

Die meisten Bewertungen zur Sanktionslistenprüfung stehen auf den falschen Kriterien.

Sie drehen sich um Listenabdeckung, Matching-Genauigkeit, False-Positive-Quote, Support und Preis. Das sind vernünftige Fragen. Sie sind auch der Grund, warum die meisten Unternehmen am Ende ein Tool haben, das funktioniert, und einen Compliance-Prozess, der es nicht tut.

Die Kriterien, die Anbietergespräche beherrschen, betreffen die Erkennung. Sie betreffen nicht, was nach der Erkennung kommt. Und nach der Erkennung liegen die eigentlichen Kosten, das Risiko und das Audit-Risiko der Compliance.

Dieser Artikel behandelt die Standardkriterien, erklärt, warum sie notwendig, aber nicht ausreichend sind, und benennt die Fragen, die die meisten Käufer erst stellen, wenn der Vertrag längst unterschrieben ist.

Die Standardkriterien

Diese Punkte stehen in fast jeder Ausschreibung und jedem Anbietervergleich. Behandeln Sie sie als Fundament, nicht als Obergrenze.

Listenabdeckung

Gegen welche Sanktionslisten prüft das Tool? Die meisten gängigen Anbieter decken 300 bis 500 Listen ab. Der Mehrwert jeder weiteren Liste hängt davon ab, wo das Unternehmen Handel treibt. Ein Unternehmen mit erheblicher Lieferkette in China braucht eine andere Abdeckung als eines, das vor allem innerhalb der EU agiert.

Matching-Qualität

Wie geht das Tool mit Fuzzy-Matching, phonetischem Matching und Transliteration um? Gleicht es über lateinische und nichtlateinische Schriften hinweg ab? Erklärt es, warum ein bestimmter Treffer ausgelöst wurde, oder zeigt es nur ein Namenspaar und einen Prozentwert ohne Kontext?

Wer nicht sieht, warum ein Treffer ausgelöst wurde, kann die Untersuchung nicht skalieren. Transparenz beim Matching zählt mehr, als die meisten Bewertungen einräumen. Versteht der Analyst die Grundlage eines Treffers nicht, beginnt er jede Untersuchung bei null. Über Tausende Treffer summiert sich diese Undurchsichtigkeit zu erheblicher verlorener Zeit.

Lassen Sie sich die Matching-Ausgabe für einen komplexen Testfall zeigen. Geben Sie einen transliterierten arabischen oder chinesischen Namen ein und bewerten Sie, was das Tool zurückgibt. Der Unterschied zwischen Anbietern zeigt sich an den Rändern, nicht bei einfachen Treffern in lateinischer Schrift.

False-Positive-Quote

Jeder Anbieter wird eine niedrige False-Positive-Quote behaupten. Die Zahl ist ohne Kontext bedeutungslos.

False-Positive-Quoten hängen von den geprüften Entitätsdaten ab, von der eingestellten Matching-Empfindlichkeit, von den einbezogenen Listen und vom Handelsprofil des Unternehmens. Ein Anbieter, der 5 Prozent auf sauberen Testdaten vorführt, sagt nichts darüber, wie die Quote auf Ihren Produktivdaten aussieht.

Die False-Positive-Quote ist nicht nur eine Erkennungskennzahl. Sie ist ein Multiplikator für die Arbeitslast. Jedes False Positive, das das Tool erzeugt, ist ein Treffer, den ein Analyst untersuchen, entscheiden und dokumentieren muss. Die nützlichere Frage ist nicht „Wie hoch ist Ihre False-Positive-Quote“, sondern „Welche Werkzeuge bieten Sie, um False Positives zu reduzieren, sobald sie erzeugt sind?“ Schwellenwert-Tuning, Pflege von Ausschlusslisten und die Möglichkeit, einmal freigegebene Kombinationen zu unterdrücken, sind operative Notwendigkeiten.

Eine wiederkehrende Erfahrung in Compliance-Teams: Anbieter, die für jede Konfigurationsänderung ein Support-Ticket verlangen, schaffen eine Abhängigkeit, die Reaktionszeiten verlangsamt und Kosten treibt. Kann das Compliance-Team Empfindlichkeit oder Ausschlusslisten nicht selbst anpassen, ist das eine Einschränkung, die man vor der Wahl kennen sollte.

Integration

Verbindet sich das Tool mit ERP, Außenhandelssystem oder CRM des Unternehmens? Per API, per Stapelupload oder beides? Gibt es für ERP-Umgebungen eine native Integration, oder braucht es Middleware?

Die Qualität der Integration zählt mehr als ihr bloßes Vorhandensein. Ein Tool mit API, das sechs Monate kundenspezifische Entwicklung verlangt, ist nicht wirklich integriert. Ein Tool, das sich nativ verbindet, die Ergebnisse aber nicht ins Quellsystem zurückspielt und manuelle Statusupdates im ERP verlangt, löst das Problem nur halb.

Fragen Sie konkret: Fließt das Prüfergebnis automatisch zurück ins Ursprungssystem? In vielen Unternehmen entstehen genau an diesem manuellen Rückkanal die Compliance-Lücken. Eine Entität wird im Screening-Tool freigegeben, aber nicht in SAP aktualisiert. Die Systeme widersprechen sich. Niemand bemerkt es, bis ein Audit kommt.

Screening-Workflow

Unterstützt das Tool die Prüfung beim Onboarding, die transaktionsbezogene Prüfung (bei Auftrag oder Versand) und das laufende, tägliche Monitoring (automatische Neuprüfung bei Liständerungen)?

Eine reine Onboarding-Prüfung genügt den meisten aufsichtsrechtlichen Erwartungen nicht. Unterstützt das Tool weder transaktionsbezogene Prüfung noch laufendes Monitoring, muss das Unternehmen diese Abläufe getrennt aufbauen. Das heißt meist manuelle Prozesse mit Abdeckungslücken.

Preis

Screening-Tools werden pro Nutzer, pro geprüfter Entität oder als Plattformabonnement mit Mengenstufen abgerechnet. Verschaffen Sie sich Klarheit, was enthalten ist. Listenupdates, API-Zugang, laufendes Monitoring und Support sind mal gebündelt, mal getrennt berechnet.

Der Preis ist zugleich das am wenigsten nützliche Unterscheidungsmerkmal. Die Softwarelizenz ist meist der kleinere Kostenblock. Die Untersuchungslast dahinter ist der größere. Ein Tool, das 20 Prozent weniger kostet, aber 30 Prozent mehr False Positives erzeugt, ist nicht billiger. In Analystenzeit ist es teurer.

Die Fragen, die die meisten Käufer nicht stellen

Die Kriterien oben grenzen das Feld auf eine Auswahl fähiger Anbieter ein. Die meisten von ihnen werden bei der Erkennung passabel abschneiden. Die Unterschiede, die in der Praxis am meisten zählen, liegen in einer Kategorie, die im Auswahlprozess selten auftaucht.

Was passiert nach dem Treffer?

Das ist die wichtigste Frage der ganzen Bewertung, und sie wird am häufigsten übersprungen.

Erzeugt das Tool einen Treffer, was sieht der Analyst? Reicht die Information, um eine Untersuchung zu beginnen, oder muss der Analyst das Tool sofort verlassen, um Kontext aus externen Quellen zu holen?

Zeigt das Tool die Listungsdetails, das einschlägige Sanktionsprogramm, den Umfang der Beschränkung? Zeigt es, ob der Eintrag einen Vermerk zu Sekundärsanktionsrisiko trägt? Trägt es externen Kontext zusammen (Handelsregisterdaten, Eigentümerstrukturen, Adverse Media) oder überlässt es das vollständig der manuellen Recherche?

Die meisten Tools enden beim Treffer. Der Analyst öffnet ihn, liest ein Namenspaar und einen Match-Wert und verbringt dann fünf bis dreißig Minuten damit, zwischen Tool, Browsern, Handelsregistern und internen Systemen zu wechseln, um die Informationen für eine Entscheidung zusammenzutragen. So sieht der Untersuchungsprozess in der Praxis aus: Der Analyst wird zur Integrationsschicht zwischen den Systemen.

Lautet die Antwort „der Analyst untersucht von Hand“, dann kaufen Sie kein System. Sie kaufen eine Arbeitslast.

Wie werden Entscheidungen dokumentiert?

Lassen Sie sich die Oberfläche des Fallmanagements zeigen. Wo hält der Analyst seine Entscheidung fest? Gibt es ein strukturiertes Format mit Pflichtfeldern oder ein Freitextfeld?

Die meisten Tools bieten einen Platz für eine Notiz, kein System zur Beweisführung. Ein Textfeld am Trefferdatensatz, ohne vorgegebene Struktur, ohne Quellenangaben, ohne standardisiertes Format, ist keine Dokumentationsinfrastruktur. Es ist ein Kasten.

Das zählt, weil die Dokumentationsqualität das ist, was Prüfer tatsächlich testen. Ein Tool mit exzellentem Matching und schwachem Fallmanagement erzeugt ein Programm, das gut erkennt und schlecht dokumentiert. Das ist ein Programm, das im Audit angreifbar ist.

Lässt sich der Audit Trail ohne Rekonstruktion abrufen?

Bitten Sie den Anbieter zu zeigen, wie Sie den vollständigen Entscheidungsverlauf für einen bestimmten Geschäftspartner erzeugen, der vor sechs Monaten geprüft wurde. Jeder erzeugte Treffer, jede durchgeführte Untersuchung, jede getroffene Entscheidung und die Begründung dahinter.

Wenn Sie den Audit Trail erst zusammensetzen müssen, haben Sie keinen.

Läuft die Antwort auf das Exportieren von CSV-Dateien, das Durchsuchen von Netzlaufwerken oder das Ziehen von Datensätzen aus mehreren Systemen hinaus, liefert das Tool Trefferdatensätze, keinen Audit Trail. Unter dem Druck einer Prüfung ist diese Rekonstruktion langsam, lückenhaft und wenig überzeugend.

Was verlangt das Tool von Ihrem Team?

Das ist die Frage nach den Gesamtbetriebskosten, und sie reicht weit über die Lizenzgebühr hinaus.

Wie viel Konfiguration verlangt die Matching-Logik, und wer pflegt sie? Kann das Compliance-Team Schwellenwerte selbst anpassen, oder braucht jede Änderung Anbietersupport? Was passiert mit der Konfiguration bei einer ERP-Migration?

Wie viel Schulung brauchen die Analysten? In Unternehmen, in denen die Prüfung von Nichtspezialisten erledigt wird (Regionalleiter, Einkauf, Vertriebsinnendienst), zählt die Bedienbarkeit mehr als die Funktionsliste.

Wie sieht das Supportmodell des Anbieters aus? Reaktionszeiten, Eskalationswege und die Frage, ob Konfigurationsänderungen enthalten oder getrennt berechnet werden, sind Details, die sich über die Laufzeit der Beziehung summieren.

Wird das Tool besser, oder hält es nur den Stand?

Die meisten Tools vergessen alles.

Sie leisten am tausendsten Tag dasselbe wie am ersten. Die Matching-Logik lernt nicht. Frühere Entscheidungen fließen nicht in spätere ein. Eine Entität, die letzten Monat als False Positive freigegeben wurde, erzeugt diesen Monat denselben Treffer und verlangt dieselbe Untersuchung.

Fragen Sie, ob das Tool strukturierte Daten aus früheren Entscheidungen erfasst und auf künftige Prüfungen anwendet. Erkennt es wiederkehrende False Positives? Lernt es aus den Mustern in der Prüfhistorie des Unternehmens? Oder kommt jeder Treffer an, als hätte man ihn nie zuvor gesehen?

Das ist heute keine Standardanforderung. Es wird eine werden. Die Unternehmen, die jetzt schon danach bewerten, sind denen voraus, die den Bedarf später entdecken.

Wie Sie die Bewertung aufbauen

Die meisten Bewertungen scheitern nicht an den falschen Kriterien, sondern an ihrer falschen Gewichtung.

Erkennungsleistung ist die Vorqualifikation

Listenabdeckung, Matching-Qualität, Integration und Monitoring sind Anforderungen. Erfüllt ein Tool die Grundlinie nicht, fällt es raus. Oberhalb der Grundlinie aber sind die Unterschiede zwischen gängigen Anbietern bei der Erkennung marginal. Die Wahl zwischen 350 und 400 Listen, oder zwischen zwei ausgereiften Fuzzy-Matching-Algorithmen, entscheidet selten darüber, ob das Compliance-Programm funktioniert.

Operative Wirksamkeit ist das Unterscheidungsmerkmal

Was nach dem Treffer passiert, wie Untersuchungen unterstützt werden, wie Entscheidungen dokumentiert werden und wie der Audit Trail geführt wird, das bestimmt die Gesamtkosten und das Risikoprofil des Screening-Programms. Es sind auch die Punkte, an denen die Fähigkeiten der Anbieter am schärfsten auseinandergehen.

Gesamtbetriebskosten sind das Zünglein an der Waage

Die Lizenzgebühr ist eine Größe. Analystenzeit pro Treffer, Konfigurationsaufwand, Anbieterabhängigkeit, Schulungsbedarf und Kosten der Audit-Vorbereitung sind die anderen. Ein Tool, das pro Platz mehr kostet, aber die Untersuchungszeit um 50 Prozent senkt, ist in der Praxis billiger als eines mit niedrigerer Lizenzgebühr und ohne Unterstützung bei der Untersuchung.

Die Bewertung sollte entsprechend gewichten. Erkennung ist oberhalb einer Schwelle ein Bestanden oder Durchgefallen. Operative Wirksamkeit und Gesamtbetriebskosten bestimmen den Sieger.

Die Bewertung, die die meisten Unternehmen tatsächlich fahren

In der Praxis werden die meisten Bewertungen von Erkennungskriterien und Preis beherrscht. Der Anbieter mit der besten Matching-Demo und dem konkurrenzfähigsten Angebot gewinnt.

Das führt zu einem absehbaren Ergebnis. Das Unternehmen kauft ein fähiges Screening-Tool. Treffer werden erzeugt. Analysten untersuchen sie von Hand, wechseln zwischen Systemen, dokumentieren Entscheidungen in Tabellen und auf Netzlaufwerken. Das Compliance-Team trägt die operative Last, weil niemand bewertet hat, ob das Tool sie senken würde.

Zwei Jahre später sind die Trefferzahlen gewachsen. Das Team steht unter Druck. Ein Audit bringt Dokumentationslücken ans Licht.

Das Tool funktionierte genau wie bewertet. Der Prozess nicht.

Was Sie tatsächlich kaufen

Ein Tool zur Sanktionslistenprüfung ist kein Compliance-Programm. Es ist ein Bestandteil davon. Das Tool übernimmt die Erkennung. Das Compliance-Programm verlangt Erkennung, Untersuchung, Entscheidung, Dokumentation und Prüfungssicherheit.

Wenn Sie Screening-Software bewerten, wählen Sie keinen Matching-Algorithmus. Sie wählen das Fundament eines operativen Ablaufs, der tausende Male im Monat läuft, über mehrere Analysten hinweg, über Jahre.

Das beste Screening-Tool ist nicht das mit den meisten Listen oder der niedrigsten False-Positive-Quote auf Testdaten. Es ist das, das Ihr Compliance-Team in die stärkste Position bringt, um jeden eingehenden Treffer zu untersuchen, zu entscheiden und zu verteidigen.

Erkennung ist, was Sie kaufen. Die Trefferbearbeitung, das, was wir Sanctions Resolution nennen, ist, was Sie betreiben. Bewerten Sie beides.

Software zur Sanktionslistenprüfung bewerten: Was die meisten Käufer übersehen

Die Standardkriterien

Listenabdeckung

Matching-Qualität

False-Positive-Quote

Integration

Screening-Workflow

Preis

Die Fragen, die die meisten Käufer nicht stellen

Was passiert nach dem Treffer?

Wie werden Entscheidungen dokumentiert?

Lässt sich der Audit Trail ohne Rekonstruktion abrufen?

Was verlangt das Tool von Ihrem Team?

Wird das Tool besser, oder hält es nur den Stand?

Wie Sie die Bewertung aufbauen

Erkennungsleistung ist die Vorqualifikation

Operative Wirksamkeit ist das Unterscheidungsmerkmal

Gesamtbetriebskosten sind das Zünglein an der Waage

Die Bewertung, die die meisten Unternehmen tatsächlich fahren

Was Sie tatsächlich kaufen

Zeigen Sie uns Ihre Trefferbearbeitung.

Software zur Sanktionslistenprüfung bewerten: Was die meisten Käufer übersehen

Die Standardkriterien

Listenabdeckung

Matching-Qualität

False-Positive-Quote

Integration

Screening-Workflow

Preis

Die Fragen, die die meisten Käufer nicht stellen

Was passiert nach dem Treffer?

Wie werden Entscheidungen dokumentiert?

Lässt sich der Audit Trail ohne Rekonstruktion abrufen?

Was verlangt das Tool von Ihrem Team?

Wird das Tool besser, oder hält es nur den Stand?

Wie Sie die Bewertung aufbauen

Erkennungsleistung ist die Vorqualifikation

Operative Wirksamkeit ist das Unterscheidungsmerkmal

Gesamtbetriebskosten sind das Zünglein an der Waage

Die Bewertung, die die meisten Unternehmen tatsächlich fahren

Was Sie tatsächlich kaufen

Ähnliche Artikel

Sanktionslistenprüfung: Was die Software kostet

Einen echten Treffer nach EU-Recht bearbeiten

Erfordert jeder echte Treffer eine Maßnahme?

Zeigen Sie uns Ihre Trefferbearbeitung.