Dank des Internets und der digitalen Kommunikation können Unternehmen in allen Branchen über die Grenzen ihres Landes hinweg expandieren und Kunden aus der ganzen Welt anziehen. Um weltweit zu agieren und zu wachsen, müssen sie ihren internationalen Daten unbedingt vertrauen können.

Von der Struktur, Vollständigkeit und Korrektheit dieser Daten hängen viele Aspekte ihrer Geschäftstätigkeit ab. Die Integration von Kundendaten, die Verwaltung von Masterdaten, die Einhaltung von Gesetzen und Vorschriften sowie hervorragende Betriebsabläufe sind nur einige dieser Aspekte … und dann sind da noch die Kunden.

 Ganz gleich, wo auf der Welt Kunden wohnen, eines erwarten sie immer: Sie erwarten, dass Unternehmen ihren Namen, ihre Adresse und die ihnen gesendeten Angebote fehlerfrei schreiben. 

Warum internationale Daten schwieriger sind

Computer speichern Daten, indem sie jedem Buchstaben und jedem sonstigen Zeichen eine Zahl zuordnen. Standardmäßig erfolgt dies nach einem System, das als Unicode bezeichnet wird. So können über 95.000 verschiedene Zeichen gespeichert werden. Das sind mehr als genug für die vielen Alphabete, Schriften, Ideogramme und sonstigen Schreibsysteme auf der Welt. Was also ist das Problem? Es gibt mehrere.

1. Diakritische Zeichen

Ein diakritisches Zeichen ist ein kleines Symbol, das zu einem Buchstaben hinzugefügt wird, um seine Aussprache zu verändern. Einige Beispiele:

In vielen Datensystemen können nicht alle diakritischen Zeichen dargestellt werden. Dann stellt die IT Regeln auf, um dies zu lösen. Häufig werden mit diesen sogenannten Normalisierungsregeln die Schreibweise und die Aussprache an das Land angepasst, in dem sich das Unternehmen befindet.

Beispielsweise wird der Name „Müller“ in den Niederlanden zu „Muller“ normalisiert. Für die Unternehmenszentrale mag das akzeptabel sein, aber was sagt der Kunde dazu? Wie reagiert er darauf, wenn er eine Mitteilung des Unternehmens bekommt und sein Name nicht „Müller“, sondern „Muller“ geschrieben ist?

2. Unterschiedliche Schreibkonventionen

Viele Unternehmen nutzen mehr als eine Schreibkonvention für ihre Daten. Beispielsweise ist es möglich, dass der Name eines Kunden im CRM anders geschrieben ist als im Abrechnungssystem (etwa „Müller“ bzw. „Muller“). Durch diese kleine Abweichung kann es unklar sein, ob Herr Müller und Herr Muller dieselbe Person sind.

3. Transliteration

Die Transliteration ist ein Vorgang in einem Datensystem, mit dem Wörter, die in einem Alphabet vorliegen, in einem anderen dargestellt werden. Es folgt ein Beispiel für einen Namen, der in mehrere Sprachen transliteriert wurde: 

Wie Sie sehen, können transliterierte Namen in unterschiedlichen Alphabeten und Sprachen sehr unterschiedlich aussehen, sodass schwer zu entscheiden ist, ob sie dieselbe Person bezeichnen.

Wie Sie sicher sein können, dass Ihre internationalen Daten korrekt sind

Bei der Verarbeitung internationaler Daten möchten Sie mit möglichst hoher Korrektheitsquote erkennen, welche Personen die Namen in Ihrer Datenbank bezeichnen.

Hierfür muss Ihr Datensystem robuste, intelligente Vergleichsmethoden bieten. Dieser Vergleichsvorgang beginnt mit einer Normalisierung. Dabei wird der Name gemäß dem Alphabet und den Schreibregeln umgeschrieben, mit denen auch alle anderen Namen in der Datenbank geschrieben werden.

Dann folgt ein Abgleich. Dabei werden Namen phonetisch verglichen, um mit hoher Genauigkeit zu ermitteln, ob sie sich auf dieselbe Person beziehen.

Dieser Abgleich ist sehr wichtig, weil er auch genutzt wird, um eine Person anhand von Sanktionslisten zu überprüfen, um Betrug, Geldwäsche oder die Finanzierung krimineller Organisationen zu verhindern

Frau mit Brille vor dem Laptop
Blog