Die Ergebnisse des ersten Data Profilings werden von den Mitgliedern des Projektteams in den Quelldaten bereinigt. Grundlage hierfür sind die Analyseergebnisse des Controllings; vornehmlich die einzelnen, markierten Datensätze, die als fehlerhaft identifiziert wurden. Die Bereinigung erfolgt unter Einbezug der jeweiligen Sachbearbeiter, um bereits in diesem Stadium das Bewusstsein für korrekte Datenbestände zu erhöhen.

Bevor Änderungen an den Quelldaten vorgenommen werden, ist eine vollständige Sicherung der Daten durchzuführen. Somit besteht jederzeit die Möglichkeit, den Stand vor Bereinigung der Daten im Notfall wiederherstellen zu können. Zudem werden alle Änderungen zur späteren Nachvollziehbarkeit dokumentiert.

Die Bereinigung erfolgt systematisch, nach eingeteilten Fehlerkategorien. In einem ersten Schritt werden fehlerhafte Datensätze gelöscht, die nicht mehr korrigiert werden können. In einem zweiten Schritt werden Duplikate eliminiert. Danach erfolgen die Korrekturen, die ein Herleiten der fehlenden oder falschen Werte aus Referenzdatenbeständen erfordert. Da die Herleitung in zahlreichen Fällen anzuwenden ist, bedient sich das Projektteam für das maschinelle Nachschlagen der korrekten Werte in den Referenzdatenbeständen der Tabellenkalkulationsformel "XVERWEIS".

 
Praxis-Tipp

Tabellenkalkulationsformel XVERWEIS

Die Formel "XVERWEIS" kommt zur Anwendung, wenn Elemente anhand eines (übereinstimmenden) Suchkriteriums in einer vorhandenen Tabelle gesucht werden. Sind in einer Liste z. B. lediglich Debitorennummern vorhanden, können mittels XVERWEIS anhand des Suchkriteriums Debitorennummer in einer Kundentabelle – die ebenfalls Debitorennummern aufweist – andere Spaltenwerte (z. B. Debitorenname oder Anschriftsdaten) automatisiert herausgelesen werden. Diese Funktion automatisiert das mühsame manuelle Heraussuchen in anderen Tabellen.

Zum Ende der Datenbereinigung erfolgt die Betrachtung von markierten Datensätzen, die eine manuelle Verifizierung erfordern.

 
Praxis-Beispiel

Manuelle Verifizierung der Telefonnummer +49 (5412) 231

Die Analyse durch das Controlling hat die Telefonnummer eines Lieferanten als fehlerhaft markiert, da sie zwar im korrekten Format vorhanden war, aber die Anschlussnummer nur aus 3 Stellen bestand. Eine manuelle Überprüfung hat ergeben, dass die Telefonnummer entgegen der Schlussfolgerung aus der ursprünglichen Analyse korrekt ist. Es handelte sich um einen langjährigen Telefonanschluss aus Zeiten, in denen noch dreistellige Telefonnummern in dem betroffenen Anschlussbereich vergeben wurden. Da der Anschluss über lange Zeit nicht gekündigt wurde, blieb die dreistellige Telefonnummer erhalten – obwohl zwischenzeitlich in dieser Region mindestens fünfstellige Telefonnummern üblich sind.

Wenn die Korrektheit der Telefonnummern nicht per Abgleich mit verifizierten Datenbeständen erfolgen kann, ist im Einzelfall auch eine herkömmliche, traditionelle Überprüfung wirksam: Anrufen und nachfragen!

Das ist nur ein Ausschnitt aus dem Produkt Haufe Finance Office Premium. Sie wollen mehr?

Anmelden und Beitrag in meinem Produkt lesen


Meistgelesene beiträge