Archiv

Auf die Datenqualität kommt es an



Als vor einigen Jahren von der GEZ ein Zahlungsbescheid an den bekannten, vor mehr als 500 Jahren lebenden Rechenmeister Adam Ries ging, war das Medienecho hoch. Die GEZ versprach, die Daten zu bereinigen. Anfang dieses Jahres aber wurde Adam Ries von der Nachfolgestelle der GEZ wieder aufgefordert, seine Rundfunkgebühren zu zahlen. Ein Einzelfall?

Leider nicht. Sehr viele Unternehmen haben Probleme mit Ihren Daten. Dabei sollte jedem Unternehmen bewusst sein, dass mangelnde Datenqualität hohe Kosten verursacht.

Veraltete oder unvollständige Kundendaten sind beispielsweise der Grund für Irrläufer, Mehrfachauslieferungen und erschwerte Kundenkommunikation. Aber auch falsche oder verzerrte Kennzahlen im Berichtswesen sind bei mangelnder Datenqualität durch redundante oder inkonsistente Daten möglich. Hier können die Folgen besonders schwerwiegend sein, da viele strategische Entscheidungen auf der Grundlage dieser Kennzahlen getroffen werden.

Um negative Folgen für Ihr Unternehmen zu vermeiden, muss auf Datenqualität geachtet werden. Doch wie kann das erreicht werden?

Wenn Fehler in Daten erkannt werden, sollten diese natürlich sofort behoben werden. Besser ist es aber, schon bei der Eingabe auf vollständige und richtige Daten zu achten. Einmal auf ein Schema für Kundendaten festgelegt, sollte man sich bei der Anlage von neuen Kunden immer daran halten. Das erspart im Nachhinein viel Arbeit und gibt die Gewissheit, sich auf seine Daten verlassen zu können.

Doch wie sieht es mit Daten aus, die bereits unvollständig oder fehlerhaft im System vorhanden sind? Müssen diese manuell gesucht und bereinigt werden? Die gute Nachricht: es gibt Tools, die Sie bei dieser Arbeit unterstützen können.

Die Datenbereinigung sollte als Prozess gesehen werden und folgende Schritte beinhalten:

1. Data Profiling

2. Data Cleansing

3. Monitoring

Beim Data Profiling werden die Daten analysiert, was dem Erkennen von Inkonsistenzen, Fehlern und Widersprüchen in den Datenbeständen dient. Aus den daraus gewonnenen Informationen können Maßnahmen abgeleitet werden, die zur Verbesserung der Datenqualität beitragen sollen.

Anschließend folgt die Phase des Data Cleansing, der Datenbereinigung. Typische Arbeiten bei der Datenbereinigung sind z. B. Datentypkonvertierungen, Dublettenerkennung oder Vervollständigung lückenhafter Daten. Diese Phase kann sehr zeitintensiv werden.

Ist eine gewisse Datenqualität erreicht, sollte diese möglichst langfristig gewahrt werden (Monitoring). Dies kann zum einen organisatorisch sichergestellt werden, indem z. B. Stammdaten nur von einer verantwortlichen Person angelegt und geändert werden dürfen. Zum anderen durch technische Unterstützung wie beispielsweise einer Validierung der Eingabefelder oder durch Workflowunterstützung von Prozessen.

Was können Sie tun?

Um eine gute Datenqualität zu erreichen können Sie als ersten Schritt die Dateneingabe für bestimmte Bereiche wie z. B. die Stammdatenpflege auf wenige Mitarbeiter beschränken. Weiterhin können Sie Regeln definieren, mit denen die Eingaben standardisiert werden.

Es gibt einige Toolhersteller, die sich auf Datenqualitätssoftware spezialisiert haben. Dazu gehören unter anderem Omikron, iWay oder Trillium Software. Zusätzlich gibt es Tools wie beispielsweise die Open Source Tools Talend oder DataCleaner, die Unterstützung im Bereich Datenqualität bieten. Aber auch große Unternehmen wie Oracle, IBM oder Informatica bieten eigene Tools an.

Wenn Sie bereits mit Business Intelligence Tools arbeiten, können Sie die Datenbereinigung (Data Cleansing) auch direkt in den ETL-Vorgang implementieren.

Fazit

Durch die oben genannten Maßnahmen lässt sich die Datenqualität in Ihrem Unternehmen erheblich steigern. Eine einmalige Bereinigung ist häufig nicht ausreichend. Daten verändern sich ständig und müssen deshalb fortlaufend gepflegt werden. Nur mit richtigen Daten können Sie Konsistenz, Korrektheit und Vollständigkeit steigern und Ihre Kunden korrekt ansprechen, so dass Sie Kosten und Imageschäden für Ihr Unternehmen vermeiden können.

Weitere Informationen

Sollten Sie Fragen oder Anmerkungen zum Thema Datenqualität haben, können Sie sich gerne mit uns in Verbindung setzten. Schreiben Sie einen Kommentar oder schicken Sie eine E-Mail an baerbel.haeussler@eloum.net. Wir freuen uns über Ihr Feedback.

Weiterführende Informationen auch zu anderen interessanten Themen finden Sie auf den Seiten des eBusiness-Lotsen Oberschwaben-Ulm.

Keine Kommentare