Daten- und Informationsqualität (eBook)
X, 415 Seiten
Vieweg & Teubner (Verlag)
978-3-8348-9266-9 (ISBN)
Prof. Dr. Knut Hildebrand, Hochschullehrer für Wirtschaftsinformatik an der Hochschule Darmstadt, Mitglied der DGIQ, Gründungsmitglied des European Institute for Data and Information Quality (EIDIQ)
Dr. Marcus Gebauer, Data Quality Officer der WestLB AG, Gründungsmitglied und Vorsitzender des Vorstands der Deutschen Gesellschaft für Informations- und Datenqualität e.V. (DGIQ)
Prof. Dr.-Ing. Holger Hinrichs, Hochschullehrer für Informatik an der FH Lübeck, Leiter Forschung und Entwicklung bei der TIQ Solutions GmbH
Michael Mielke, Gründungsmitglied und Präsident der Deutschen Gesellschaft für Informations- und Datenqualität e.V. (DGIQ)
Prof. Dr. Knut Hildebrand, Hochschullehrer für Wirtschaftsinformatik an der Hochschule Darmstadt, Mitglied der DGIQ, Gründungsmitglied des European Institute for Data and Information Quality (EIDIQ) Dr. Marcus Gebauer, Data Quality Officer der WestLB AG, Gründungsmitglied und Vorsitzender des Vorstands der Deutschen Gesellschaft für Informations- und Datenqualität e.V. (DGIQ) Prof. Dr.-Ing. Holger Hinrichs, Hochschullehrer für Informatik an der FH Lübeck, Leiter Forschung und Entwicklung bei der TIQ Solutions GmbH Michael Mielke, Gründungsmitglied und Präsident der Deutschen Gesellschaft für Informations- und Datenqualität e.V. (DGIQ)
Editorial 6
Danksagung 8
Inhaltsverzeichnis 10
A Informationsqualität – Grundlagen 12
1 Was wissen wir über Information? 13
1.1 Einleitung 13
1.2 Grundlegung 15
1.3 Information im Wissens- und Informationsmanagement 17
1.4 SHANNONsche Informationstheorie 21
1.5 STEINMÜLLERs Informationsmodell 24
1.6 Information als Produktionsfaktor 29
1.7 Zusammenfassung des Beitrages 32
Literaturverzeichnis 33
2 Informationsqualität – Definitionen, Dimensionen und Begriffe 35
2.1 Einleitung 35
2.2 IQ-Dimensionen und Definitionen 36
2.3 Zusammenfassung und Ausblick 54
Literaturverzeichnis 55
B Methoden – Techniken – Tools – Regelwerke/Standards 56
1 Datenqualitätsmetriken für ein ökonomisch orientiertes Qualitätsmanagement 57
1.1 Einleitung 57
1.2 Anforderungen an Datenqualitätsmetriken 59
1.3 Bisherige Beiträge zur Messung von Datenqualität 59
1.4 Metriken und Messverfahren für DQ 62
1.5 Praktische Anwendung der Metrik für Aktualität 72
1.6 Zusammenfassung und Ausblick 73
Literaturverzeichnis 74
2 Datenqualitätsmanagement – Steigerung der Datenqualität mit Methode 76
2.1 Die Bedeutung des Total Data Quality Management 76
2.2 Phasen eines ganzheitlichen Datenqualitätsmanagements 78
2.3 Anreize für ein Datenqualitätsmanagement 93
Literaturverzeichnis 95
3 Strukturierte Datenanalyse, Profiling und Geschäftsregeln 96
3.1 Datenqualität 96
3.2 Merkmale der Datenqualität 98
3.3 Geschäftsregeln 101
3.4 Methoden der Datenanalyse 102
3.5 Metriken im Detail 104
3.6 Datenqualität in der Anwendung 106
Literaturverzeichnis 109
4 Datenbereinigung zielgerichtet eingesetzt zur permanenten Datenqualitätssteigerung 110
4.1 Definition “Datenbereinigung” 110
4.2 Ursachenanalyse 111
4.3 Bewertungskriterien für Datenfehler und Korrekturmaßnahmen 112
4.4 Methoden des Datenqualitätsmanagements 116
4.5 Datenqualitätsmaßnahmen im Detail 118
4.6 Zusammenfassung 130
5 Datenintegration und Deduplizierung 131
5.1 Schritt 1: Schema Matching 134
5.2 Schritt 2: Dublettenerkennung 137
5.3 Schritt 3: Datenfusion 143
5.4 Erweiterungen 147
5.5 Zusammenfassung 149
6 Definition von Datenarten zur konsistenten Kommunikation im Unternehmen 151
6.1 Einleitung und Zielsetzung 151
6.2 Datenarten in der Informationslandschaft 152
6.3 Beschreibungskriterien 153
6.4 Beispiele für den Praxiseinsatz 159
6.5 Zusammenfassung 164
7 Suchmaschinen und Informationsqualität: Status quo, Problemfelder, Entwicklungstendenzen 165
7.1 Ausgangssituation 165
7.2 Charakterisierung algorithmenbasierter Suchmaschinen 166
7.3 Semantisches Web und semantische Suchmaschinen 171
7.4 Fazit und Ausblick 177
Literaturverzeichnis 178
8 Bedeutung der Informationsqualität bei Kaufentscheidungen im Internet 180
8.1 Einleitung 180
8.2 Informationsqualität in Entscheidungsprozessen 181
8.3 Ursachen mangelnder Informationsqualität im Internet 185
8.4 Fazit und Handlungsempfehlungen 197
Literaturverzeichnis 200
9 Datenqualitäts-Audits in Projekten 206
9.1 Einleitung 206
9.2 Abstimmung mit anderen Regelwerken 207
9.2 Abstimmung mit anderen Regelwerken 207
9.3 Glossar 208
9.4 Gebrauch der Generischen Checkliste 208
9.5 Datenqualitätsbewertung einer Datensammlung 211
9.6 Zusammenfassung 221
C Organisation 222
1 Organisatorische Ansiedlung eines Datenqualitätsmanagements 223
1.1 Einführung 223
1.2 Datenqualitätsmanagement – Entwicklungsstufen und Aufgaben 225
1.3 Datenqualitätsmanagement – Ansiedlung im Unternehmen 227
1.4 Datenqualitätsmanagement in Projekten 231
1.5 Zusammenfassung und Ausblick 233
Literaturverzeichnis 234
2 Organisatorische Maßnahmen für gute Datenqualität 235
2.1 Messungen, Ursachen und generische Ansätze 235
2.2 Aus den generischen Ansätzen abgeleitete Strategien 239
2.3 Strategie A: Transparenz schafft Vertrauen 240
2.4 Strategie B: Definition von Verantwortlichkeiten 241
2.5 Strategie C: gezielt Abhängigkeiten suchen 243
2.6 Strategie D: Daten-Lifecycle auf Basis des Prozesses 246
2.7 Strategie E: Niederschwellige Verbesserungs-Werkzeuge 248
2.8 Vor- und Nachteile aller erwähnter Strategien 250
2.9 Vorgehen bei der Umsetzung dieser Strategien 251
Literaturverzeichnis 253
3 Informationsmanagementprozesse im Unternehmen 254
3.1 Motivation 254
3.2 Ausgangslage 254
3.3 Bewertung 256
3.4 Informationsmanagementprozess 258
3.5 Schema einer Informationsplanung 260
3.6 Datenlandkarte und Datenarchitektur 261
3.7 Geschäftsprozesse und Informationsmanagementprozess 264
3.8 Qualitätsaspekte 265
3.9 Ökonomische Aspekte 269
3.10 Zusammenfassung 270
Literaturverzeichnis 270
4 Data Governance 271
4.1 Einführung 271
4.2 Stand der Wissenschaft und Praxis 273
4.3 Ein Modell für Data Governance 278
4.4 Zusammenfassung 287
Literaturverzeichnis 288
5 IQM-Reifegradmodell für die Bewertung und Verbesserung des Information Lifecycle Management Prozesses 290
5.1 Einleitung 290
5.2 Hintergrund 291
5.3 Methodologie 294
5.4 IQM-Reifegradmodell 295
5.5 Zusammenfassung und Ausblick 299
Literaturverzeichnis 299
D Praxisbeispiele 303
1 Ein Entscheidungsmodell zur Weitergabe persönlicher Daten im Internet 304
1.1 Einleitung 304
1.2 Entscheidungsmodell 305
1.3 Ausblick 315
Literaturverzeichnis 317
2 Einführung eines proaktiven DQ-Managements 318
2.1 Die Bremer Landesbank 318
2.2 Proaktives Datenqualitätsmanagement 319
2.3 Datenqualitätsorganisation 320
2.4 Eskalationsinstanz 322
2.5 Reporting 322
2.6 Messung von Datenqualität 322
2.7 Visualisierung der Messergebnisse 329
2.8 Messergebnisse und Fazit 333
3 Informationsqualität für das Management mit TOPAS 335
3.1 Informationsmanagement für Führungskräfte 335
3.2 TOPAS®: Methode und Modell 337
3.3 Anwendung: Management von Informationen und Daten 342
3.4 Informationserfassung 345
3.5 Informationsverarbeitung 346
3.6 Informationsdarstellung 350
3.7 Wirkungsspektrum von TOPAS 352
Literaturverzeichnis 354
4 Datenqualitäts-Modell der Volkswagen Financial Services AG 355
4.1 Einleitung 355
4.2 Das Projekt „Datenqualität Strukturen/Standards und Drittmarktfähigkeit“ 357
4.3 Fazit 371
5 Verknüpfung von DQ-Indikatoren mit KPIs und Auswirkungen auf das Return on Investment 373
5.1 Beispiele zur Illustration von DQ-Problemen 374
5.2 Wie wirken sich DQ-Probleme auf Unternehmen aus – Der Zusammenhang zwischen Daten- und Prozessqualität 375
5.3 Wie viel kosten schlechte Daten den Unternehmer? 380
5.4 Der Einfluss von DQ-Indikatoren auf KP-Indikatoren – wie beeinflusst Datenqualität den Unternehmenserfolg? 381
5.5 Beschreibung eines KPI orientierten DQManagementprozesses 384
5.6 Fallstudie – Banque Cantonale Vaudoise (BCV) 392
Literaturverzeichnis 395
Über die Autorinnen und Autoren 396
Stichwortverzeichnis 413
1 Ein Entscheidungsmodell zur Weitergabe persönlicher Daten im Internet (S. 299-300)
Dr. Horst Treiblmaier
1.1 Einleitung
In den vergangenen zwei Jahrzehnten wandelte sich das Internet von einer Spielwiese für technikbegeisterte Computerspezialisten zu einem vielseitig einsetzbaren weltweiten Netzwerk für Privatpersonen und Unternehmen. Maßgeblichen Anteil daran besaß die rasante Entwicklung des World Wide Web (WWW), das, durch die Möglichkeit multimediale Inhalte zu vermitteln, für einen großen Teil der Bevölkerung industrialisierter Länder zu einem wesentlichen Bestandteil des täglichen Lebens wurde. Dass diese Entwicklung noch lange nicht abgeschlossen ist, zeigt die derzeitige Diskussion zum Thema Web 2.0 bzw. 3.0. Waren es in den letzten Jahren die hohen Umsatzzuwächse im E-Commerce und multimedial gestaltete Webseiten in Kombination mit aufwändigen Applikationen, die für ständig steigende Nutzerzahlen im World Wide Web sorgten, so wird dieser Innovationsschub nunmehr durch eine Vielzahl von Anwendungen fortgesetzt, die sich durch die zunehmende Vernetzung der Nutzer untereinander auszeichnen.
Gemeinsam ist allen Kommunikations- und Transaktionsprozessen im Internet, dass eine Vielzahl von Daten ausgetauscht werden, beginnend mit Informationen über den sendenden Rechner (z.B. IP-Adresse, MAC-Adresse), die im HTTPProtokoll zwingend vorgesehen sind, bis hin zu persönlichen Informationen, die als Nutzlast in Datenpaketen übermittelt werden. Dieser permanente Datenaustausch im Internet stellt die notwendige Basis für alle darauf aufbauenden Anwendungen dar und rückt meist nur im Zusammenhang mit der Problematik des Datenschutzes ins Bewusstsein der Öffentlichkeit. Generell lässt sich dazu festhalten, dass die Nutzer dazu tendieren die Gesamtzahl über sie gespeicherten Datensätze drastisch zu unterschätzen [Borking 1998].
Betrachtet man den Prozess der Datensammlung und -speicherung im Internet aus Sicht der Unternehmen, so sind die Vorteile im Vergleich zur Realwelt offensichtlich: durch die einfache und kostengünstige Erhebung des Nutzungs- und Einkaufsverhaltens entfällt die Notwendigkeit zu aufwändigen Kundenbefragungen. Durch das Vorhandensein der Daten in digitaler Form kommt es zudem zu keinerlei Medienbrüchen beim Prozess der Datenspeicherung. Dennoch ist es in vielen Fällen notwendig bzw. wünschenswert darüber hinausgehende detaillierte Informationen über Nutzer bzw. Kunden einzuholen, die auf mehr oder weniger freiwilliger Angabe persönlicher Daten beruhen. Häufig findet dieser Prozess im Rahmen einer Anmeldung (z.B. für eine Community) statt.
Davon unabhängig wird das Internet aufgrund der oben beschriebenen Vorteile für eine Vielzahl von Befragungen durch Markt- und Meinungsforscher verwendet. Dieser Beitrag widmet sich nicht dem Prozess der nicht-reaktiven Datenweitergabe, d.h. jener Datensammlung, die sich weitgehend unabhängig vom Bewusstsein der Internetnutzer abspielt, sondern behandelt die Weitergabe jener persönlichen Daten, die von Unternehmen durch online-Formulare abgefragt werden. Im Gegensatz zu reinen Nutzungsdaten können Unternehmen durch direkte Befragungen ihrer Kunden auch psychografische oder soziodemografische Merkmale oder Kaufintentionen erheben.
Demgegenüber steht die vergleichsweise leichte Möglichkeit auf Nutzerseite durch bewusste Falscheingaben die Qualität dieser Daten zu mindern. Welche Bedeutung korrekte demografische und sozioökonomische Daten für Unternehmen besitzen, zeigen derzeit laufende Forschungsprojekte (z.B. von Microsoft) deren Ziel es ist, aus dem Nutzungsverhalten auf persönliche Daten rückzuschließen. Die daraus entstehenden rechtlichen Probleme sind allerdings noch weitgehend ungeklärt [Marks 2007]. Zudem besitzen derartige Verfahren naturgemäß eine gewisse „Unschärfe", da mit wahrscheinlichkeitstheoretischen Ansätzen gearbeitet wird.
Aus Sicht der Unternehmen ist es demzufolge erstrebenswert, korrekte Daten zu erhalten, die von Internetnutzern freiwillig gegeben werden. In diesem Beitrag wird zunächst ein Entscheidungsmodell vorgestellt, das den Dateneingabeprozess aus Sicht der Nutzer in verschiedene Stufen gliedert. Auf jeder Stufe müssen bestimmte Kriterien erfüllt sein, um eine korrekte Angabe persönlicher Daten zu gewährleisten. Sofern vorhanden, werden die einzelnen Schritte mit empirischen Ergebnissen aus einer Internetnutzer- und einer Unternehmensbefragung unterlegt.
Erscheint lt. Verlag | 5.2.2009 |
---|---|
Zusatzinfo | X, 415 S. 108 Abb. |
Verlagsort | Wiesbaden |
Sprache | deutsch |
Themenwelt | Mathematik / Informatik ► Informatik |
Technik ► Nachrichtentechnik | |
Schlagworte | Bank • Banken • data cleansing • Data Profiling • Daten • Datenqualität • Datenqualitätsmanagement • Datenqualitäts-Management • Datenspezialist • Datenspezialisten • DGIQ • Excellence • Forschung • Information • Informationen • Information Excellence • Informationsquali • Informationsqualität |
ISBN-10 | 3-8348-9266-1 / 3834892661 |
ISBN-13 | 978-3-8348-9266-9 / 9783834892669 |
Haben Sie eine Frage zum Produkt? |
Größe: 6,1 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich