Data Science (eBook)

Konzepte, Erfahrungen, Fallstudien und Praxis
eBook Download: PDF
2021
XLIII, 359 Seiten
Springer Fachmedien Wiesbaden (Verlag)
978-3-658-33403-1 (ISBN)

Lese- und Medienproben

Data Science -
Systemvoraussetzungen
42,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Data Science ist in vielen Organisationen angekommen und oft alltägliche Praxis. Dennoch stehen viele Verantwortliche vor der Herausforderung, sich erstmalig mit konkreten Fragestellungen zu beschäftigen oder laufende Projekte weiterzuentwickeln. Die Spannbreite der Methoden, Werkzeuge und Anwendungsmöglichkeiten ist sehr groß und entwickelt sich kontinuierlich weiter. Die Vielzahl an Publikationen zu Data Science ist spezialisiert und behandelt fokussiert Einzelaspekte. 
Das vorliegende Werk gibt den Leserinnen und Lesern eine umfassende Orientierung zum Status Quo aus der wissenschaftlichen Perspektive und zahlreiche vertiefende Darstellungen praxisrelevanter Aspekte. Die Inhalte bauen auf den wissenschaftlichen CAS-Zertifikatskursen zu Big Data und Data Science der Hochschule Niederrhein in Kooperation mit der Hochschule Bonn-Rhein-Sieg und der FH Dortmund auf. Sie berücksichtigen wissenschaftliche Grundlagen und Vertiefungen, aber auch konkrete Erfahrungen aus Data Science Projekten. Das Buch greift praxisrelevante Fragen auf wissenschaftlichem Niveau aus Sicht der Rollen eines 'Data Strategist', 'Data Architect' und 'Data Analyst' auf und bindet erprobte Praxiserfahrungen u. a. von Seminarteilnehmern mit ein. Das Buch gibt für Interessierte einen Einblick in die aktuell relevante Vielfalt der Aspekte zu Data Science bzw. Big Data und liefert Hinweise für die praxisnahe Umsetzung. 



Prof. Dr. Detlev Frick ist Professor für BWL, insb. Wirtschaftsinformatik an der Hochschule Niederrhein, 
Prof. Dr. Andreas Gadatsch ist Professor für BWL, insb. für Wirtschaftsinformatik an der Hochschule Bonn-Rhein-Sieg, 
Professor Dr. Jens Kaufmann ist Professor für Wirtschaftsinformatik, insb. Data Science an der Hochschule Niederrhein, 
Dipl.-Kff. (FH) Birgit Lankes ist Lehrkraft für besondere Aufgaben an der Hochschule Niederrhein,
Prof. Dr. Christoph Quix ist Professor für Wirtschaftsinformatik und Data Science an der Hochschule Niederrhein,
Andreas Schmidt, M.A. ist Wissenschaftlicher Mitarbeiter im Data Innovation Lab der Hochschule Bonn-Rhein-Sieg und
Prof. Dr. Uwe Schmitz ist Professor für Wirtschaftsinformatik an der FH Dortmund. 

Geleitwort: Den Menschen im Fokus – Datenschutz als Erfolgsfaktor für Big Data Technologien 5
Vorwort 7
Grußwort 9
Grußwort: Data Science – Weiterbildung für die Zukunft 10
Data Science – Entwicklungslinien und Trends 11
Inhaltsverzeichnis 15
Herausgeber- und Autorenverzeichnis 23
Abbildungsverzeichnis 37
Tabellenverzeichnis 41
Teil I Data Strategist Digitalisierung von Geschäftsmodellen – Big Data Technologien erfolgreich implementieren 42
1 Big Data 43
Zusammenfassung 43
1.1Grundlagen 43
1.2Architektur und Bausteine 46
1.3Datengetriebene Geschäftsmodelle 55
1.4Exemplarische Einsatzmöglichkeiten 57
Literatur 64
2 Data Literacy als ein essenzieller Skill für das 21. Jahrhundert 66
Zusammenfassung 66
2.1Notwendigkeit von Data Literacy 67
2.2Data Literacy als Begriff 69
2.3Data Literacy Skills im Detail 71
2.4Konzepte zur Implementation von Data Literacy in Lehre und Praxis 73
2.5Fazit 77
Literatur 78
3 Management von Big Data Projekten 80
Zusammenfassung 80
3.1Konzeptioneller Rahmen des Informationsmanagements 80
3.1.1Überblick 81
3.1.2Aufgabenorientiertes Ebenenmodell 81
3.1.3Integriertes Informationsmanagement 83
3.1.4Einordnung von Big Data 84
3.2Digitalisierung von Geschäftsmodellen mit Big Data 85
3.2.1IT-Governance und Digitalisierung 85
3.2.2Von der IT-Strategie zur Business Digitalstrategie 88
3.2.3Management von Big Data 92
3.2.4Vorgehensmodelle zur Einführung von Big Data 93
3.2.5Messung des Reifegrades von Organisationen 96
3.2.6Auswirkungen von Big Data auf die Organisation 98
Literatur 99
4 Digital Leadership 102
Zusammenfassung 102
4.1Führung im Digitalzeitalter 102
4.2New Work 103
4.2.1Mobile Arbeitsplätze 104
4.2.2Flexible Arbeitszeiten 104
4.2.3Veränderte Arbeitsinhalte 105
4.2.4Neue Arbeitsorganisation 106
4.3New Workforce 107
4.3.1Beschäftigungseffekte der Digitalisierung 107
4.3.2Rekrutierung von Generation Z 107
4.4Digital Leader 110
4.4.1Persönlichkeitsmerkmale 110
4.4.2Führungskompetenzen 111
4.4.3Virtuelle Führung 111
4.5Konzepte und Methoden für Digital Leadership 112
4.5.1SCRUM 112
4.5.2Design Thinking 115
4.5.3Servant Leadership 116
4.5.4VOPA?+?Modell 116
4.6Fazit 118
Literatur 119
Teil II Data Architect: Informationsarchitekturen gestalten – Daten effizient verwalten 121
5 Data Engineering 122
Zusammenfassung 122
5.1Aufgaben des Data Engineering 123
5.2Architekturen zum Daten-Management 124
5.3Datenmodellierung und Metadaten-Management 128
5.4Datenaufbereitung und Datenintegration 130
5.5Datenbank-Management-Systeme: SQL, NoSQL und Big Data 136
5.6Fazit 139
Literatur 140
6 Data Governance 142
Zusammenfassung 142
6.1Einführung 142
6.1.1Begriffliche Einordnung 142
6.1.2Datenstrategie 144
6.2Data Governance Framework 146
6.2.1Strategie 146
6.2.2Aufbauorganisation 148
6.2.3Richtlinien, Prozesse und Standards 149
6.2.4Messen und Beobachten 150
6.2.5Technologie 151
6.2.6Kommunikation 153
6.3Data Quality Management (DQM) 154
6.4Fazit 155
Literatur 155
7 Einsatz von In-Memory Technologien 157
Zusammenfassung 157
7.1Einleitung 157
7.2Definition und Abgrenzung In-Memory Technologien 159
7.3Anforderungen an den Einsatz einer In-Memory-Technologie 163
7.4Bewertung 165
7.5Fazit 167
Literatur 167
8 Big-Data-Technologien 168
Zusammenfassung 168
8.1Einleitung 168
8.2Skalierbarkeit und Fehlertoleranz 169
8.3Volume – Management von großen Datenmengen 172
8.4Velocity – Kontinuierliche Verarbeitung von Datenströmen 177
8.5Variety – Unterstützung für die Zusammenführung von heterogenen Daten 180
8.6Fazit 183
Literatur 183
9 Information Data Models: Das Fundament einer guten Information Strategy 184
Zusammenfassung 184
9.1Drei Thesen aus Sicht eines Praktikers 185
9.2It`s all about the information 187
9.3Das Heute und seine Hürden 187
9.4Wie es dazu gekommen ist 188
9.5Die Enterprise Architektur 189
9.6Drei Formen der Informations-Architektur und deren Auswirkungen 190
9.6.1Das Gestern und leider noch das Heute. Der anwendungszentrierte Ansatz (The Application Centric Approach) 190
9.6.2Das Heute und die Morgendämmerung, der datengesteuerte Ansatz (The Data Driven Approach) 191
9.6.3Das überfällige Übermorgen, die datenzentrische Architektur (The Data Centric Architecture) 194
Literatur 197
Teil III Data Analyst: Auswerten, Präsentieren, Entscheiden – Systematische Datenanalyse im Unternehmen 199
10 Reporting multidimensionaler Daten und Kennzahlen 200
Zusammenfassung 200
10.1Betriebswirtschaftliche Motivation 200
10.1.1Kennzahlen und ihre Anwendung 201
10.1.2Auswahl von Kennzahlen 202
10.2Daten und Business Intelligence 203
10.2.1Datenmodellierung 204
10.2.2Datensicherung 205
10.2.3Harmonisierung 206
10.2.4Daten-/Informationsqualität 206
10.2.5Datenbereitstellung 207
10.3Reporting/Berichtswesen 207
10.3.1Berichtsgrundformen 209
10.3.2Anforderungen an Berichte 210
Literatur 210
11 Fundamentale Analyse- und Visualisierungstechniken 212
Zusammenfassung 212
11.1Einleitung und Begriffswelt 212
11.2Lineare Regression 215
11.2.1Basisidee und Begrifflichkeiten 215
11.2.2Beispiel und Ergebnisinterpretation 216
11.2.3Prüfen der Voraussetzungen und Variablentransformation 218
11.3Einfache Klassifikationsverfahren 219
11.3.1k-Nearest-Neighbors 219
11.3.2Naive Bayes 220
11.3.3Entscheidungsbäume 221
11.4Clustering-Verfahren 222
11.4.1Hierarchische Verfahren 222
11.4.2Partitionierende Verfahren 224
11.5Assoziationsanalyse 224
11.6Ergänzende Überlegungen, Software und Tools 225
Literatur 226
12 Fortgeschrittene Verfahren zur Analyse und Datenexploration, Advanced Analytics und Text Mining 227
Zusammenfassung 227
12.1Einleitung 227
12.2Datenexploration und -darstellung 228
12.3Principal Component Analysis 229
12.4Random Forests 232
12.5Logistische Regression 232
12.6Entscheidungsbewertung 233
12.7Zeitreihenanalyse 234
12.8Text Mining 237
12.9Weitere Analysemöglichkeiten 239
Literatur 240
13 Datenbasierte Algorithmen zur Unterstützung von Entscheidungen mittels künstlicher neuronaler Netze 241
Zusammenfassung 241
13.1Datenbasierte Algorithmen und maschinelles Lernen 241
13.1.1Maschinelles Lernen 242
13.1.2Lernverfahren 243
13.2Künstliche neuronale Netze 244
13.2.1Netzarchitekturen 244
13.2.2Grenzen künstlicher neuronaler Netze 245
13.3Beispielhafte Anwendungsfelder 246
13.4Entwicklungsprozess 248
13.5Entwicklungsplattformen und Werkzeuge 249
13.5.1TensorFlow und PyTorch 250
13.5.2Ausführungsmodi 251
13.5.3Deployment und Betrieb 252
13.6Fazit und Ausblick 254
Literatur 255
14 Künstliche Neuronale Netze – Aufbau, Funktion und Nutzen 257
Zusammenfassung 257
14.1Einleitung 258
14.2Aufbau 259
14.2.1Künstliches Neuron 259
14.2.2Künstliche neuronale Netze 261
14.3Lernen künstlicher neuronaler Netze 265
14.3.1Überwachtes Lernen – Lernen mittels Backpropagation 266
14.3.2Unüberwachtes Lernen – Lernen mittels Wettbewerbslernen 267
14.4Nutzenpotenziale und Herausforderungen 268
14.5Fazit 270
Literatur 270
15 Bayesian Thinking in Machine Learning 272
Zusammenfassung 272
15.1Bayesian Thinking 273
15.2Bayes in Machine Learning 276
15.2.1Bayes in Regressionsverfahren 276
15.2.2Bayes in Klassifikationsverfahren 280
15.3Naive Bayes Classifier 282
15.3.1Grundlagen 282
15.3.2Methodik 283
15.4Fazit 285
Literatur 285
Teil IV Anwendungsorientierte Data Science 287
16 Text Mining: Durchführung einer Sentiment Analysis mit SAP HANA 288
Zusammenfassung 288
16.1Einleitung 288
16.2Grundlagen 289
16.3Umsetzung 290
16.3.1Vorgehensmodell 290
16.3.2Implementierung 292
16.3.2.1 Datenakquise 293
16.3.2.2 Datenverarbeitung 295
16.3.2.3 Datenanalyse 300
16.4Fazit 302
Literatur 303
17 Weiterbildung in Data Science 305
Zusammenfassung 305
17.1Kompetenz-Rahmenwerke für Data Science 306
17.2Studiengänge zu Data Science 308
17.3Berufliche Weiterbildung zu Data Science 311
17.3.1Zertifikatsprogramm der Fraunhofer Gesellschaft zu Data Science 312
17.3.2Zertifikatsstudien der Hochschule Niederrhein 313
17.3.3Zertifikatslehrgang zum Data Scientist der Bitkom Akademie 315
17.4Fazit 316
Literatur 317
18 Plattformökonomie für Data Plattformen 318
Zusammenfassung 318
18.1Motivation 318
18.2Begriffshaushalt 319
18.2.1Plattformen und Plattformökonomie 319
18.2.2Data Plattform 321
18.3Design-Prinzipien für Data Plattformen 323
18.3.1Netzwerkeffekte durch gemeinsam genutzte Datenobjekte 323
18.3.2Strategien für die Aktivierung von Plattformteilnehmern 324
18.3.3Einfacher Zugang durch Self-Service 325
18.3.4Effektives Matching durch Metadaten 326
18.4Monetarisierung 326
18.5Zusammenfassung und Fazit 327
Literatur 329
19 Akzeptanz und Nutzung von maschinellem Lernen und Analytics im Rechnungswesen und Controlling 331
Zusammenfassung 331
19.1Eine Herausforderung für die Finanzfunktion 332
19.2Nutzerakzeptanzforschung zu maschinellem Lernen 333
19.3Befragung von Führungskräften 334
19.3.1Strukturgleichungsmodell 334
19.3.2Umfrage 334
19.4Aktuelle Nutzung und Treiber 336
19.4.1Ergebnisse der Befragung 336
19.4.2Treibermodell zur Nutzung und Akzeptanz 341
19.5Handlungsempfehlungen und Ausblick 343
Literatur 344
20 Durch Daten zu neuen Geschäftsmodellen und Prozessoptimierungen – im Kontext von Car-Sharing 346
Zusammenfassung 346
20.1Kurze Einführung 346
20.2Durch Daten zu neuen Ideen und Optimierungen 347
20.3Umdenken im Unternehmen 350
20.4Durch ständige Überwachung zur stetigen Anpassung 353
20.5Mit ‚Lessons Learned‘ zur Optimierung von Geschäftsmodellen und -prozessen 356
20.6Fazit 360
Literatur 360
21 Einsatz von Logit- und Probit-Modellen in der Finanzindustrie 361
Zusammenfassung 361
21.1Einleitung 361
21.2Logit- und Probit-Modelle 362
21.3Datengrundlage 364
21.4Modellierung 367
21.5Überprüfung der Modellannahmen 371
21.6Vorstellung der Ergebnisse 372
21.7Vergleichende Beurteilung 375
Literatur 378
Stichwortverzeichnis 381

Erscheint lt. Verlag 11.11.2021
Zusatzinfo XLIII, 359 S. 133 Abb., 90 Abb. in Farbe.
Sprache deutsch
Themenwelt Mathematik / Informatik Informatik Datenbanken
Informatik Theorie / Studium Künstliche Intelligenz / Robotik
Mathematik / Informatik Mathematik Statistik
Wirtschaft Betriebswirtschaft / Management Wirtschaftsinformatik
Schlagworte Big Data • Business Intelligence • data governance • data literacy • Data Science
ISBN-10 3-658-33403-7 / 3658334037
ISBN-13 978-3-658-33403-1 / 9783658334031
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 10,4 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
der Praxis-Guide für Künstliche Intelligenz in Unternehmen - Chancen …

von Thomas R. Köhler; Julia Finkeissen

eBook Download (2024)
Campus Verlag
38,99