Data Science in der Praxis

Eine verständliche Einführung in alle wichtigen Verfahren

(Autor)

Buch | Softcover
360 Seiten
2022 | 1. Auflage
Rheinwerk (Verlag)
978-3-8362-8462-2 (ISBN)
34,90 inkl. MwSt
Die Rundumversorgung für Ihre Data-Science-Projekte!

  • Erfolgsfaktoren und Tools für alle Projektphasen
  • KI und Machine Learning für die Datenanalyse
  • Mit Anwendungsbeispielen für verschiedene Fachgebiete
  • Von der Anforderungsanalyse über die Akquise und Aufbereitung der Daten bis zur Visualisierung der Ergebnisse

Der ideale Einstieg in Data Science für Praktiker!

Ob mit oder ohne Mathematikkenntnisse – Sie bekommen hier den Rundumblick, den Sie für Ihre Projekte brauchen. So heben Sie den Schatz, den Daten darstellen können, wenn man sie richtig befragt. Sie lernen die einschlägigen Analysemethoden kennen, bekommen eine Einführung in die Programmiersprache R und erfahren, wie Sie maschinelles Lernen einsetzen. Und zwar inklusive dazugehöriger Werkzeuge wie Notebooks, die die Data-Science-Programmierung heutzutage so zugänglich machen.

Und weil es mit der Technik allein nicht getan ist, geht das Buch auch auf Probleme der Projektdurchführung ein, beleuchtet verschiedene Anwendungsfelder und vergisst auch nicht, ethische Aspekte anzusprechen.Mit vielen Beispielen, Hinweisen für den Fehlerfall, Entscheidungshilfen und weiteren Praxistipps.

Grundlagen und erste Schritte
Wichtige Konzepte der Statistik, die Installation und Einrichtung von RStudio, die Syntax der Programmiersprache, ein Grundverständnis der einschlägigen Methoden: Mit diesem Buch bauen Sie ein gutes Fundament für Ihre Projekte auf. Spezielle Vorkenntnisse werden nicht benötigt.

Verfahren auswählen und anwenden
Lernen Sie, das richtige Verfahren für Ihr Projekt zu wählen – je nach Anwendungsfall, Erkenntnisziel und Datenlage. Tom Alby nimmt Sie auch bei den Details an die Hand und hilft über typische Stolperfallen hinweg. So bauen Sie sich ein sicheres Methoden-Repertoire für Ihre Data-Science-Projekte auf.

Künstliche Intelligenz und Machine Learning
KI und maschinelles Lernen sind Schlüsseltechnologien, wenn es darum geht, aus Daten Erkenntnissse zu gewinnen. Hier erfahren Sie konkret, wie sie sich für die Datenanalyse einsetzen lassen.

Werkzeuge und mehr
Mit der Analyse allein ist es nicht getan. Freuen Sie sich auf Praxistipps zum Projektmanagement, zu Werkzeugen wie Git und zur gelungenen Kommunikation mit Stakeholdern.

Aus dem Inhalt:
Erste Schritte mit R und RStudio
Grundbegriffe der Statistik
Vorbereitung: Daten reinigen und transformieren
k-Means Clustering
Lineare und nichtlineare Regression
Vorhersagen, Clustering, Klassifizierung
Tipps und Werkzeuge für alle Projektphasen
Ihre Anwendung als REST-API bereitstellen
KI und Maschinelles Lernen einsetzen
Anomalieerkennung, Warenkorbanalyse und viele weitere Anwendungsfälle
Machine Learning: Modelle richtig trainieren

Tom Alby ist Chief Digital Transformation Officer bei dem Kreditversicherer »Euler Hermes« für Deutschland, Österreich und die Schweiz. Er unterrichtet Datenanalyse als Lehrbeauftragter an der Hochschule für Angewandte Wissenschaften Hamburg (HAW).



Materialien zum Buch ... 13


1. Einleitung ... 15


1.1 ... Warum dieses Buch? ... 15

1.2 ... Das Zeitalter der Daten -- alles nur ein Hype? ... 16

1.3 ... Warum nun Data Science? ... 17

1.4 ... Warum Data Science mit R? ... 19

1.5 ... Für wen ist dieses Buch? ... 20

1.6 ... Kann man Data Science ohne Mathe lernen? ... 20

1.7 ... Wie Sie dieses Buch verwenden können ... 22

1.8 ... Materialien und Kontakt ... 22

1.9 ... Danksagungen ... 22



2. Machine Learning, Data Science und künstliche Intelligenz ... 25


2.1 ... Aus der Geschichte lernen -- alles nur ein Hype? ... 25

2.2 ... Begriffsdefinitionen ... 34



3. Ablauf eines Data-Science-Projekts ... 39


3.1 ... Der allgemeine Ablauf eines Data-Science-Projekts ... 39

3.2 ... Business Understanding: Welches Problem soll gelöst werden? ... 43

3.3 ... Grundsätzliche Ansätze im Machine Learning ... 47

3.4 ... Performancemessung ... 49

3.5 ... Kommunikation mit Stakeholdern ... 57

3.6 ... Aus dem Labor in die Welt: Data-Science-Applikationen in Produktion ... 58

3.7 ... Die verschiedenen Rollen in einem Data-Science-Projekt ... 59



4. Einführung in R ... 67


4.1 ... R: kostenlos, portierbar und interaktiv ... 67

4.2 ... Installation und Konfiguration von R und RStudio ... 74

4.3 ... Erste Schritte mit R ... 89



5. Explorative Datenanalyse ... 111


5.1 ... Daten: Sammlung, Reinigung und Transformation ... 112

5.2 ... Notebooks ... 117

5.3 ... Das Tidyverse ... 123

5.4 ... Datenvisualisierung ... 137

5.5 ... Datenanalyse ... 148



6. Anwendungsfall Prognosen ... 159


6.1 ... Lineare Regression ... 159

6.2 ... Anomalie-Erkennung ... 176



7. Clustering ... 185


7.1 ... Hierarchisches Clustering ... 185

7.2 ... k-Means ... 197



8. Klassifikation ... 207


8.1 ... Anwendungsfälle für eine Klassifikation ... 207

8.2 ... Trainings- und Testdaten erstellen ... 209

8.3 ... Decision Trees ... 217

8.4 ... Support Vector Machines ... 221

8.5 ... Naive Bayes ... 226

8.6 ... XG Boost: Der Newcomer ... 232

8.7 ... Klassifikation von Text ... 238



9. Weitere Anwendungsfälle ... 245


9.1 ... Warenkorbanalyse -- Association Rules ... 245

9.2 ... k-nearest Neighbours ... 254



10. Workflows und Werkzeuge ... 267


10.1 ... Versionierung mit Git ... 267

10.2 ... Mit großen Datenmengen umgehen ... 277

10.3 ... Applikationen via API bereitstellen ... 287

10.4 ... Applikationen erstellen mit Shiny ... 292



11. Ethischer Umgang mit Daten und Algorithmen ... 307


11.1 ... Datenschutz ... 307

11.2 ... Ethik: Gegen Profiling und Diskriminierung ... 317



12. Was kommt nach diesem Buch? ... 325


12.1 ... Projekte, Projekte, Projekte ... 325

12.2 ... Wer hilft Ihnen jetzt weiter? ... 329

12.3 ... RSeek ... 335



Anhang ... 337


A ... Typische Fehlermeldungen und geeignete Lösungen ... 339

B ... Glossar ... 343

C ... Literatur ... 347



Index ... 353

»Oft scheitern die ersten Data Science-Versuche an den nötigen Mathematik- und Statistikkenntnissen. Das vorliegende Buch führt den Leser praxisorientiert und mit wohldosierter Theorie, minimaler Statistik und Mathematik an dieses komplexe Thema heran. Bevor es ins Detail geht, wird die Historie von Machine Learning, Data Science und KI sowie eine Begriffsdefinition dargestellt. Nach dem Aufzeigen von Best Practices zum erfolgreichen Managen eines Data-Science-Projekts führt die Reise von der Auswahl der Methoden hin zu den verschiedenen Rollen eines Data Scientist. Ein kurzer Crashkurs zu R bereitet den Leser auf die folgenden Praxiskapitel vor. Dank der gut durchdachten Beispiele und der klaren Struktur, die sich wie ein roter Faden durch das gesamte Werk zieht, erreicht man schnell Lernerfolge. Die nötigen Statistik- und Mathematikkenntnisse werden nebenher auf einem einfachen Level vermittelt. Der Schreibstil ist angenehm und es macht Spaß, die Kapitel durchzuarbeiten. Man merkt dem Autor seine Erfahrung im Thema und auch im Vermitteln von Inhalten an. Zahlreiche Abbildungen und Hinweisboxen unterstützen beim Verstehen der Inhalte.« iX - Magazin für professionelle Informationstechnik 202212

»Vor allem für diejenigen, die sich ohne vorher absolvierten Mathe-Leistungskurs an das Thema Data Science heranwagen wollen.«

Erscheinungsdatum
Verlagsort Bonn
Sprache deutsch
Maße 172 x 230 mm
Einbandart kartoniert
Themenwelt Informatik Datenbanken Data Warehouse / Data Mining
Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
Mathematik / Informatik Informatik Software Entwicklung
Informatik Theorie / Studium Künstliche Intelligenz / Robotik
Informatik Theorie / Studium Theoretische Informatik
Schlagworte Analyse-Methoden • buch bücher • Data Science • Data-Science-Verfahren • Daten aufbereiten • Datenaufbereitung • IT-Ausbildung • k-Means Cluster • Künstliche Intelligenz KI • Lernen Üben Workshops Kurse Seminare Tutorials • Modelle trainieren • Regression • R RStudio • Statistik
ISBN-10 3-8362-8462-6 / 3836284626
ISBN-13 978-3-8362-8462-2 / 9783836284622
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich