Einstieg in Data Science mit R - Benjamin Matuzak

Einstieg in Data Science mit R

Datenanalyse und Statistik ohne Vorkenntnisse
Buch | Softcover
263 Seiten
2020 | 1. Auflage
Rheinwerk (Verlag)
978-3-8362-7892-8 (ISBN)
29,90 inkl. MwSt
  • Datenanalyse für Quereinsteiger ohne Vorkenntnisse
  • Mit allen Grundlagen: Datenanalyse, Programmierung, Statistik
  • Von der Installation bis zur Visualisierung Ihrer Ergebnisse

Datenanalyse ist überall angekommen – seien auch Sie dabei!

Quereinsteiger wie Historiker oder Germanisten, die mit quantitativen Methoden beginnen möchten, sind bei diesem Buch richtig, ob für die Forschung oder im Unternehmen. Sie bekommen alles an die Hand, was Sie zum Loslegen brauchen. Lassen Sie Excel-Tabellen hinter sich und lernen Sie, wie Sie statistische Analysen mit R programmieren. Auch die mathematischen Grundlagen lernen Sie kennen, von den Mittelwerten bis zur linearen Regression. Nach der Lektüre sind Sie in der Lage, ein eigenes Projekt mit ausgewählten statistischen Methoden durchzuführen und Ihre Ergebnisse zu visualisieren.

Die Installation: R und R Studio
Tabellenkalkulation adé! Mit R und R Studio nehmen Sie die geeigneten Werkzeuge in die Hand. Lernen Sie, für die Datenanalyse zu programmieren. Zahlreiche Screenshots und Hinweise auf Fallstricke helfen Ihnen von Anfang an.

Gewusst wie: Statistik
Dieses Buch nimmt Sie auch in Sachen Statistik an die Hand. Mit etwas Schulmathematik im Gepäck lernen Sie Schritt für Schritt die wichtigsten Methoden kennen, um aus Daten gültige Schlüsse zu ziehen. Von den Mittelwerten bis zur Regressionsanalyse.

Gut vorbereitet: die Daten
Vor jeder Analyse geht es um die Bereitstellung und richtige Aufbereitung von Daten. Lernen Sie, wie Sie Daten z.B. aus Excel oder dem csv-Format einlesen und wie Sie mit Datumswerten, fehlenden Angaben und anderen Besonderheiten umgehen.

Für Sie: Beispiele und Anleitungen
Die Praxisbeispiele sind so gewählt, dass Sie sie unabhängig von Ihrer Fachrichtung nachvollziehen können. Vom Zigarettenkonsum bis zur Wohlstandsentwicklung, immer samt Visualisierung.

Aus dem Inhalt:
Installation
Programmieren für Quereinsteiger
Daten verschiedener Formate laden
Daten bereinigen
Mit fehlenden Werten umgehen
Wachstumsberechnungen
Mittelwerte
Lineare Regression
R Studio
Einstieg in die Programmiersprache R

Benjamin Matuzak ist Data Scientist am Max-Planck-Institut für Ethnologische Forschung in Halle. Als Wirtschaftshistoriker ist er selbst Quereinsteiger und kennt die Stolpersteine auf dem Weg zur quantitativen Arbeit noch aus eigener Anschauung. Mit diesem Buch zeigt er Geisteswissenschaftlern, Journalisten und der kritischen Öffentlichkeit, wie sie Schritt für Schritt in die Datenanalyse einsteigen können, dabei Excel hinter sich lassen und die Programmiersprache R lernen und einsetzen.



  Materialien zum Buch ... 11


  1.  Über dieses Buch ... 13


       1.1 ... Für wen ist dieses Buch? Für Sie? ... 13

       1.2 ... Was sind die Ziele, was können Sie hier lernen? ... 13

       1.3 ... Was Sie nicht lernen werden ... 15

       1.4 ... Wie Sie mit diesem Buch arbeiten ... 17



  2.  Einführung ... 19


       2.1 ... Statistik und Data Science im Vergleich ... 21

       2.2 ... Was ist R, und warum sollten Sie das überhaupt lernen? ... 23



  3.  R Base und RStudio: Installation und erste Schritte ... 25


       3.1 ... R Base ... 25

       3.2 ... RStudio ... 29

       3.3 ... Wie sieht die Oberfläche aus, und was bedeuten die einzelnen Bereiche? ... 31

       3.4 ... Die R-Konsole ... 33

       3.5 ... Mein erstes Skript ... 35

       3.6 ... Hilfe! ... 42



  4.  Die Programmiersprache R ... 51


       4.1 ... Objekte ... 51

       4.2 ... Funktionen ... 52

       4.3 ... Pakete (Packages) ... 53

       4.4 ... Ein paar Vokabeln ... 61

       4.5 ... Kommentare ... 68

       4.6 ... Groß- und Kleinschreibung und andere Syntaxregeln ... 68

       4.7 ... Computer sind dumm ... 71



  5.  Grundlagen der statistischen Datenanalyse ... 73


       5.1 ... Fragestellung und Studiendesign ... 73

       5.2 ... Von Daten und Datensätzen ... 74

       5.3 ... Berechnung des Durchschnittswertes (Mittelwert, arithmetisches Mittel) ... 84

       5.4 ... Wachstumsberechnung (Veränderungsberechnung) ... 84

       5.5 ... Trend und lineare Regression ... 86

       5.6 ... Beispieldatensatz »Zigarettenverbrauch« ... 88



  6.  Daten einlesen und für die Analyse vorbereiten ... 93


       6.1 ... Daten aus Excel einlesen ... 93

       6.2 ... Daten im .csv-Format einlesen ... 98

       6.3 ... Umgang mit Datumsangaben ... 102

       6.4 ... Daten vorbereiten ... 109

       6.5 ... Not available! - Der Umgang mit fehlenden Werten ... 122



  7.  Daten analysieren mit einfacher Statistik ... 129


       7.1 ... Beispiel 1: Zigarettenkonsum ... 129

       7.2 ... Beispiel 2: 100 Jahre Wohlstandsentwicklungen in Indien ... 144

       7.3 ... Visualisierung ... 166



  8.  Umfassendes Praxisbeispiel ... 187


       8.1 ... Fragestellung: Was will ich wissen? ... 188

       8.2 ... Datenbeschaffung ... 189

       8.3 ... Daten laden und Überblick verschaffen ... 191

       8.4 ... Daten vorbereiten und bereinigen ... 195

       8.5 ... Verarbeitung der Daten im Dreiklang ... 196

       8.6 ... Kommunikation ... 219

       8.7 ... Dokumentation ... 219

       8.8 ... Bonus: Folgeanalyse in der Zeitreihe: Krankheitstage ... 219



  9.  Abschluss ... 233


  A.  Datenmaterial ... 235


       A.1 ... Zigaretten 1 ... 235

       A.2 ... Zensus Länder ... 236

       A.3 ... Luftqualität ... 237

       A.4 ... Zigaretten 2 ... 243

       A.5 ... Indien 1990-2000 ... 244

       A.6 ... Personaldaten ... 245

       A.7 ... Personaldaten - Erweitert ... 252



  Index ... 261

»Man muss nicht in Data Science quer einsteigen wollen, um von den Inhalten echten Nutzen für den Online-Job ziehen zu können. Klare Kaufempfehlung. (Mario Fischer)« Website Boosting 202105

»Man muss nicht in Data Science quer einsteigen wollen, um von den Inhalten echten Nutzen für den Online-Job ziehen zu können. Klare Kaufempfehlung. (Mario Fischer)«

»Ideal für jene, die sich bisher die Auseinandersetzung mit R erspart haben. Mit einer Länge von nur ca. 250 Seiten handelt es sich dabei um ein bequem lesbares Werk, das auch mal nebenbei durchgeackert werden kann.«

»Das Buch ermöglicht einen leichten Einstieg in Data Science. Als Vorwissen benötigt man lediglich Grundkenntnisse in Mathematik, die man schon in der Schule erworben hat.«

»Das Buch befähigt den Leser zu seinen ersten Schritten mit R.«

Erscheinungsdatum
Reihe/Serie Rheinwerk Computing
Verlagsort Bonn
Sprache deutsch
Maße 172 x 230 mm
Einbandart kartoniert
Themenwelt Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
Mathematik / Informatik Informatik Theorie / Studium
Schlagworte Data Science • Daten-Analyse • Excel • Hand-Buch Bücher lernen Grundlagen Kurse Tipps Wor • Hand-Buch Bücher lernen Grundlagen Kurse Tipps Workshops Tutorial Wissen Anleitung Training • Lineare Regression • Median • Programmieren lernen • R programmieren • R-Programmierung • R Studio • Spread-Sheet • Statistik • Studium Ausbildung Beruf • Varianz
ISBN-10 3-8362-7892-8 / 3836278928
ISBN-13 978-3-8362-7892-8 / 9783836278928
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich