R kompakt

Der schnelle Einstieg in die Datenanalyse
Buch | Softcover
XV, 251 Seiten
2021 | 3. Auflage
Springer Berlin (Verlag)
978-3-662-63074-7 (ISBN)

Lese- und Medienproben

R kompakt - Daniel Wollschläger
39,99 inkl. MwSt
  • Ermöglicht einen schnellen Einstieg in R
  • Aktualisierte Verweise auf Erweiterungen durch Zusatzpakete?
  • Ausführliche Behandlung von Diagrammen
  • Umsetzung der wichtigsten statistischen Verfahren in den Human- und Sozialwissenschaften

Dieses Buch bietet eine kompakte Einführung in die Datenauswertung mit der freien Statistikumgebung R. Ziel ist es dabei, einen Überblick über die Funktionalität von R zu liefern und einen schnellen Einstieg in die deskriptive Datenauswertung sowie in die Umsetzung der wichtigsten statistischen Tests zu ermöglichen.

Zudem deckt das Buch die vielfältigen Möglichkeiten ab, Diagramme zu erstellen, Daten mit anderen Programmen auszutauschen und R durch Zusatzpakete zu erweitern. Das Buch ist damit für Leser geeignet, die R kennenlernen und rasch in konkreten Aufgabenstellungen einsetzen möchten.

Für die 3. Auflage wurde das Buch grundlegend überarbeitet und auf Neuerungen der R Version 4.1.0 sowie der aktuellen Landschaft der Zusatzpakete abgestimmt. Mit einer stärkeren Ausrichtung auf Data Science Anwendungen stellt das Buch nun ausführlich die Pakete dplyr zur Datenaufbereitung und ggplot2 für Diagramme vor.

Darüber hinaus enthält das Buch eine Darstellung von dynamischen R Markdown Dokumenten zur Unterstützung reproduzierbarer Auswertungen.

PD Dr. Daniel Wollschläger lehrte viele Jahre am Institut für Psychologie der Christian-Albrechts-Universität zu Kiel und ist nun am Institut für Medizinische Biometrie, Epidemiologie und Informatik der Universitätsmedizin der Johannes Gutenberg-Universität Mainz tätig.

1 Erste Schritte
1.1 Vorstellung
1.1.1 Pro und Contra R
1.1.2 Typografische Konventionen
1.1.3 R installieren
1.1.4 Grafische Benutzeroberflächen
1.1.5 Weiterführende Informationsquellen und Literatur
1.2 Grundlegende Elemente
1.2.1 R Starten, beenden und die Konsole verwenden
1.2.2 Befehlssequenzen im Editor bearbeiten
1.2.3 Einstellungen vornehmen
1.2.4 Umgang mit dem Workspace
1.2.5 Einfache Arithmetik
1.2.6 Funktionen mit Argumenten aufrufen
1.2.7 Hilfe-Funktionen
1.2.8 Zusatzpakete verwenden
1.2.9 Hinweise zum Arbeiten mit Zusatzpaketen
1.2.10 Empfehlungen und typische Fehlerquellen
1.3 Datenstrukturen: Klassen, Objekte, Datentypen
1.3.1 Objekte benennen
1.3.2 Zuweisungen an Objekte
1.3.3 Objekte ausgeben
1.3.4 Objekte anzeigen lassen und entfernen
1.3.5 Datentypen
1.3.6 Logische Werte, Operatoren und Verknüpfungen
2 Daten importieren und exportieren
2.1 Daten im Textformat lesen und schreiben
2.2 R-Objekte speichern und laden
2.3 Daten mit anderen Programmen austauschen
2.3.1 Programme zur Tabellenkalkulation
2.3.2 SPSS, Stata und SAS
2.3.3 Datenbanken
3 Elementare Datenverarbeitung
3.1 Vektoren
3.1.1 Vektoren erzeugen
3.1.2 Elemente auswählen und verändern
3.1.3 Datentypen in Vektoren
3.1.4 Elemente benennen
3 Inhaltsverzeichnis
3.2 Logische Operatoren
3.2.1 Logischer Vergleich von Vektoren
3.2.2 Logische Indexvektoren
3.3 Systematische und zufällige Wertefolgen erzeugen
3.3.1 Numerische Sequenzen erstellen
3.3.2 Wertefolgen wiederholen
3.3.3 Zufällig aus einer Urne ziehen
3.3.4 Zufallszahlen aus bestimmten Verteilungen erzeugen
3.4 Daten transformieren
3.4.1 Werte sortieren
3.4.2 Werte in zufällige Reihenfolge bringen
3.4.3 Teilmengen von Daten auswählen
3.4.4 Daten umrechnen
3.4.5 Neue aus bestehenden Variablen bilden
3.4.6 Werte ersetzen oder recodieren
3.4.7 Kontinuierliche Variablen in Kategorien einteilen
3.5 Gruppierungsfaktoren
3.5.1 Ungeordnete Faktoren
3.5.2 Faktorstufen nachträglich ändern
3.5.3 Geordnete Faktoren
3.5.4 Reihenfolge von Faktorstufen
3.5.5 Faktoren nach Muster erstellen
3.5.6 Quantitative in kategoriale Variablen umwandeln
3.6 Deskriptive Kennwerte numerischer Daten
3.6.1 Summen, Differenzen und Produkte
3.6.2 Extremwerte
3.6.3 Mittelwert, Median und Modalwert
3.6.4 Prozentrang, Quartile und Quantile
3.6.5 Varianz, Streuung, Schiefe und Wölbung
3.6.6 Kovarianz und Korrelation
3.6.7 Kennwerte getrennt nach Gruppen berechnen
3.7 Matrizen
3.7.1 Dimensionierung, Zeilen und Spalten
3.7.2 Elemente auswählen und verändern
3.7.3 Matrizen verbinden
3.7.4 Matrizen sortieren
3.7.5 Randkennwerte berechnen
3.7.6 Kovarianz- und Korrelationsmatrizen
3.8 Datensätze
3.8.1 Datentypen in Datensätzen
3.8.2 Elemente auswählen und verändern
3.8.3 Namen von Variablen und Beobachtungen
3.8.4 Datensätze in den Suchpfad einfügen
3.9 Listen
3.9.1 Komponenten auswählen und verändern
3.9.2 Komponenten hinzufügen und entfernen
4 Inhaltsverzeichnis
3.10 Häufigkeiten bestimmen
3.10.1 Einfache Tabellen absoluter und relativer Häufigkeiten
3.10.2 Absolute, relative und bedingte relative Häufigkeiten in Kreuztabellen
3.10.3 Randkennwerte von Kreuztabellen
3.11 Codierung, Identifikation und Behandlung fehlender Werte
3.11.1 Fehlende Werte codieren und ihr Vorhandensein prüfen
3.11.2 Fehlende Werte ersetzen und umcodieren
3.11.3 Behandlung fehlender Werte bei der Berechnung einfacher Kennwerte
3.11.4 Behandlung fehlender Werte in Matrizen
3.11.5 Behandlung fehlender Werte beim Sortieren von Daten
3.11.6 Behandlung fehlender Werte in inferenzstatistischen Tests
3.12 Zeichenketten verarbeiten
3.12.1 Zeichenketten erstellen und ausgeben
3.12.2 Zeichenketten manipulieren
3.12.3 Zeichenfolgen finden
3.12.4 Zeichenfolgen ersetzen
3.13 Datum und Uhrzeit
3.13.1 Datumsangaben erstellen und formatieren
3.13.2 Uhrzeit
3.13.3 Berechnungen mit Datum und Uhrzeit
4 Datensätze aufbereiten und aggregieren mit dplyr
4.1 Besonderheiten
4.2 Variablen umbenennen
4.3 Teilmengen von Daten auswählen
4.3.1 Variablen auswählen
4.3.2 Beobachtungen auswählen
4.4 Variablen entfernen, hinzufügen und transformieren
4.5 Doppelte und fehlende Werte behandeln
4.6 Datensätze sortieren
4.7 Datensätze zeilen- oder spaltenweise verbinden
4.8 Datensätze zusammenführen
4.9 Organisationsform von Datensätzen ändern
4.10 Datensätze getrennt nach Gruppen auswerten und aggregieren
4.11 Häufigkeiten bestimmen
5 R-Dokumente und Notebooks erstellen
5.1 Grundprinzip
5.2 Arbeitsschritte
5.3 Aufbau eines Quelldokuments
5.4 Beispiel
6 Hilfsmittel für die Inferenzstatistik
6.1 Lineare Modelle formulieren
6.2 Funktionen von Zufallsvariablen
6.2.1 Dichtefunktionen
6.2.2 Verteilungsfunktionenv Inhaltsverzeichnis
6.2.3 Quantilfunktionen
6.3 Gemeinsamer Datensatz für alle Auswertungen
7 Lineare Regression
7.1 Test des Korrelationskoeffizienten
7.2 Einfache lineare Regression
7.2.1 Deskriptive Modellanpassung
7.2.2 Regressionsanalyse
7.3 Multiple lineare Regression
7.3.1 Deskriptive Modellanpassung und Regressionsanalyse
7.3.2 Modelle vergleichen
7.4 Erweiterungen der linearen Regression
7.5 Regressionsmodelle auf andere Daten anwenden
7.6 Kreuzvalidierung von Regressionsmodellen
7.7 Regressionsdiagnostik
7.7.1 Extremwerte, Ausreißer und Einfluss
7.7.2 Verteilungseigenschaften der Residuen
7.7.3 Multikollinearität
7.8 Partialkorrelation und Semipartialkorrelation
7.9 Logistische Regression
7.9.1 Modellanpassung für dichotome Daten
7.9.2 Anpassungsgüte
7.9.3 Vorhersage, Klassifikation und Anwendung auf neue Daten
7.9.4 Signifikanztests für Parameter und Modell
8 t-Tests und Varianzanalysen
8.1 Tests auf Normalverteilung
8.2 Levene-Test auf Varianzhomogenität
8.3 t-Tests
8.3.1 t-Test für eine Stichprobe
8.3.2 t-Test für zwei unabhängige Stichproben
8.3.3 t-Test für zwei abhängige Stichproben
8.4 Einfaktorielle Varianzanalyse
8.4.1 Auswertung mit aov()
8.4.2 Auswertung mit anova()
8.4.3 Grafische Prüfung der Voraussetzungen
8.4.4 Paarvergleiche mit t-Tests und α-Adjustierung
8.4.5 Simultane Konfidenzintervalle nach Tukey
8.5 Einfaktorielle Varianzanalyse mit abhängigen Gruppen
8.5.1 Univariat formulierte Auswertung
8.5.2 Multivariat formulierte Auswertung
8.6 Zweifaktorielle Varianzanalyse
8.6.1 Auswertung
8.6.2 Quadratsummen vom Typ I,
II und
III8.7 Zweifaktorielle Varianzanalyse mit zwei Intra-Gruppen Faktoren
8.7.1 Univariat formulierte Auswertung
8.7.2 Multivariat formulierte Auswertungvi Inhaltsverzeichnis
8.8 Zweifaktorielle Varianzanalyse mit Split-Plot-Design
8.8.1 Univariat formulierte Auswertung
8.8.2 Multivariat formulierte Auswertung
8.9 Kovarianzanalyse
9 Nonparametrische Methoden
9.1 Häufigkeiten kategorialer Variablen analysieren
9.1.1 Binomialtest
9.1.2 χ2-Test auf eine feste Verteilung
9.1.3 χ2-Test auf Unabhängigkeit
9.1.4 χ2-Test für mehrere Auftretenswahrscheinlichkeiten
9.1.5 Fishers exakter Test auf Unabhängigkeit
9.1.6 Kennwerte von (
2 × 2)-Konfusionsmatrizen
9.1.7 ROC-Kurve und AU
C9.2 Maße für Zusammenhang und Übereinstimmung
9.2.1 Spearmans ρ und Kendalls τ
9.2.2 Zusammenhang kategorialer Variablen
9.2.3 Inter-Rater-Übereinstimmung
9.3 Tests auf Übereinstimmung von Verteilungen
9.3.1 Wilcoxon-Vorzeichen-Rang-Test
9.3.2 Wilcoxon-Rangsummen-Test / Mann-Whitney-U-Test
9.3.3 Kruskal-Wallis-H-Test
9.3.4 Friedman-Test
10 Multivariate Verfahren
10.1 Hauptkomponentenanalyse
10.2 Faktorenanalyse
10.3 Multivariate multiple Regression
10.4 Hotellings T
210.4.1 Test für eine Stichprobe
10.4.2 Test für zwei Stichproben
10.5 Multivariate Varianzanalyse
11 Diagramme mit ggplot
2 erstellen
11.1 Grundprinzip
11.1.1 Grundschicht
11.1.2 Diagramme speichern
11.2 Diagrammtypen
11.2.1 Punkt-, Streu- und Liniendiagramme
11.2.2 Säulendiagramm
11.2.3 Histogramm
11.2.4 Boxplot
11.2.5 Quantil-Quantil-Diagramm
11.3 Bedingte Diagramme in Panels darstellen
11.4 Diagrammelemente hinzufügen
11.5 Diagramme formatieren
11.5.1 Elementposition kontrollierenvii Inhaltsverzeichnis
11.5.2 Achsen anpassen
11.5.3 Legende ändern
11.5.4 Farben, Datenpunktsymbole und Linientypen
11.5.5 Aussehen im Detail verändern
12 R als Programmiersprache
12.1 Kontrollstrukturen
12.1.1 Fallunterscheidungen
12.1.2 Schleifen
12.2 Eigene Funktionen erstellen
12.2.1 Funktionskopf und Funktionsrumpf
12.2.2 Rückgabewert
12.2.3 Generische Funktionen
12.2.4 Funktionen analysieren
12.2.5 Effizienz von Auswertungen steigernLiteraturverzeichnis

Erscheinungsdatum
Zusatzinfo XV, 251 S. 30 Abb., 21 Abb. in Farbe.
Verlagsort Berlin
Sprache deutsch
Maße 168 x 240 mm
Gewicht 459 g
Einbandart kartoniert
Themenwelt Mathematik / Informatik Mathematik Computerprogramme / Computeralgebra
Mathematik / Informatik Mathematik Wahrscheinlichkeit / Kombinatorik
Sozialwissenschaften Soziologie Empirische Sozialforschung
Schlagworte Daten • Datenanalyse • Datenauswertung • Inferenz • Inferenzstatistik • R • Statistik
ISBN-10 3-662-63074-5 / 3662630745
ISBN-13 978-3-662-63074-7 / 9783662630747
Zustand Neuware
Informationen gemäß Produktsicherheitsverordnung (GPSR)
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich