Einstieg in Data Science mit R (eBook)
263 Seiten
Rheinwerk Computing (Verlag)
978-3-8362-7894-2 (ISBN)
Datenanalyse ist überall angekommen - seien auch Sie dabei! Quereinsteiger wie Historiker oder Germanisten, die mit quantitativen Methoden beginnen möchten, sind bei diesem Buch richtig, ob für die Forschung oder im Unternehmen.
Sie bekommen alles an die Hand, was Sie zum Loslegen brauchen. Lassen Sie Excel-Tabellen hinter sich und lernen Sie, wie Sie statistische Analysen mit R programmieren. Auch die mathematischen Grundlagen lernen Sie kennen, von den Mittelwerten bis zur linearen Regression. Nach der Lektüre sind Sie in der Lage, ein eigenes Projekt mit ausgewählten statistischen Methoden durchzuführen und Ihre Ergebnisse zu visualisieren.
Aus dem Inhalt:
- Installation
- Programmieren für Quereinsteiger
- Daten verschiedener Formate laden
- Daten bereinigen
- Mit fehlenden Werten umgehen
- Wachstumsberechnungen
- Mittelwerte
- Lineare Regression
- R Studio
- Einstieg in die Programmiersprache R
3.6 Hilfe!
Am Anfang ist es schwierig, mit den vielen Möglichkeiten, die R bietet, umzugehen. Seien Sie sich deshalb schon zu Beginn zweier Punkte bewusst:
-
Es gibt keine vorgegebene Herangehensweise, wie Sie Ihre Fragestellungen lösen. In R gibt es in der Regel immer mehrere Möglichkeiten, ein Ziel zu erreichen. Wenn die eine nicht funktioniert, dann probieren Sie doch einfach mal die andere.
-
Es gibt Hilfe. 99 % Ihrer Probleme hatten bereits andere vor Ihnen. Und die entsprechenden Lösungen sind im Netz auffindbar.
3.6.1 R-eigene Hilfe
R hat zu allen Paketen und Funktionen, die im Programm verwendet werden können, R‐eigene Dokumentationen. Die finden Sie immer im Fenster rechts unten unter dem Reiter Help.
Abbildung 3.21 Hilfe-Fenster
Wenn ich bspw. nach der Funktion help suche, erscheint die Dokumentation dieser Funktion.
Abbildung 3.22 R-eigene Hilfe
Die Dokumentationen für andere Funktionen und auch für in Paketen mitgelieferte Datensätze, die Sie hier suchen, sind immer im gleichen Stil aufgebaut.
Die erste Zeile zeigt an, was in der Hilfe gesucht wurde:
Die nächste Zeile, in großer Schrift und fett hervorgehoben, beschreibt die Hauptfunktion, die die von Ihnen gesuchte Funktion ausübt. In diesem Fall steht dort Documentation, da die Hilfe-Funktion »help« der Dokumentation dient. Gleich darunter erfahren Sie im Abschnitt Description (Beschreibung), was das genau bedeutet, und unter Usage (Gebrauch) finden Sie die Syntax der Funktion.
Die Funktion help() wird also mit help aufgerufen. Zwei runde Klammern schließen die Argumente, die die Funktionen erhalten kann, in ihr ein:
verbose = getOption("verbose"),
try.all.packages = getOption("help.try.all.packages"),
help_type = getOption("help_type"))
Unter Arguments werden nun die Argumente, die die Funktion von Ihnen zugewiesen bekommen kann oder nicht, genauer beschrieben. Das erste Argument der help-Funktion ist topic, also das Thema, mit dem geholfen werden soll.
Wem die englische Beschreibung nicht hilft, der kann es mit dem Google Translator versuchen. Für den ersten Parameter, topic, habe ich folgende Übersetzung erhalten:
In der Regel ein Name oder eine Zeichenfolge, die das Thema angibt, für das nach Hilfe gesucht wird. Eine Zeichenkette (eingeschlossen in expliziten einfachen oder doppelten Anführungszeichen) wird immer als Benennung eines Themas verwendet.
Wenn der Wert von topic ein Zeichenvektor der Länge 1 ist, wird als Topic der Wert des einzigen Elements angenommen. Andernfalls muss das Thema ein Name oder ein reserviertes Wort (sofern syntaktisch gültig) oder eine Zeichenfolge sein.
Unter "Details" erfahren Sie, was passiert, wenn dies weggelassen wird.
Das ist nicht fehlerfrei, reicht aber aus, um zu verstehen, dass an der Stelle, wo das Argument topic steht, der Name des von Ihnen gesuchten Begriffes stehen muss. Das erfahren Sie sogar gleich im ersten Satz.
Zu package sagt die Übersetzung, dass Sie hier das Paket benennen können: können, nicht müssen. Das package = NULL gibt an, dass in der Voreinstellung kein spezielles Paket nach topic durchsucht wird, sondern RBase. Sollten Sie nach einer Funktion in einem bestimmten Paket suchen, geben Sie das Paket an.
Die nächsten Eintragungen in der Auflistung zu help sind ebenfalls Argumente, die Sie der Funktion hinzufügen können oder nicht.
Unter Details erscheint nun die technische Beschreibung des Umgangs mit der Funktion, z. B. bezüglich bestimmter Besonderheiten verschiedener Betriebssysteme. Das ist aber für den Informatiker interessanter als für den R-Einsteiger.
Die dann folgenden Unterpunkte (hier Offline help, Note, References und See also) sind weitere manchmal sehr nützliche, manchmal weniger nützliche zusätzliche Infos.
Für den Einsteiger unverzichtbar ist jedenfalls die immer letzte Überschrift: Examples. Hier werden funktionierende Beispiele der Anwendung der Funktion gezeigt, die Sie in der Regel durch einfaches Kopieren und Einfügen in Ihr Skript nachbilden können. Im Fall von »help« finden Sie dort z. B.:
help(lapply)
Listing 3.4 Beispiel für die Verwendung von »help« in der Onlinehilfe
Probieren Sie es aus. Schreiben Sie help in Ihre Konsole, und drücken Sie auf (¢). Sofort öffnet sich die Dokumentation im Hilfe-Fenster.
3.6.2 Hilfe aus der riesigen R-Community
Vor allem am Anfang aber kann die sehr technische Beschreibung der R-eigenen Dokumentationen der Funktionen, Pakete und Datensätze für R-Anfänger kompliziert erscheinen. Abhilfe schafft die riesige frei zugängliche (open access-)R-Nutzergemeinschaft (Community).
Stack Overflow
Stack Overflow ist eine Frage-und-Antwort-Plattform zum Thema Programmierung. Sie ist zwar auf Englisch, aber mit Ihrem RStudio, das Sie auf Englisch installiert haben, kommen ja auch die Fehlermeldungen auf Englisch. Nach denen können Sie dann hier suchen und z. B. Ausschau nach Code oder Codeschnipseln halten, die Ihnen weiterhelfen. Über zehn Millionen Nutzer sind hier bereits registriert. Sie erreichen Stack Overflow auf der Webseite www.stackoverflow.com.
Abbildung 3.23 Stack-Overflow-Webseite
Um Fragen zu stellen und Antworten zu bekommen, müssen Sie sich registrieren.
Abbildung 3.24 Registrierung bei Stack Overflow
Sind Sie einmal registriert, können Sie mit dem Fragenstellen beginnen.
Abbildung 3.25 Fragen stellen 1
Abbildung 3.26 Fragen stellen 2
Achten Sie dabei unbedingt darauf, dass Sie die Formalien der Seite bei Ihren Fragestellungen einhalten. Das ist sehr wichtig, denn Fragen zu stellen ist auf Stack Overflow kein Recht, sondern ein Privileg, und die Beantwortung der Fragen ist ein Gefallen, der Ihnen von der Nutzergemeinschaft getan wird. Nutzen Sie zum Verständnis der Vorgaben im Zweifel wieder den Google Translator, und sehen Sie sich bereits gestellte Fragen an.
Meistens aber werden Sie vor allem beim Einstieg in R Probleme haben, die andere schon hatten und die auf Stack Overflow so oder so ähnlich bereits gelöst wurden. Suchen Sie zur Probe das Thema »Package«. Da Ihr Thema ein R-Thema ist, fügen Sie das auch in die Suchoption mit ein. Wenn Sie also R package suchen, schlägt Ihnen Stack Overflow bereits einige beantwortete Fragen und gelöste Probleme vor.
Abbildung 3.27 Fragenpräsenz überprüfen
YouTube
Mittlerweile ein Klassiker sind entweder kleinere Vorträge zu bestimmten Themen auf YouTube oder ganze Vorlesungen zu allen Themen. Die Webseite von YouTube ist www.youtube.com. Suchen Sie hier nach einem Video, das Ihr Problem behandelt, auch auf Deutsch! Meist finden Sie jemanden, der Ihr Problem dort gelöst hat oder z. B. einen Grundlagenkurs in R gibt (z. B. http://r-wrk.de/youtubewessel). Geplant ist auch von mir ein Vortrag zu diesem Buch und der hiesigen Einführung. Suchen Sie doch auf youtube.com einfach mal nach mir – »Benjamin Matuzak« oder genauer nach der »Einführung in die Data Science mit R für Quereinsteiger und Anfänger auf Deutsch« (z. B.: http://r-wrk.de/einfuehrung.
Weitere Hilfe
Neben Stack Overflow gibt es weitere nützliche Seiten, so z. B. CRAN und GitHub.
CRAN
Das Comprehensive R Archive Network (CRAN) ist unter der Webseite http://r-wrk.de/cran zu erreichen. CRAN ist ein Netzwerk von FTP-(Dateiübertragungsprotokoll-)Servern und Webservern auf der ganzen Welt, auf denen identische, aktuelle Versionen von Code und Dokumentation für R gespeichert und verfügbar sind. CRAN haben Sie während der Installation des Programms bereits kennengelernt.
Zudem gibt es hier eine Reihe von »Bedienungsanleitungen« für R (Manuals). Die sind aber...
Erscheint lt. Verlag | 28.11.2020 |
---|---|
Sprache | deutsch |
Themenwelt | Mathematik / Informatik ► Informatik ► Datenbanken |
Mathematik / Informatik ► Informatik ► Programmiersprachen / -werkzeuge | |
ISBN-10 | 3-8362-7894-4 / 3836278944 |
ISBN-13 | 978-3-8362-7894-2 / 9783836278942 |
Haben Sie eine Frage zum Produkt? |
Größe: 9,0 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich