Introduction to Data Science (eBook)

eBook Download: PDF
2017 | 1., First Edition
288 Seiten
Sage Publications (Verlag)
978-1-5063-7754-4 (ISBN)

Lese- und Medienproben

Introduction to Data Science -  Jeffrey S. Saltz,  Jeffrey M. Stanton
Systemvoraussetzungen
77,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
An Introduction to Data Science is an easy-to-read, gentle introduction for advanced undergraduate, certificate, and graduate students coming from a wide range of backgrounds into the world of data science. After introducing the basic concepts of data science, the book builds on these foundations to explain data science techniques using the R programming language and RStudio(R) from the ground up. Short chapters allow instructors to group concepts together for a semester course and provide students with manageable amounts of information for each concept. By taking students systematically through the R programming environment, the book takes the fear out of data science and familiarizes students with the environment so they can be successful when performing advanced functions. The authors cover statistics from a conceptual standpoint, focusing on how to use and interpret statistics, rather than the math behind the statistics. This text then demonstrates how to use data effectively and efficiently to construct models, predict outcomes, visualize data, and make decisions. Accompanying digital resources provide code and datasets for instructors and learners to perform a wide range of data science tasks.

Preface
About the Authors
Introduction: Data Science, Many Skills
What Is Data Science?
The Steps in Doing Data Science
The Skills Needed to Do Data Science
Chapter 1 • About Data
Storing Data—Using Bits and Bytes
Combining Bytes Into Larger Structures
Creating a Data Set in R
Chapter 2 • Identifying Data Problems
Talking to Subject Matter Experts
Looking for the Exception
Exploring Risk and Uncertainty
Chapter 3 • Getting Started With R
Installing R
Using R
Creating and Using Vectors
Chapter 4 • Follow the Data
Understand Existing Data Sources
Exploring Data Models
Chapter 5 • Rows and Columns
Creating Dataframes
Exploring Dataframes
Accessing Columns in a Dataframe
Chapter 6 • Data Munging
Reading a CSV Text File
Removing Rows and Columns
Renaming Rows and Columns
Cleaning Up the Elements
Sorting Dataframes
Chapter 7 • Onward With RStudio®
Using an Integrated Development Environment
Installing RStudio
Creating R Scripts
Chapter 8 • What’s My Function?
Why Create and Use Functions?
Creating Functions in R
Testing Functions
Installing a Package to Access a Function
Chapter 9 • Beer, Farms, and Peas and the Use of Statistics
Historical Perspective
Sampling a Population
Understanding Descriptive Statistics
Using Descriptive Statistics
Using Histograms to Understand a Distribution
Normal Distributions
Chapter 10 • Sample in a Jar
Sampling in R
Repeating Our Sampling
Law of Large Numbers and the Central Limit Theorem
Comparing Two Samples
Chapter 11 • Storage Wars
Importing Data Using RStudio
Accessing Excel Data
Accessing a Database
Comparing SQL and R for Accessing a Data Set
Accessing JSON Data
Chapter 12 • Pictures Versus Numbers
A Visualization Overview
Basic Plots in R
Using ggplot2
More Advanced ggplot2 Visualizations
Chapter 13 • Map Mashup
Creating Map Visualizations With ggplot2
Showing Points on a Map
A Map Visualization Example
Chapter 14 • Word Perfect
Reading in Text Files
Using the Text Mining Package
Creating Word Clouds
Chapter 15 • Happy Words?
Sentiment Analysis
Other Uses of Text Mining
Chapter 16 • Lining Up Our Models
What Is a Model?
Linear Modeling
An Example—Car Maintenance
Chapter 17 • Hi Ho, Hi Ho—Data Mining We Go
Data Mining Overview
Association Rules Data
Association Rules Mining
Exploring How the Association Rules Algorithm Works
Chapter 18 • What’s Your Vector, Victor?
Supervised and Unsupervised Learning
Supervised Learning via Support Vector Machines
Support Vector Machines in R
Chapter 19 • Shiny® Web Apps
Creating Web Applications in R
Deploying the Application
Chapter 20 • Big Data? Big Deal!
What Is Big Data?
The Tools for Big Data
Index

Erscheint lt. Verlag 18.10.2017
Verlagsort Thousand Oaks
Sprache englisch
Themenwelt Mathematik / Informatik Informatik Datenbanken
Mathematik / Informatik Informatik Netzwerke
Informatik Weitere Themen Hardware
Naturwissenschaften
Sozialwissenschaften Pädagogik
Sozialwissenschaften Soziologie Empirische Sozialforschung
Wirtschaft Betriebswirtschaft / Management Unternehmensführung / Management
Schlagworte An Introduction to Data Science • Big Data • Coding • data munging • Data Visualization • Model Building • R platform • Statistics • Text Mining
ISBN-10 1-5063-7754-8 / 1506377548
ISBN-13 978-1-5063-7754-4 / 9781506377544
Haben Sie eine Frage zum Produkt?
PDFPDF (Adobe DRM)

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Was Benutzer alles wissen sollten

von Claudio Franzetti

eBook Download (2023)
Springer Berlin Heidelberg (Verlag)
39,99