Hadoop For Dummies (eBook)

(Autor)

eBook Download: PDF | EPUB
2014
John Wiley & Sons (Verlag)
978-1-118-65220-6 (ISBN)

Lese- und Medienproben

Hadoop For Dummies - Dirk Deroos
Systemvoraussetzungen
Systemvoraussetzungen
20,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Let Hadoop For Dummies help harness the power of your data and rein in the information overload Big data has become big business, and companies and organizations of all sizes are struggling to find ways to retrieve valuable information from their massive data sets with becoming overwhelmed. Enter Hadoop and this easy-to-understand For Dummies guide. Hadoop For Dummies helps readers understand the value of big data, make a business case for using Hadoop, navigate the Hadoop ecosystem, and build and manage Hadoop applications and clusters. Explains the origins of Hadoop, its economic benefits, and its functionality and practical applications Helps you find your way around the Hadoop ecosystem, program MapReduce, utilize design patterns, and get your Hadoop cluster up and running quickly and easily Details how to use Hadoop applications for data mining, web analytics and personalization, large-scale text processing, data science, and problem-solving Shows you how to improve the value of your Hadoop cluster, maximize your investment in Hadoop, and avoid common pitfalls when building your Hadoop cluster From programmers challenged with building and maintaining affordable, scaleable data systems to administrators who must deal with huge volumes of information effectively and efficiently, this how-to has something to help you with Hadoop.

Dirk deRoos is the technical sales lead for IBM's InfoSphere BigInsights. Paul C. Zikopoulos is the vice president of big data in the IBM Information Management division. Roman B. Melnyk, PhD is a senior member of the DB2 Information Development team. Bruce Brown and Rafael Coss work with big data with IBM.

Introduction 1

Part I: Getting Started with Hadoop 7

Chapter 1: Introducing Hadoop and Seeing What It's Good For 9

Chapter 2: Common Use Cases for Big Data in Hadoop 23

Chapter 3: Setting Up Your Hadoop Environment 41

Part II: How Hadoop Works 51

Chapter 4: Storing Data in Hadoop: The Hadoop Distributed File System 53

Chapter 5: Reading and Writing Data 69

Chapter 6: MapReduce Programming 83

Chapter 7: Frameworks for Processing Data in Hadoop: YARN and MapReduce 103

Chapter 8: Pig: Hadoop Programming Made Easier 117

Chapter 9: Statistical Analysis in Hadoop 129

Chapter 10: Developing and Scheduling Application Workflows with Oozie 139

Part III: Hadoop and Structured Data 155

Chapter 11: Hadoop and the Data Warehouse: Friends or Foes? 157

Chapter 12: Extremely Big Tables: Storing Data in HBase 179

Chapter 13: Applying Structure to Hadoop Data with Hive 227

Chapter 14: Integrating Hadoop with Relational Databases Using Sqoop 269

Chapter 15: The Holy Grail: Native SQL Access to Hadoop Data 303

Part IV: Administering and Configuring Hadoop 313

Chapter 16: Deploying Hadoop 315

Chapter 17: Administering Your Hadoop Cluster 335

Part V: The Part of Tens 359

Chapter 18: Ten Hadoop Resources Worthy of a Bookmark 361

Chapter 19: Ten Reasons to Adopt Hadoop 371

Index 379

Erscheint lt. Verlag 21.3.2014
Sprache englisch
Themenwelt Mathematik / Informatik Informatik Datenbanken
Informatik Office Programme Outlook
Schlagworte Big Data • Computer-Ratgeber • End-User Computing • hadoop, hadoop programming, mapreduce, big data, hadoop clusters, hadoop ecosystem, hadoop cluster, data mining, design patterns, data analysis, data storage, data retrieval, data science, big data processing, data processing, cloud computing, cloud storage, mapreduce programming, map reduce, map reduce programming, hadoop and pig, hadoop and hive, working with hadoop, using hadoop, using hadoop with pig, using hadoop with hive, data frameworks, big data frameworks • Other Software (Non-Microsoft) • Sonstige Software (außer Microsoft) • Sonstige Software (außer Microsoft)
ISBN-10 1-118-65220-7 / 1118652207
ISBN-13 978-1-118-65220-6 / 9781118652206
Haben Sie eine Frage zum Produkt?
PDFPDF (Adobe DRM)
Größe: 9,5 MB

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

EPUBEPUB (Ohne DRM)

Digital Rights Management: ohne DRM
Dieses eBook enthält kein DRM oder Kopier­schutz. Eine Weiter­gabe an Dritte ist jedoch rechtlich nicht zulässig, weil Sie beim Kauf nur die Rechte an der persön­lichen Nutzung erwerben.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich