Learn Hive in 24 Hours (eBook)
280 Seiten
Publishdrive (Verlag)
978-0-00-031747-6 (ISBN)
Apache Hive is the new member in database family that works within the Hadoop ecosystem. It provides all great features like data summarization, ad-hoc query, and analysis of large datasets. If you are not a good programmer, then this edition will teach you how to use hive queries without writing complex codes.
Most users face the problem of not getting a dedicated course on Hive. The goal of this e-book is to cater everything about Hive and only Hive with minimum jargons. The notes, lessons and hands-on examples in this small e-book are simplified and tactfully presented to solve all your Hive queries. Instead of writing long code for MapReduce or Java, the e-book shows tips on writing the same program with a minimum code snippet.
Beginners as well as peers will thoroughly enjoy this book. They will discover and learn more hive patterns for data processing and data integrations. Unlike other e-book, where they skip basic detail thinking users having prior subject knowledge. This edition has given complete attention to each and every small aspect of the hive like 'how to set up and configure Hive in your environment'.
This e-book is also helpful for those who just want to explore Hive and don't want to spend big bucks for short courses. You will quickly learn, apply and share your Hive knowledge with this e-book.
Table of content
Chapter 1: Introduction
What is Hive?
Hive Architecture
Different modes of Hive
What is Hive Server2 (HS2)?
Hive vs Map Reduce
Chapter 2: Installation and Configuration
Installation of Hive
Hive shell commands
Install and configure MYSQL database
Chapter 3: Data operations
Data types in Hive
Creation and dropping of Database in Hive
Create, Drop and altering of tables in Hive
Table types and its Usage
Partitions
Buckets
Chapter 4: Queries and Implementation
Order by query
Group by query
Sort by
Cluster By
Distribute By
Join queries
Different type of joins
Sub queries
Embedding custom scripts
UDFs (User Define Functions)
Chapter 5: Query Language, Built-in Operators and Functions
Hive Query Language (HQL)
Built-in operators
Built-in functions
Chapter 6: Data Extraction
Working with Structured Data using Hive
Working with Semi structured data using Hive (XML, JSON)
Hive in Real time projects - When and Where to Use
Erscheint lt. Verlag | 12.11.2021 |
---|---|
Sprache | englisch |
Themenwelt | Mathematik / Informatik ► Informatik ► Datenbanken |
ISBN-10 | 0-00-031747-0 / 0000317470 |
ISBN-13 | 978-0-00-031747-6 / 9780000317476 |
Haben Sie eine Frage zum Produkt? |
Größe: 1,0 MB
Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM
Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich