Pentaho Kettle Solutions (eBook)

Building Open Source ETL Solutions with Pentaho Data Integration
eBook Download: PDF
2010 | 1. Auflage
720 Seiten
John Wiley & Sons (Verlag)
978-0-470-94242-0 (ISBN)

Lese- und Medienproben

Pentaho Kettle Solutions - Matt Casters, Roland Bouman, Jos van Dongen
Systemvoraussetzungen
32,99 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
A complete guide to Pentaho Kettle, the Pentaho Data lntegration
toolset for ETL

This practical book is a complete guide to installing,
configuring, and managing Pentaho Kettle. If you're a
database administrator or developer, you'll first get up to
speed on Kettle basics and how to apply Kettle to create ETL
solutions--before progressing to specialized concepts such as
clustering, extensibility, and data vault models. Learn how to
design and build every phase of an ETL solution.

* Shows developers and database administrators how to use the
open-source Pentaho Kettle for enterprise-level ETL processes
(Extracting, Transforming, and Loading data)

* Assumes no prior knowledge of Kettle or ETL, and brings
beginners thoroughly up to speed at their own pace

* Explains how to get Kettle solutions up and running, then
follows the 34 ETL subsystems model, as created by the Kimball
Group, to explore the entire ETL lifecycle, including all aspects
of data warehousing with Kettle

* Goes beyond routine tasks to explore how to extend Kettle and
scale Kettle solutions using a distributed "cloud"

Get the most out of Pentaho Kettle and your data warehousing
with this detailed guide--from simple single table data
migration to complex multisystem clustered data integration
tasks.

Matt Casters is Founder of Kettle and works as Chief Data Integration at Pentaho, where he leads Kettle software development. Roland Bouman is an application developer focusing on open source web technology, databases, and business intelligence. Jos van Dongen is an independent business intelligence consultant and well-known author, analyst, and presenter.

Introduction.

Part I Getting Started.

Chapter 1 ETL Primer.

Chapter 2 Kettle Concepts.

Chapter 3 Installation and Configuration.

Chapter 4 An Example ETL Solution--Sakila.

Part II ETL.

Chapter 5 ETL Subsystems.

Chapter 6 Data Extraction.

Chapter 7 Cleansing and Conforming.

Chapter 8 Handling Dimension Tables.

Chapter 9 Loading Fact Tables.

Chapter 10 Working with OLAP Data.

Part III Management and Deployment.

Chapter 11 ETL Development Lifecycle.

Chapter 12 Scheduling and Monitoring.

Chapter 13 Versioning and Migration.

Chapter 14 Lineage and Auditing.

Part IV Performance and Scalability.

Chapter 15 Performance Tuning.

Chapter 16 Parallelization, Clustering, and Partitioning.

Chapter 17 Dynamic Clustering in the Cloud.

Chapter 18 Real-Time Data Integration.

Part V Advanced Topics.

Chapter 19 Data Vault Management.

Chapter 20 Handling Complex Data Formats.

Chapter 21 Web Services.

Chapter 22 Kettle Integration.

Chapter 23 Extending Kettle.

Appendix A The Kettle Ecosystem.

Appendix B Kettle Enterprise Edition Features.

Appendix C Built-in Variables and Properties Reference.

Index.

Erscheint lt. Verlag 9.9.2010
Sprache englisch
Themenwelt Mathematik / Informatik Informatik Datenbanken
Mathematik / Informatik Informatik Netzwerke
Schlagworte Computer Science • Database & Data Warehousing Technologies • Datenbanken u. Data Warehousing • Informatik • Pentaho
ISBN-10 0-470-94242-8 / 0470942428
ISBN-13 978-0-470-94242-0 / 9780470942420
Haben Sie eine Frage zum Produkt?
PDFPDF (Adobe DRM)
Größe: 12,5 MB

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
der Grundkurs für Ausbildung und Praxis

von Ralf Adams

eBook Download (2023)
Carl Hanser Verlag GmbH & Co. KG
29,99
Das umfassende Handbuch

von Wolfram Langer

eBook Download (2023)
Rheinwerk Computing (Verlag)
34,93
Das umfassende Lehrbuch

von Michael Kofler

eBook Download (2024)
Rheinwerk Computing (Verlag)
34,93