Fault-Tolerance Techniques for High-Performance Computing (eBook)

Thomas Herault, Yves Robert (Herausgeber)

eBook Download: PDF
2015 | 2015
IX, 320 Seiten
Springer International Publishing (Verlag)
978-3-319-20943-2 (ISBN)

Lese- und Medienproben

Fault-Tolerance Techniques for High-Performance Computing -
Systemvoraussetzungen
96,29 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
This timely text presents a comprehensive overview of fault tolerance techniques for high-performance computing (HPC). The text opens with a detailed introduction to the concepts of checkpoint protocols and scheduling algorithms, prediction, replication, silent error detection and correction, together with some application-specific techniques such as ABFT. Emphasis is placed on analytical performance models. This is then followed by a review of general-purpose techniques, including several checkpoint and rollback recovery protocols. Relevant execution scenarios are also evaluated and compared through quantitative models. Features: provides a survey of resilience methods and performance models; examines the various sources for errors and faults in large-scale systems; reviews the spectrum of techniques that can be applied to design a fault-tolerant MPI; investigates different approaches to replication; discusses the challenge of energy consumption of fault-tolerance methods in extreme-scale systems.

Part I: General OverviewFault-Tolerance Techniques for High-Performance ComputingJack Dongarra, Thomas Herault and Yves RobertPart II: Technical ContributionsErrors and FaultsAna Gainaru and Franck CappelloFault-Tolerant MPIAurelien BouteillerUsing Replication for Resilience on Exascale SystemsHenri Casanova, Frédéric Vivien and Dounia ZaidouniEnergy-Aware Checkpointing StrategiesGuillaume Aupy, Anne Benoit, Mohammed El Mehdi Diouri, Olivier Glück and Laurent Lefèvre

Erscheint lt. Verlag 1.7.2015
Reihe/Serie Computer Communications and Networks
Computer Communications and Networks
Zusatzinfo IX, 320 p. 113 illus.
Verlagsort Cham
Sprache englisch
Themenwelt Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
Schlagworte Algorithm-Based Fault Tolerance • Fault Predictors • Fault-Tolerance • High-Performance Computing • Resilience • Silent Errors
ISBN-10 3-319-20943-4 / 3319209434
ISBN-13 978-3-319-20943-2 / 9783319209432
Haben Sie eine Frage zum Produkt?
PDFPDF (Wasserzeichen)
Größe: 8,8 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seiten­layout eignet sich die PDF besonders für Fach­bücher mit Spalten, Tabellen und Abbild­ungen. Eine PDF kann auf fast allen Geräten ange­zeigt werden, ist aber für kleine Displays (Smart­phone, eReader) nur einge­schränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Das Handbuch für Webentwickler

von Philip Ackermann

eBook Download (2023)
Rheinwerk Computing (Verlag)
49,90
Das umfassende Handbuch

von Johannes Ernesti; Peter Kaiser

eBook Download (2023)
Rheinwerk Computing (Verlag)
44,90