Praktische Statistik für Data Scientists

50+ essenzielle Konzepte mit R und Python
Buch | Softcover
XVI, 358 Seiten
2021 | 1. Übersetzung der 2. Auflage
O'Reilly (Verlag)
978-3-96009-153-0 (ISBN)
39,90 inkl. MwSt
Statistische Konzepte aus der Perspektive von Data Scientists erläutert

  • Das Buch verbindet nützliche statistische Prinzipien und der heutigen Datenanalyse-Praxis her
  • Es ermöglicht Data Scientists, ihr Wissen über Statistik auf ein neues Level zu bringen
  • Als Übersetzung der 2. Auflage des US-Bestsellers enthält es Beispiele in Python und R

Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern über die Grundlagen der Statistik wird das Thema aber selten aus der Sicht von Data Scientists behandelt. Viele stellen daher fest, dass ihnen eine tiefere statistische Perspektive auf ihre Daten fehlt.

Dieses praxisorientierte Handbuch mit zahlreichen Beispielen in Python und R erklärt Ihnen, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden. Es zeigt Ihnen auch, wie Sie den falschen Gebrauch von statistischen Methoden vermeiden können, und gibt Ratschläge, welche statistischen Konzepte für die Datenwissenschaften besonders relevant sind.

Wenn Sie mit R oder Python vertraut sind, ermöglicht diese zugängliche, gut lesbare Referenz es Ihnen, Ihr statistisches Wissen für die Praxis deutlich auszubauen.

In diesem Buch erfahren Sie:
  • warum die explorative Datenanalyse ein wichtiger vorbereitender Arbeitsschritt in der Datenwissenschaft ist
  • wie Zufallsstichproben Verzerrungen reduzieren und einen qualitativ hochwertigeren Datensatz liefern
  • wie Sie mit den Prinzipien des experimentellen Designs eindeutige Antworten auf Ihre Forschungsfragen erhalten
  • wie Sie eine Regression verwenden, um Prognosen zu treffen oder Anomalien zu erkennen
  • auf welche Weise statistische Methoden aus dem Bereich des Machine Learning es ermöglichen, aus Daten zu lernen
  • wie Sie Unsupervised Learning nutzen, um Erkenntnisse aus ungelabelten Daten zu gewinnen

Peter Bruce ist Gründer des Institute for Statistics Education bei Statistics.com.

Andrew Bruce ist Principal Research Scientist bei Amazon und verfügt über mehr als 30 Jahre Erfahrung in Statistik und Data Science.

Peter Gedeck ist Senior Data Scientist bei Collaborative Drug Discovery, er entwickelt Machine-Learning-Algorithmen für die Vorhersage von Eigenschaften von Arzneimittelkandidaten.

Erscheinungsdatum
Reihe/Serie Animals
Übersetzer Marcus Fraaß
Verlagsort Heidelberg
Sprache deutsch
Maße 165 x 240 mm
Einbandart kartoniert
Themenwelt Informatik Datenbanken Data Warehouse / Data Mining
Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
Schlagworte Algorithmen • Big Data • Data Mining • Data Science • Datenanalyse • Datenklassifikation • machine learning • Python • R • random forest • Regression • Statistik • Unsupervised Learning • Wahrscheinlichkeit
ISBN-10 3-96009-153-2 / 3960091532
ISBN-13 978-3-96009-153-0 / 9783960091530
Zustand Neuware
Haben Sie eine Frage zum Produkt?
Mehr entdecken
aus dem Bereich