Data Privacy in der Praxis -  Katharine Jarmul

Data Privacy in der Praxis (eBook)

Datenschutz in Data-Science-Projekten verbessern
eBook Download: EPUB
2024 | 1. Auflage
413 Seiten
O'Reilly Verlag
978-3-96010-817-7 (ISBN)
Systemvoraussetzungen
49,90 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen
Bewährte Praktiken zur Verbesserung von Privacy für Daten aus technischer, organisatorischer und rechtlicher Sicht - Das Buch zeigt, wie Sie dafür sorgen, dass die Daten in Ihrem Projekt privat, anonymisiert und sicher sind - Auf den europäischen Markt zugeschnitten, behandelt die DSGVO eingehend - Umfasst auch Themen wie ChatGPT und Deep Fakes - Katharine Jarmul ist eine renommierte Privacy-Spezialistin. Sie arbeitet für Thoughtworks und ist Mitgründerin der PyLadiesDie Anforderungen an den Datenschutz sind in Daten- und KI-Projekten heute so hoch wie nie. Die Integration von Privacy in Datensysteme ist jedoch nach wie vor komplex. Dieser Leitfaden vermittelt Data Scientists und Data Engineers ein grundlegendes Verständnis von modernen Datenschutzbausteinen wie Differential Privacy, Federated Learning und homomorpher Verschlüsselung. Privacy-Spezialistin Katharine Jarmul zeigt Best Practices und gibt praxiserprobte Ratschläge für den Einsatz bahnbrechender Technologien zur Verbesserung des Datenschutzes in Produktivsystemen. Das Buch beantwortet diese wichtigen Fragen: - Wie wirken sich Datenschutzbestimmungen wie die DSGVO oder der California Consumer Privacy Act (CCPA) auf meine Datenworkflows und Data-Science- Anwendungen aus? - Was ist unter »anonymisierten Daten« zu verstehen und wie lassen sich Daten anonymisieren? - Wie funktionieren Federated Learning und Federated Analysis? - Homomorphe Verschlüsselung klingt großartig - doch ist sie auch anwendungsreif? - Wie kann ich datenschutzwahrende Technologien und Verfahren miteinander vergleichen, um die für mich beste Wahl zu treffen? Welche Open-Source-Bibliotheken stehen hierfür zur Verfügung? - Wie stelle ich sicher, dass meine Data-Science-Projekte von vornherein geschützt und sicher sind? - Wie kann ich mit den für Governance und Informationssicherheit verantwortlichen Teams zusammenarbeiten, um interne Richtlinien in geeigneter Weise umzusetzen?

Katharine Jarmul ist Datenschutzaktivistin und Data Scientist, ihre Arbeit und Forschung konzentriert sich auf Privacy und Sicherheit in Data-Science-Workflows. Sie arbeitet als Principal Data Scientist bei Thoughtworks und war in zahlreichen Führungspositionen und als unabhängige Beraterin bei großen Unternehmen und Start-ups in den USA und Deutschland tätig, wo sie Daten- und Machine-Lerning-Systeme mit integrierter Privacy und Sicherheit entwickelt hat.

Katharine Jarmul ist Datenschutzaktivistin und Data Scientist, ihre Arbeit und Forschung konzentriert sich auf Privacy und Sicherheit in Data-Science-Workflows. Sie arbeitet als Principal Data Scientist bei Thoughtworks und war in zahlreichen Führungspositionen und als unabhängige Beraterin bei großen Unternehmen und Start-ups in den USA und Deutschland tätig, wo sie Daten- und Machine-Lerning-Systeme mit integrierter Privacy und Sicherheit entwickelt hat.

Einleitung


Willkommen in der wunderbaren Welt des Datenschutzes! Möglicherweise haben Sie sich bereits eine Meinung zum Datenschutz (engl. Data Privacy) gebildet – dass er eine lästige Angelegenheit ist, dass er bürokratisch und deshalb langweilig ist, oder Sie sind vielleicht der Meinung, dass es ein Thema ist, für das lediglich Juristinnen und Juristen Interesse aufbringen können. In diesem Buch werden Sie herausfinden, wie technisch komplex und interessant die Herausforderungen des Datenschutzes sind – und auch in Zukunft sein werden. Sollte Ihre Begeisterung für knifflige mathematische und statistische Fragestellungen zu Ihrer Entscheidung geführt haben, sich mit Data Science zu befassen, dann werden Sie mit Sicherheit auch Gefallen daran finden, Datenschutz aus der Perspektive der Data Science zu erforschen. Die in diesem Buch vermittelten Inhalte werden Ihre Kenntnisse in den Bereichen Wahrscheinlichkeitstheorie, Modellierung und sogar Kryptografie erweitern.

Für Data-Science-Fachleute wird es zunehmend wichtiger, zu lernen, wie auch Datenschutzprobleme gelöst werden können. Nachdem Sie das Buch gelesen haben, werden Sie in der Lage sein, reale Probleme in Bereichen wie Cybersicherheit, Gesundheitswesen und Finanzwirtschaft zu lösen und Ihre Karriere innerhalb eines Irrgartens aus Datenschutzbestimmungen, -richtlinien und -rahmen voranzutreiben. Seit Inkrafttreten der Europäischen Datenschutz-Grundverordnung (DSGVO oder DS-GVO, engl. General Data Protection Regulation – GDPR) im Jahr 2018 ist die weltweite Datenschutzlandschaft noch komplexer geworden. Diese Komplexität wird weiter zunehmen, da Aufsichtsbehörden und Gesetzgeber fortwährend die Regeln dahin gehend ändern, wie, wo, warum und wann Sie Daten speichern dürfen. Wenn Sie jetzt Ihre Kompetenzen rund um den Bereich Datenschutz und Datensicherheit erweitern, ist das zweifelsohne eine sinnvolle Investition in Ihre berufliche Zukunft.

Darüber hinaus leisten Sie, wenn Sie Zeit darin investieren, neue Kenntnisse über den Datenschutz zu erlangen, einen Beitrag im Bereich der Data Science und fördern Vertrauen, Verantwortlichkeit, gegenseitiges Verständnis und soziale Verantwortung. Maschinelles Lernen (Machine Learning) zur Lösung von Problemen in der realen Welt stößt gegenwärtig dort auf Angst und Widerstände, wo Daten, Modelle und Systeme in nicht vertrauenswürdiger Weise genutzt wurden und sich Fragen nach Gerechtigkeit und Fairness stellen. Ein Beispiel: Clearview AI sammelt Bilder von Gesichtern aus sozialen Netzwerken und verkauft das auf dieser Grundlage entwickelte Gesichtserkennungsmodell an Strafverfolgungsbehörden (https://oreil.ly/PE6u1)1, was Fragen hinsichtlich des Eigentums an den Daten, dem Schutz der Privatsphäre und der Haftung aufwirft. Um diesem Reputationsverlust entgegenzuwirken und Wege für eine verantwortungsbewusste und vertrauenswürdige Datennutzung zu schaffen, bedarf es in der Branche Data Scientists und Machine Learning Engineers, die die vorliegenden Aufgaben und die damit verbundenen Risiken verstehen und bei der Entwicklung von Systemen diese Fragen kompetent berücksichtigen können. Der Datenschutz kann Ihnen dabei helfen, gerechtere, ethisch besser zu vertretende und verantwortungsvollere Systeme zu entwickeln, bei denen die Benutzerinnen und Benutzer die Macht und die Möglichkeit haben, sich einzubringen, und im Mittelpunkt Ihrer Ausgestaltung stehen. Mithilfe dieses Buchs können Sie diese Herausforderungen meistern und dank praxisnaher Anleitungen neue Wege finden.

Ich hoffe, dass dieses Buch einen Beitrag zur neuen Data Science leisten kann, indem es das Bewusstsein dafür schärft, wie der Schutz sensibler Daten in geeigneter Weise umgesetzt werden kann. Weltweit sind die Ängste vor der Digitalisierung persönlicher Daten – selbst für den verantwortungsvollen Einsatz durch die Regierung – so groß, dass sie die Nutzung von Daten zur Unterstützung bei sozialen Problemen wie dem Klimawandel, der Finanzaufsicht und globalen Gesundheitskrisen behindern. Wenn wir den Datenschutz in die Data Science integrieren, eröffnen sich neue Wege für die Nutzung von Daten bei wichtigen Entscheidungen für unsere Gesellschaft und unsere Welt.

Was ist Data Privacy?


Vereinfacht gesagt, schützt Privacy Daten und Menschen, indem es durch Beschränkungen hinsichtlich des Zugriffs, der Nutzung, der Verarbeitung und der Speicherung einen besseren Schutz der Privatsphäre ermöglicht und garantiert. In der Regel handelt es sich dabei um personenbezogene Daten, es umfasst aber jegliche Art der Verarbeitung. Diese Definition greift allerdings zu kurz, um Data Privacy in seiner ganzen Breite zu begreifen.

Privacy ist ein komplexes Konzept – mit Aspekten aus vielen verschiedenen Bereichen unserer Welt, sei es in rechtlicher, technischer, sozialer, kultureller oder individueller Hinsicht. Werfen wir zunächst einen Blick auf diese Aspekte und ihre Überschneidungen, damit Sie eine Vorstellung davon bekommen, wie weitreichend die Auswirkungen der in diesem Buch behandelten Themen und Vorgehensweisen sind. In Abbildung E-1 sehen Sie die verschiedenen Arten der Definitionen von Privacy (bzw. des Datenschutzes oder der Wahrung der Privatsphäre)2, und ich habe versucht, das jeweilige Ausmaß in der Abbildung zu illustrieren. Gehen wir sie durch und beginnen wir mit den rechtlichen Definitionen.

Im juristischen Kontext umfasst Privacy die Vorschriften, die Rechtsprechung und die Richtlinien, die festlegen, welche Maßnahmen erforderlich sind und was in einem bestimmten Staat oder einer bestimmten Gerichtsbarkeit unter Privacy zu verstehen ist. Wie Sie in den Kapiteln 1 und 8 erfahren werden, handelt es sich dabei um ein sich ständig wandelndes Rechtsverständnis und eine Landschaft, die sich in den letzten Jahren drastisch verändert hat. Es ist wichtig, dass Sie sich mit den rechtlichen Aspekten von Privacy vertraut machen, da sie sich direkt auf Ihre Arbeit auswirken können. Was passiert zum Beispiel, wenn Ihr Unternehmen von einem Audit, einer Datenschutzverletzung oder einer Verbraucherbeschwerde betroffen ist? Diese gesetzlichen Definitionen wirken sich auch auf Ihr persönliches Leben aus, beispielsweise bei der Frage, welche Rechte Sie als Datenbürger haben.

Abbildung E-1: Definitionen von Privacy

Die wissenschaftlichen bzw. technischen Definitionen von Privacy und deren Umsetzung in Ihrer täglichen Arbeit stehen im Mittelpunkt dieses Buchs. Sie lernen diese Definitionen kennen und erfahren, wie Sie wissenschaftliche Technologien zum Schutz der Privatsphäre in großem Umfang einsetzen und wie Sie technische Entscheidungen zum Thema Privacy treffen können. Mit den Tools in diesem Buch lernen Sie modernste Best Practices kennen, die in Ihrem Unternehmen möglicherweise noch nicht bekannt sind, da sie erst seit Kurzem in Produktionssystemen zur Verfügung stehen. Über diese Praktiken auf dem Laufenden zu bleiben, wird Teil Ihres Jobs sein – jedenfalls sofern Sie sich dazu entscheiden, sich auf diesen Bereich zu konzentrieren. Als technischer Experte für dieses Thema werden Sie gebeten werden, geschäftliche und juristische Entscheidungen zum Datenschutz zu unterstützen und diese in funktionsfähige Software und Systeme umzusetzen. Dies ist eine wichtige Aufgabe, denn viele der anderen Beteiligten werden kein technisches und zeitgemäßes Verständnis von Data Privacy haben.

Die sozialen und kulturellen Aspekte von Privacy lassen sich am besten anhand einer Studie zu Data Privacy von danah boyd (http://www.danah.org) erklären. Sie untersuchte jugendliche Mädchen und ihre Interaktion mit sozialen Medien, um zu verstehen, wie die Technologie ihr Verständnis von Konzepten wie Privacy beeinflusst. Ihre Definition lautet wie folgt:

Bei Privacy geht es weder um die Kontrolle über Daten, noch ist sie eine der Eigenschaften von Daten. Es geht um ein kollektives Verständnis der Grenzen einer gesellschaftlichen Situation und um das Wissen, wie man innerhalb dieser Grenzen agiert. Mit anderen Worten, es geht darum, die Kontrolle über eine Situation zu besitzen. Es geht darum, das jeweilige Gegenüber zu verstehen und zu wissen, wie weit Informationen verbreitet werden. Es geht darum, den Menschen, der Situation und dem Kontext zu vertrauen.

– danah boyd, in »Privacy and Publicity in the Context of Big Data« (https://oreil.ly/ThnPz)

boyd weist uns mit dieser Definition auf einen neuen Aspekt von Privacy hin, der wesentliche Veränderungen bei der Gestaltung von Privacy in Systemen mit sich bringt. Im Gegensatz zu technischen und rechtlichen Definitionen stellt boyd das soziale und kulturelle Verständnis, den Kontext und die individuelle Wahl und das Bewusstsein in den Mittelpunkt. Wenn Sie ihre Arbeit lesen oder sie sprechen hören, erfahren Sie Wahrheiten, die Sie zwar oft gefühlt, aber nie vollständig erfasst haben, und zwar darüber, wie wir als Menschen und als Gesellschaft Privatsphäre und Informationen verstehen.

Wenn ich zum Beispiel meine Stimme senke...

Erscheint lt. Verlag 25.6.2024
Reihe/Serie Animals
Übersetzer Marcus Fraaß
Verlagsort Heidelberg
Sprache deutsch
Themenwelt Mathematik / Informatik Informatik Netzwerke
Schlagworte anonyme Daten • California Consumer Privacy Act • ccpa • ChatGPT • data governance • Data Mesh • Datenschutz-Grundverordnung • deep fakes • differential privacy • DSGVO • Föderales Lernen • Homomorphe Verschlüsselung • Privacy engineering • Sicherheit
ISBN-10 3-96010-817-6 / 3960108176
ISBN-13 978-3-96010-817-7 / 9783960108177
Haben Sie eine Frage zum Produkt?
EPUBEPUB (Wasserzeichen)
Größe: 4,5 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Das umfassende Handbuch

von Martin Linten; Axel Schemberg; Kai Surendorf

eBook Download (2023)
Rheinwerk Computing (Verlag)
22,43
das Praxisbuch für Administratoren und DevOps-Teams

von Michael Kofler

eBook Download (2023)
Rheinwerk Computing (Verlag)
29,93