Deep Learning mit TensorFlow, Keras und TensorFlow.js - Matthieu Deru, Alassane Ndiaye

Deep Learning mit TensorFlow, Keras und TensorFlow.js (eBook)

Matthieu Deru, Alassane Ndiaye (Autoren)

eBook Download: EPUB

2020 | 2. Auflage
496 Seiten
Rheinwerk Computing (Verlag)
978-3-8362-7427-2 (ISBN)

Deep Learning - eine Schlüsseltechnologie der Künstlichen Intelligenz. Neuronale Netze bringen Höchstleistung, wenn sie zu Deep-Learning-Modellen verknüpft werden - vorausgesetzt, Sie machen es richtig. Große und gute Trainingsdaten beschaffen, geschickt implementieren ... lernen Sie hier, wie Sie die mächtige Technologie wirklich in Ihren Dienst nehmen. Unsere Autoren zeigen Ihnen sowohl die Arbeit mit Python und Keras als auch für den Browser mit JavaScript, HTML5 und TensorFlow.js.

Aus dem Inhalt:

Deep-Learning-Grundkonzepte
Installation der Frameworks
Vorgefertigte Modelle verwenden
Datenanalyse und -vorbereitung
Convolutional Networks, LSTM, RNN, Pooling ...
Aufgaben eines Modells richtig festlegen
Eigene Modelle trainieren
Overfitting und Underfitting vermeiden
Ergebnisse visualisieren

Dr. Matthieu Deru ist Senior Software-Engineer (R&D) und UX-Designer für interaktive Systeme am Deutschen Forschungszentrum für Künstliche Intelligenz GmbH (DFKI). Seine Projekterfahrung umfasst Themengebiete, die so vielseitig sind wie die Anwendungsfelder der KI, von intelligenten Benutzerschnittstellen bis zu komplexen Vorhersagenmodellen für die Elektromobilität.

1.3 Deep Learning im Alltag und in der Zukunft

In diesem Abschnitt werden zur Einführung in die Thematik einige Anwendungsbeispiele von Deep Learning präsentiert. Sie haben bestimmt irgendwann in Ihrem Alltag eines dieser Systeme benutzt – vielleicht auch, ohne es zu wissen!

1.3.1 Sprachverarbeitung

Die Spracherkennung und die natürlichsprachlichen Dialogsysteme haben in den letzten Jahren enorm von den Fortschritten des Deep Learning profitiert. Durch die Analyse massiver Datenmengen und annotierter Sprachaufnahmen ist es möglich, die Sprache des Benutzers besser zu verstehen (auch mit Dialekten) und semantisch zu verarbeiten, d. h., den Sinn des gesprochenen Satzes automatisch zu ermitteln. Denken Sie dabei an persönliche digitale Assistenten wie Apple Siri, Amazon Alexa (siehe Abbildung 1.3), Google Now, Cortana, aber auch an Hotline- und Chat-Systeme, die bei den Callcentern der Deutschen Telekom, der Lufthansa oder sogar von Zalando benutzt werden.

Abbildung 1.3 Digitaler Assistent: »Amazon Echo Dot« mit der Sprachverarbeitungskomponente Alexa (Bildquelle: https://www.amazon.de/Echo-Dot-3-Gen-Intelligenter-Lautsprecher-mit-Alexa-Anthrazit-Stoff/dp/B07PHPXHQS/)

Diese Systeme analysieren binnen einiger Millisekunden die Spracheingabe des Benutzers bzw. Anrufers und geben eine passende Antwort zurück. Abstrahiert man vom einfachen Frage-Antwort-Szenario à la »Wie wird morgen das Wetter?« oder »Gib mir Informationen zu meinem Termin!«, geht die aktuelle Entwicklung in Richtung Dialogsysteme, d. h., Systeme, die in der Lage sind, unter Berücksichtigung von Dialogkontext und -historie einen kompletten Dialog mit dem Benutzer zu führen. Diese Systeme können sogar Rückfragen stellen, wenn das Gesprochene nicht eindeutig genug war oder mehr Informationen vom Benutzer benötigt werden, um eine Anfrage vollständig zu beantworten.

Google Duplex[ 4 ], ein neuer digitaler Assistent, wurde so weit trainiert, dass er selbstständig ein Telefonat mit einem Gesprächspartner führen kann, um z. B. Termine beim Friseur zu vereinbaren. Die Dialoge sind zwar noch auf die üblichen Aufgaben beschränkt, die Benutzer in ihrem Terminkalender eintragen (z. B. »Tisch beim Restaurant Locanda für 19 Uhr reservieren«), aber am anderen Ende der Telefonleitung merkt der Angerufene oftmals nicht, dass er einen Dialog mit einem KI-gestützten Dialogsystem führt!

Durch Deep Learning können auch Emotionen von Menschen anhand ihrer Stimmen bzw. Äußerungen identifiziert und vom System bei der Interaktion mit dem Menschen berücksichtigt werden, etwa in Callcentern.

1.3.2 Automatische Sprachübersetzungen

Sprachübersetzung ist eine komplexe Aufgabe: Regeln müssen aufgesetzt werden, und Begriffe, Synonyme, Flexionen sowie Syntax müssen besonders gut analysiert werden. Traditionelle Sprachübersetzungssoftware benutzt Statistiken, Wörterbücher und Grammatiken und versucht, eine Abbildung von einer Sprache in die andere zu erzeugen. Bei Deep-Learning-basierten Sprachübersetzungen oder besser gesagt Neural Machine Translation werden neuronale Netze benutzt, um Texte oder Äußerungen in andere Sprachen zu übersetzen.

Ein gutes Beispiel für die Benutzung von tiefen neuronalen Netzen für die Übersetzungsaufgaben zeigt uns die Kölner Firma DeepL (siehe Abbildung 1.4).

Abbildung 1.4 DeepL benutzt neuronale Netze, um Übersetzungen genauer durchzuführen. (Bildquelle: https://www.deepl.com/press.html)

Dank eines Supercomputers werden eine Million Wörter in weniger als einer Sekunde übersetzt, und zwar für 42 Sprachkombinationen. Angefangen hatte DeepL mit dem webbasierten Dienst Linguee[ 5 ], und zwar mit offenen Textquellen, die schon von Menschen in verschiedenste Sprachen übersetzt wurden, z. B. die offiziellen Webseiten bzw. Texte des Europäischen Parlaments.[ 6 ] Diese bildeten die Datengrundlage für das Lernen eines Übersetzungsmodells.

1.3.3 Visual Computing

Im Bereich Visual Computing (computergestütztes Sehen) sind mithilfe von Deep Learning enorme Fortschritte erzielt worden. Diese reichen von der Handschriftenerkennung über Erkennung von Objekten und Personen in Bildern bzw. Videos sowie deren Emotionen und Aktivitäten bis hin zu Echtzeit-Videoanalysen, die bei selbstfahrenden Autos zum Einsatz kommen und etwa bei der Fahndung nach polizeilich gesuchten Personen.[ 7 ] Online-Dienste, wie z. B. Amazon Recognition oder Microsoft Cognitive Services (siehe Abbildung 1.5), bieten sogar mehrere Out-of-the-Box-Modelle, die es ermöglichen, Objekte, Personen, Texte, Szenen und Aktivitäten in Bildern zu erkennen und anhand bestimmter Parameter auszuwerten.

Abbildung 1.5 Bildanalyse mit »Microsoft Cognitive Services« (Bildquelle: https:// azure.microsoft.com/de-de/services/cognitive-services/computer-vision)

Der Grafikkartenhersteller NVIDIA bietet ebenfalls für Entwickler in Form eines SDK (Software Development Kit) zahlreiche Bausteine, z. B. DeepStream, um Lösungen für Videoanalyse-Applikationen mit Deep Learning zu erstellen.

Aber wieso interessiert sich ausgerechnet ein Grafikkartenhersteller für Deep Learning? Da die Vorverarbeitung und das Trainieren von Modellen auf Basis von Daten aus Pixelinformationen von Bildern und Videos sehr rechenintensiv sind, werden diese Operation nicht mehr direkt auf der CPU (Central Processing Unit) durchgeführt, sondern auf GPUs (Graphical Processing Units)[ 8 ].

GPUs sind im Gegensatz zu CPUs dafür konzipiert, schnell, effizient und parallel Matrix- und Vektoroperationen durchzuführen: Denken Sie an Videospiele und an die zahlreichen Operationen, die synchron ausgeführt werden müssen, damit eine 3D-Szene flüssig auf Ihrem Bildschirm angezeigt wird.

Diese Fähigkeit der Grafikkarten, sehr schnell komplexe Daten und Operationen zu berechnen, wurde quasi für Deep-Learning-Anwendungen »missbraucht« (siehe Abbildung 1.6). Somit sind heute die Konzepte von GPU-basierten Systemen und Deep Learning nicht mehr voneinander zu trennen. Sie werden später in diesem Buch erfahren, wie Sie auch Ihre eigene Deep-Learning-Applikation mit GPU-Unterstützung implementieren können.

Abbildung 1.6 Modularer Aufbau der DeepStream-SDK-Lösung zur Videoanalyse (Bildquelle: https://developer.nvidia.com/deepstream-sdk)

Diskriminierungen

Machine Learning und Deep Learning können natürlich diskriminierend sein. Für das Trainieren der Lernalgorithmen werden Daten eingesetzt, die von Menschen über einen Zeitraum von mehreren Jahren gesammelt oder erstellt wurden. Diese Daten sind eventuell verzerrt (engl. biased). Die Algorithmen können so Vorurteile reproduzieren, die diesen Daten inhärent sind. Diese Frage wird nicht in diesem Buch thematisiert. Mehr zu dieser Thematik finden Sie z. B. in:

https://history.stanford.edu/news/ai-can-be-sexist-and-racist-%E2%80%94-it%E2%80%99s-time-make-it-fair
https://www.zeit.de/digital/internet/2018-05/algorithmen-rassismus- diskriminierung-daten-vorurteile-alltagsrassismus/komplettansicht
http://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf

1.3.4 Autonomes Fahren

Einer der am heißesten diskutierten und medienwirksamsten Anwendungsbereiche für KI und Deep Learning ist wahrscheinlich das autonome Fahren. Systeme wie Autopilot des Autoherstellers Tesla, das selbstfahrende Auto Waymo von Google oder sogar das bescheidene Open-Source-Projekt comma.ai[ 9 ] zeigen, wie durch eine automatische Sensorfusion (z. B. von LIDAR oder der ODB-2-Schnittstelle) und Deep Learning ein Fahrzeug eigenständig und intelligent angesteuert werden kann (siehe Abbildung 1.7).

Abbildung 1.7 Tesla Autopilot: Die einzelnen Bereiche und Gegenstände, die während der Fahrt von den Kameras des Fahrzeugs aufgenommen werden (Ampel, Verkehrsschild), werden klassifiziert und in Echtzeit gekennzeichnet. (Bildquelle: Tesla Werbevideo – https://www.tesla.com/de_DE/autopilot)

Dieser Bereich profitiert sehr stark von den Entwicklungen im Deep...

Erscheint lt. Verlag	28.4.2020
Sprache	deutsch
Themenwelt	Mathematik / Informatik ► Informatik ► Programmiersprachen / -werkzeuge
Themenwelt	Informatik ► Theorie / Studium ► Künstliche Intelligenz / Robotik
ISBN-10	3-8362-7427-2 / 3836274272
ISBN-13	978-3-8362-7427-2 / 9783836274272

Haben Sie eine Frage zum Produkt?

EPUB (Wasserzeichen)
Größe: 68,6 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Print-Ausgabe

Buch | Hardcover

39,90 €