Java für die Life Sciences -  Jens Dörpinghaus,  Sebastian Schaaf,  Vera Weil

Java für die Life Sciences (eBook)

Eine Einführung in die angewandte Bioinformatik
eBook Download: EPUB
2020 | 1. Auflage
268 Seiten
O'Reilly Verlag
978-3-96010-343-1 (ISBN)
Systemvoraussetzungen
32,90 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen

Lernen Sie grundlegende Java-Techniken, die für die Auswertung von Biodaten benötigt werden

  • Eine Einführung in Java für Biowissenschaftler mit Programmiererfahrung
  • Bietet biologische Hintergrundinformationen, soweit sie zum Verständnis des Problems hilfreich sind
  • Mit zahlreichen Übungsaufgaben und Codebeispielen

Diese Einführung in die Bioinformatik mit Java vermittelt Ihnen grundlegende Java-Techniken, die für die Analyse von Biodaten benötigt werden. Das Buch richtet sich an Studenten, Wissenschaftler und Praktiker in den Life Sciences, die Grundkenntnisse einer höheren Programmiersprache mitbringen.

Es bietet Ihnen einen schnellen Einstieg in Kernthemen der Programmierung in den Life Sciences:
- Data und Text Mining,
- Datenverarbeitung,
- Sequenz-, Bild- und Netzwerkanalysen
- Strukturbiologie

Genutzt werden dabei verbreitete Open-Source-Bibliotheken wie Maven, Eclipse oder Git.

Beispiele aus der Bioinformatik zeigen Ihnen alle notwendigen Schritte, um in kurzer Zeit Ergebnisse mit Java zu erzielen. Biologische Zusammenhänge werden immer dann beschrieben, wenn sie zum Verständnis des Problems hilfreich sind.



Jens Dörpinghaus hat Mathematik und Informatik studiert. Nach einigen Jahren am Deutschen Zentrum für neurodegenerative Erkrankungen arbeitet er seit einiger Zeit als Postdoc am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI (Sankt Augustin) in der Abteilung Bioinformatik. Er unterrichtet an der Universität Bonn im Studiengang Life Science Informatics. Sebastian Schaaf hat Biologie und Bioinformatik studiert und anschließend im Fach Bioinformatik promoviert. Nach einigen Jahren an der LMU München und dem dortigen Standort des Deutschen Krebsforschungszentrums arbeitet er ebenfalls als Postdoc am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI in der Abteilung Bioinformatik, zunehmend in medizininformatisch geprägten Projekten. Auch er unterrichtet an der Universität Bonn im Studiengang Life Science Informatics. Vera Weil hat Mathematik und Informatik studiert und anschließend im Fach Informatik promoviert. Sie hat zwei Jahre als Postdoc an der RWTH Aachen am Institut für Management Science gearbeitet. Seit einiger Zeit lehrt sie an der Universität zu Köln im Fach Informatik und unterrichtet dort im Wesentlichen das Programmieren mit Java.

Jens Dörpinghaus hat Mathematik und Informatik studiert. Nach einigen Jahren am Deutschen Zentrum für neurodegenerative Erkrankungen arbeitet er seit einiger Zeit als Postdoc am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI (Sankt Augustin) in der Abteilung Bioinformatik. Er unterrichtet an der Universität Bonn im Studiengang Life Science Informatics. Sebastian Schaaf hat Biologie und Bioinformatik studiert und anschließend im Fach Bioinformatik promoviert. Nach einigen Jahren an der LMU München und dem dortigen Standort des Deutschen Krebsforschungszentrums arbeitet er ebenfalls als Postdoc am Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI in der Abteilung Bioinformatik, zunehmend in medizininformatisch geprägten Projekten. Auch er unterrichtet an der Universität Bonn im Studiengang Life Science Informatics. Vera Weil hat Mathematik und Informatik studiert und anschließend im Fach Informatik promoviert. Sie hat zwei Jahre als Postdoc an der RWTH Aachen am Institut für Management Science gearbeitet. Seit einiger Zeit lehrt sie an der Universität zu Köln im Fach Informatik und unterrichtet dort im Wesentlichen das Programmieren mit Java.

Einleitung


Die Biologie mit all ihren vielfältigen Teilgebieten wie Botanik, Zell- und Molekularbiologie, Genetik oder Humanbiologie ist als ein reges Forschungsfeld in stetem Wandel. Sie ist gleichzeitig, mehr als andere Domänen, ständigen Wechselwirkungen mit angrenzenden Bereichen wie Chemie, Physik oder Medizin und seit einigen Jahrzehnten auch technischeren Bereichen wie der Informatik unterworfen. Gerade durch die Interaktion mit der Informatik hat sich ein eigenes Fachgebiet entwickelt, die Bioinformatik. In der Praxis führt das dazu, dass bei vielen Naturwissenschaftlern inzwischen weitreichende Programmiererfahrungen vorhanden sind, die deutlich über Tabellenkalkulationsprogramme hinausgehen und nicht nur die Thematik der Handhabung wissenschaftlicher Daten umfasst.

Zugleich hat sich in den letzten Jahren die Biologie gemeinsam mit der Medizin, der Chemie sowie den Pflege- und den Agrarwissenschaften zu einem spannenden, interdisziplinären Feld entwickelt: den Lebenswissenschaften (engl. Life Sciences). In diesem Gebiet fließen die Grenzen der »klassischen« Disziplinen zusehends ineinander. Ein Buch, das sich lediglich mit der Schnittmenge zwischen Biologie und Informatik beschäftigt, erscheint uns daher nicht weitreichend genug. Wir haben uns das Ziel gesteckt, den Bogen hier wesentlich weiter zu spannen.

Dementsprechend geht es in diesem Buch primär darum, angewandte Probleme der Lebenswissenschaften mithilfe der Informatik zu lösen. Es wird dabei nur so weit auf biologische oder medizinische Hintergründe eingegangen, wie es für das Verständnis des Buchs nötig ist. Das Vorgehen wird mit viel Beispielcode, teilweise im Stil eines Kochbuchs, dargestellt. Wann immer möglich, sollen Übungsaufgaben und Praxisprojekte tiefer in die Materie führen.

In diesem Buch werden vor allem folgende allgemeine Themenbereiche behandelt:

  • Big Data: die Verarbeitung einer großen Menge sich ständig ändernder Daten.
  • Das Heranziehen und Adaptieren effizienter, robuster und zuverlässiger Lösungen (insbesondere Heuristiken und Algorithmen) für bestehende Probleme.
  • Informationen über State-of-the-Art-Lösungen, -Bibliotheken und -Algorithmen.

Somit werden alle wichtigen Grundlagen für Studierende und Praktiker in den Lebenswissenschaften, der Biologie, der Bioinformatik und anderen Fächern behandelt: Wie werden Daten und Informationen verwaltet (sogenanntes Data Management), wie werden sie über Algorithmen und externe Bibliotheken verarbeitet, und wie werden damit schlussendlich Probleme im Sinne der zugrunde liegenden wissenschaftlichen Fragestellung gelöst? Unser Ziel ist es, Ihnen eine Vorstellung von den verfügbaren und etablierten Softwarelösungen und Konzepten sowie von generellen Herangehensweisen bei datenbasierten Problemstellungen zu vermitteln. Nicht zuletzt legen wir Wert auf Verweise darauf, wo Sie auch über dieses Buch hinaus weitere Hilfe finden können.

Entwickelt hat sich das vorliegende Buch aus zahlreichen Lehrveranstaltungen, die die Autoren an den Universitäten Bonn, Köln und München über die vergangenen Jahre hinweg angeboten haben; hinzu kommen die eigenen Erfahrungen aus der fachlichen und beruflichen Praxis. Wir haben während der Ausarbeitung und schriftlichen Niederlegung der Kursmanuskripte von der interdisziplinären Arbeit zwischen Mathematik, Informatik, Biologie und den weiteren Lebenswissenschaften stark profitiert und hoffen, dies an Sie weitergeben zu können. Unser Dank gilt auch den Generationen von Studenten, die durch ihre Rückfragen und Rückmeldungen die Darstellung geschärft haben und dadurch helfen konnten, den Fokus dieses Buchs entsprechend auszurichten.

Bei der Themenauswahl haben wir uns von drei Faktoren leiten lassen: Welche Themen sind derzeit wichtig und emergent? Welche Themen sind bereits langfristig in Erscheinung getreten und bleiben somit auch noch für mindestens eine weitere Generation von Bedeutung? Und zu guter Letzt haben uns natürlich auch unsere persönlichen Präferenzen und Interessen geleitet. Mehr zu den einzelnen Themen berichten wir, wenn wir den Aufbau des Buchs beschreiben.

Java in den Lebenswissenschaften


Es muss auch erwähnt werden, dass die Lebenswissenschaften ein sehr agiles Feld sind und es fast täglich zu Neuentwicklungen in den verschiedenen thematischen Bereichen wie z.B. Assays, Datentypen, Dateiformaten und Software kommt. Doch bleiben grundlegende Konzepte weitestgehend davon unberührt, und auch die Trends zur Verwendung neuer Programmiersprachen verlaufen eher langsamer. Daher erscheint es uns nach wie vor sinnvoll und wichtig, Java als Grundlage für dieses Buch anzunehmen. Java erblickte 1995 das Licht der Welt und verfügt damit über eine große Anzahl von Bibliotheken und eine große Entwicklergemeinde. Darüber hinaus zeichnet sich Java durch die hohe Prozessierungsgeschwindigkeit und seine Portabilität aus; es kann auf allen gängigen Systemen ohne Probleme ausgeführt werden.

Auch wenn der größte Teil wissenschaftlicher Infrastruktur auf Unix/Linux aufbaut, können daher die Beispiele aus diesem Buch ebenso auf Mac- oder Windows-Systemen ausgeführt und weitestgehend problemlos übernommen werden. Sollte es hier Besonderheiten geben, weisen wir an Ort und Stelle darauf hin. Die Ausnahme bildet der immer wieder vorkommende Hinweis auf BASH, insbesondere wenn es um HPC-Umgebungen (High-Performance Computing) geht. Diese Shell lässt sich unseres Wissens nur auf einer ganz kleinen Anzahl von Windows-Systemen nutzen. Auch verweisen wir bei grafischen Installationsroutinen unter Windows grundsätzlich auf andere Quellen. An manchen Stellen gehen wir also implizit von einer Unix-artigen Umgebung aus.

Kritiker mögen bemängeln, dass doch gerade in den Lebenswissenschaften Python (entstand 1991) oder Matlab (das auf die 1970er-Jahre zurückgeht) benutzt würde. Dem möchten wir allerdings entgegensetzen, dass dies schon beim Blick auf eine andere Forschungseinrichtung, in eine andere Arbeitsgruppe oder bereits bei einer konkreten Aufgabe nicht mehr der Fall sein muss. Im Gegensatz zu den oben genannten Programmiersprachen ist Java schlicht schon länger in manchen Bereichen präsent und etabliert – selbst in professionellen Umgebungen weit außerhalb der Wissenschaft. Ebenso wird es in vielen Open-Source-Projekten verwendet: Ein nicht unerheblicher Teil der verfügbaren wissenschaftlichen Software ist in Java entwickelt worden. Prominente Beispiele sind etwa das GATK-Toolkit zur Analyse von DNA-Sequenzen und die Bildverarbeitungsumgebung ImageJ. Letztlich bleibt bei dieser Fragestellung aber immer eine gewisse Ambivalenz, und deswegen blicken wir an manchen Stellen auch über Java hinaus, z.B. auf BASH.

Prinzipiell bietet sich Java auch aufgrund der Vielzahl hochqualitativer kostenloser Tutorials für einen Start in die Programmierung und speziell in die Objektorientierung an. Wir setzen daher explizit einfache Programmierkenntnisse voraus – mehr dazu im folgenden Abschnitt. Die Vorkenntnisse, sofern sie nicht in Java vorliegen, können sehr leicht auf Java übertragen werden, und auch umgekehrt profitieren Sie von den neuen Erkenntnissen aus diesem Buch, wenn Sie in anderen Sprachen programmieren. Probleme, die nur in einer speziellen Sprache gelöst werden können, gibt es heutzutage nur noch sehr selten – aber es gibt viele Probleme, die sich in Java besonders einfach lösen lassen.

Zielgruppe und Voraussetzungen dieses Buchs


Zielgruppe dieses Buchs sind Studierende, Berufstätige und Dozenten der Biologie, der Bioinformatik, der Informatik, der Life Sciences und allen verwandten Naturwissenschaften. Sie sollten Grundkenntnisse im Bereich der Biologie und Lebenswissenschaften sowie Kenntnisse mindestens einer höheren Programmiersprache mitbringen – oder zumindest die Bereitschaft, sich entsprechend einzulesen.

Wenn Sie Grundkenntnisse in der Algorithmik mitbringen, werden Sie diesem Buch schneller folgen können. Wir setzen dies aber bewusst nicht voraus, stattdessen verweisen wir stets auf die Grundlagenkapitel in diesem Buch und beschreiben – wann immer es nötig ist – die Algorithmen und Herangehensweisen. Der Leser soll zu einem selbstständigen Herangehen motiviert werden. Wir geben allerdings zu bedenken, dass dieses Buch kein allumfassendes Kompendium zu dieser Thematik anbietet, sondern den Leser mit entsprechenden Verweisen weiterleitet.

Aufbau dieses Buchs


Die ersten drei Kapitel sind als Grundlagenkapitel zu verstehen. In Kapitel 1, Einführung in die Arbeit mit Java, widmen wir uns der Einrichtung der Arbeitsumgebung, der Versionsverwaltung und dem Build-Tool Maven. Hier liegt der Fokus auf der Software und den Tools. Gerade für Anwender, die nur gelegentlich mit Java arbeiten, ist dieses Kapitel dringend zu empfehlen. Dabei werden wir uns allerdings nicht mit den Tiefen von Maven beschäftigen, sondern eine praxisgerechte Schnelleinführung geben. Ziel ist es, alle Aufgaben in diesem Buch schnell...

Erscheint lt. Verlag 15.12.2020
Reihe/Serie Programmieren mit dpunkt
Programmieren mit Java
Programmieren mit Java
Verlagsort Heidelberg
Sprache deutsch
Themenwelt Mathematik / Informatik Informatik
Schlagworte Bildanalyse • Biodata-Mining • Biologie • Data Mining • Datenanalyse • Datenauswertung • Informatik • Naturwissenschaften • Netzwerkanalyse • Programmierung • Sequenzanalyse • Text Mining
ISBN-10 3-96010-343-3 / 3960103433
ISBN-13 978-3-96010-343-1 / 9783960103431
Haben Sie eine Frage zum Produkt?
EPUBEPUB (Wasserzeichen)
Größe: 3,5 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Konzepte, Methoden, Lösungen und Arbeitshilfen für die Praxis

von Ernst Tiemeyer

eBook Download (2023)
Carl Hanser Verlag GmbH & Co. KG
69,99
Konzepte, Methoden, Lösungen und Arbeitshilfen für die Praxis

von Ernst Tiemeyer

eBook Download (2023)
Carl Hanser Verlag GmbH & Co. KG
69,99
Der Weg zur professionellen Vektorgrafik

von Uwe Schöler

eBook Download (2024)
Carl Hanser Verlag GmbH & Co. KG
29,99