Grundlagen medizinischer Statistik (eBook)
507 Seiten
Dr. R. Kaden Verlag GmbH & Co. KG
978-3-942825-52-8 (ISBN)
Prof. Dr. med. Dr. phil. Bartholomäus Böhm ist Professor für Chirurgie. Er hat jahrelange Erfahrung als Chefarzt und Hochschullehrer. Weitere Informationen unter www.berlin-chirurgie.com.
Prof. Dr. med. Dr. phil. Bartholomäus Böhm ist Professor für Chirurgie. Er hat jahrelange Erfahrung als Chefarzt und Hochschullehrer. Weitere Informationen unter www.berlin-chirurgie.com.
3. Merkmale und Eigenschaften
Wir beginnen mit etwas ganz Einfachem. Wir betrachten Eigenschaften oder Merkmale von Gegenständen. Was würden wir denken, wenn wir von 0,5 Liter Milch oder 22,7 Katzen sprechen würden? Im ersten Fall wäre es einfach eine Packung Milch, die es in verschiedenen Größen gibt. Milch lässt sich offenbar in verschiedene Mengen abfüllen. Eine Katze ist dagegen eine Katze, wenn sie noch leben sollte. Katzen lassen sich zwar zählen, aber immer nur als Ganzes. Die Rede von 22,7 Katzen ist auf den ersten Blick unverständlich. Es sei denn man versteht sie als statistische Größe im Sinne von „im Durchschnitt besitzen 1000 Einwohner in unserer Stadt 22,7 Katzen“. Niemand würde aber ernsthaft versuchen, die 0,7 Katzen zu suchen oder zu hinterfragen, welche Teile bei der Katze fehlen. Egal, um welche Gegenstände es sich handelt, wir müssen sorgfältig unterscheiden, ob wir die Gegenstände nur als Ganzes zählen oder in beliebige Mengen einteilen können.
Beginnen wir mit einer kleinen Studie. Wir wollen die Haarfarbe der nächsten zehn Menschen in unserer Umgebung bestimmen und teilen sie zunächst in drei Farben ein: Schwarz, brünett und blond. Die erste Schwierigkeit, auf die wir dabei treffen, ist die eindeutige Zuordnung jeder einzelnen Person zu einer dieser drei Haarfarben. Es wird nämlich Haarfarben geben, die wir genau zwischen zwei Gruppen einordnen würden, so dass wir uns nicht richtig entscheiden können, welcher Gruppe wir sie zuordnen sollen.
Es könnte auch sein, dass die Haarfarben der zehn Personen so verschieden sind, dass wir sie nicht sinnvoll in drei Gruppen einteilen können. Wir könnten uns deshalb darauf verständigen, dass wir die zehn Menschen jeweils einer eigenen Gruppe zuordnen, um allen Unterschieden gerecht zu werden. Wir hätten dann zehn Gruppen mit jeweils einer Person und könnten so zehn Haartönungen definieren, welche wir wiederum nach Helligkeit und Farbe ordnen. Allerdings hätten wir dadurch keine Vereinfachung erreicht. Wir hätten lediglich der Vielfalt Genüge getan.
Führen wir nun denselben Versuch bei den nächsten 100 Personen in unserem Umfeld durch und versuchen wir uns jetzt an die zehn vorherigen Gruppierungen zu halten. Natürlich wird sich bei so vielen Personen die Vielfalt der Haarfarben erweitert haben. Vielleicht bemerken wir zufällig mehr rötliche Töne in einer Untergruppe von jüngeren Menschen, so dass wir uns genötigt sehen, fünf neue Haartöne einführen. Wir verfügen dann über 15 Farben bzw. Haartönungen.
Jemand könnte uns nun darauf hinweisen, dass wir noch zwischen natürlicher und gefärbter Haarfarbe unterscheiden sollten. Da uns aber nur das gegenwärtige Erscheinungsbild interessiert und nicht die angeborene Haarfarbe, belassen wir es bei der tatsächlichen Haarfarbe. Wir berücksichtigen auch keine andersfarbigen Haarsträhnen o.ä. und beziehen uns nur auf den überwiegenden Farbeindruck. Wenn wir tatsächlich alle Details berücksichtigen wollten, dann würden wir im Extremfall wieder bei 100 unterschiedlichen Beschreibungen enden und hätten dann
Als wir mit unserer Aufgabe begannen, klang sie relativ einfach. Was sollte daran so schwierig sein, die Personen in unserer Umgebung nach ihrer Haarfarbe in verschiedene Gruppen einzuteilen? Im Laufe des Versuchs traten dann Probleme auf, wie sie in jeder Studie in unterschiedlicher Intensität auftreten. Wir sollten deshalb bei allen Studien darauf achten, durch welche begrifflichen Bestimmungen Gruppen gebildet werden.
Bei unserer Einteilung der Haarfarben schwanken wir zwischen zwei Extremen: Wir wollen einerseits eine möglichst genaue individuelle Haarbeschreibung berücksichtigen und andererseits Individuen mit ähnlicher Haarfarbe zusammenfassen bzw. klassifizieren. Wenn wir aber mehrere Individuen in einer Gruppe zusammenführen, dann müssen wir zwangsläufig auf einige individuelle Details verzichten und diese differenzierten Informationen gehen dabei verloren. Wenn wir mehrere Personen in einer Gruppe mit ähnlicher Haarfarbe zusammenfassen, dann setzt das voraus, dass sich die Farben tatsächlich ähneln. Wie ähnlich sie sein müssen, werden wir festlegen müssen, damit die Einteilung reproduzierbar ist und verschiedene Personen auch zu derselben Einteilung gelangen – natürlich mit einer gewissen Schwankungsbreite. Es ist uns aber bewusst, dass es immer Grenzfälle geben wird, bei denen es schwerfällt, Individuen einer Gruppe zuzuordnen.
Warum wollen wir Individuen überhaupt zu Klassen oder Gruppen zusammenfassen? Warum erfassen wir nicht so viel Individualität wie möglich? Weil wir dann keine Übersicht mehr gewinnen könnten. Um komplexe Daten oder große Datenansammlungen übersichtlich und informativ zusammenzufassen, benötigen wir klassifizierende Begriffe und ein spezielles Instrumentarium. Das mag auf den ersten Blick schwierig erscheinen – ist es aber nicht, oder zumindest nicht immer. Nehmen wir zum Beispiel an, wir hätten tausendmal einen Euro geworfen. Alle Würfe könnten wir sinnvoll zusammenfassen, indem wir sagen, dass wir 532 Mal Kopf geworfen haben. Hätten wir damit alle Informationen über die 1000 Würfe erfasst? Nein, natürlich nicht. Es entgeht uns erstens der gesamte Spaß, den wir dabei gehabt hätten, und wir wüssten auch nicht die genaue Reihenfolge der Zahl-/Kopfwürfe. Es hätten zum Beispiel einige Serien von Kopfwürfen geben können, deren Auftreten sehr unwahrscheinlich gewesen wäre. Wenn wir an diesen Serien interessiert gewesen wären, dann hätten wir uns die Ergebnisse im Detail ansehen müssen. Wenn wir aber nur wissen wollten, wie häufig Kopf geworfen wurde, reicht die Zusammenfassung aus.
3.1 Unterscheidungskriterien
Ein Verlust von Information entsteht immer dann, wenn wir Ergebnisse zusammenfassen und durch neue Werte ersetzen. Wir müssen vorab entscheiden, ob wir an den einzelnen Werten interessiert sind, oder ob uns die Zusammenfassung ausreicht. Und wenn sie uns ausreicht, dann können wir auf die Techniken der deskriptiven (beschreibenden) Statistik zurückgreifen, um auch aussagekräftige und sinnvolle Zusammenfassungen zu kreieren. Letztlich legen unsere Ziele und Interessen fest, welche Art der Zusammenfassung für uns geeignet ist. Dazu können wir ein grobes oder ein feines Raster wählen.
Wir haben in dem obigen Beispiel unterstellt, dass wir uns darauf geeinigt haben, wie wir die unterschiedlichen Haarfarben auswählen. Auch hier mag es Grenzfälle geben, so dass es uns schwerfallen wird, eine Farbe eindeutig und für alle nachvollziehbar zuzuordnen. Häufig verwenden wir in anderen Zusammenstellungen Begriffe wie „klein“ und „groß“, „jung“ und „alt“ oder „hoch“ und „niedrig“, die durch klare Definitionen eingeführt werden müssen, um verständlich zu sein. Eine kleine Maus und ein kleiner Elefant unterscheiden sich maßgeblich voneinander, obwohl sie beide klein sind. Was „jung“ oder „alt“ ist, wird von einem 18jährigen sicherlich anders gesehen als von einem 60jährigen.
Wie sieht es bei komplexen Begriffen wie „Arbeitsloser“ aus? Wann gilt jemand als arbeitslos? Es handelt sich hier um eine moderne soziale Definition, denn Arbeitslose hat es vor einigen Jahrhunderten noch nicht gegeben. Auch in kommunistischen Systemen waren sie nicht existent. Wenn in den Medien über die Zahl der Arbeitslosen berichtet wird, dann sollten wir doch wissen, wer damit gemeint ist. Erinnern wir uns an die Zahlenspiele, die durch die neue Definition der Arbeitslosigkeit seit der Hartz-IV-Reform ausgelöst wurden. Aus annähernd drei Millionen Arbeitslosen wurden über Nacht plötzlich fast fünf Millionen. Solche Begriffe wie „Arbeitslose“ werden heute leichtfertig in den Mund genommen, doch wir sollten auf den korrekten Gebrauch achten. Gegenwärtig definiert das Sozialgesetzbuch III §16: „Arbeitslose sind Personen, die wie beim Anspruch auf Arbeitslosengeld 1. vorübergehend nicht in einem Beschäftigungsverhältnis stehen, 2. eine versicherungspflichtige Beschäftigung suchen und dabei den Vermittlungsbemühungen der Agentur für Arbeit zur Verfügung stehen und 3. sich bei der Agentur für Arbeit arbeitslos gemeldet haben.“ Und wenn uns jemand mitteilt, dass sich die Zahl deutlich erhöht oder erniedrigt habe, dann sollten wir weder jubeln noch verzagen, sondern zunächst nach einer ganz trivialen Änderung in der Begrifflichkeit suchen.
Ein ebenso wichtiges Problem kann auftreten, wenn ein offizielles Klassifikationssystem existiert, an das sich alle halten, und wenn dieses System modifiziert bzw. verbessert wird. Wenn sich die Definition des Arbeitslosen ändert, dann können wir die Zahlen vor und nach der Änderung nicht mehr sinnvoll miteinander vergleichen. In der Medizin werden zum Beispiel bösartige Tumoren nach einem komplexen System eingeteilt, das regelmäßig verbessert wird. Manchmal werden die Einteilungen einzelner Tumore grundlegend neu festgelegt, so dass die beiden Klassifikationen nicht mehr direkt miteinander vergleichbar sind. Die Ergebnisse vor und nach der Änderung können dann nicht mehr miteinander kombiniert werden.
3.2 Häufigkeiten
Welche Möglichkeiten haben wir, die Ergebnisse unserer Haarstudie zu präsentieren?
Abb. 3-1 Befragung von Politikern nach der Wahl des Bundespräsidenten
Wie können wir anderen Personen mitteilen, welche Haarfarben wir bei den 100 untersuchten Personen gefunden haben? Wir könnten die Haarfarben nach einer Tönung sortieren und dann eine vollständige Liste aller Personen aufstellen. Übersichtlich ist das aber nicht, so dass wir deshalb die 15 Tönungen...
Erscheint lt. Verlag | 19.5.2017 |
---|---|
Verlagsort | Heidelberg |
Sprache | deutsch |
Themenwelt | Mathematik / Informatik ► Mathematik ► Statistik |
Mathematik / Informatik ► Mathematik ► Wahrscheinlichkeit / Kombinatorik | |
Technik | |
Schlagworte | Grundlagen • Medizin • Statistik |
ISBN-10 | 3-942825-52-X / 394282552X |
ISBN-13 | 978-3-942825-52-8 / 9783942825528 |
Haben Sie eine Frage zum Produkt? |
Größe: 8,1 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich