Dieser Artikel beschreibt Eigenschaften, die allen Zufallsvariablen mit diskreten Verteilungen zugrunde liegen. Für Eigenschaften spezieller Verteilungen, z.B. der Poissonverteilung, verweise ich auf den Abschnitt „Verteilungen“ im Inhaltsverzeichnis.

Im linken Bild sieht man die Dichte einer diskreten Zufallsvariable. Man sieht, dass die Wahrscheinlichkeit f(x) für die Ergebnisse 2 und 3 am höchsten ist. Der Erwartungswert E(X) ist 3, und ist mit einer gestrichelten Linie eingezeichnet. Im rechten Bild sieht man die entsprechende Verteilungsfunktion derselben Zufallsvariablen. Außerdem ist das 30%-Quantil eingezeichnet. Man bestimmt es, indem man von der y-Achse auf der Höhe des Quantils (bei uns 0.3) waagerecht nach rechts bis zur Verteilungsfunktion geht, und dann das Lot nach unten fällt. Unser 30%-Quantil ist also 2.
Dichte
Eine Zufallsvariable
Wir verwenden die Dichte, um Wahrscheinlichkeiten für ein einzelnes, oder mehrere mögliche Ergebnisse zu berechnen.
Im Beispiel mit einem Würfelwurf können wir die Dichte wie folgt darstellen:
Das geht natürlich auch kürzer. Äquivalent können wir schreiben:
Hiermit können wir z.B. die Wahrscheinlichkeit ablesen, dass wir eine 4 würfeln:
Außerdem können wir uns mit der Dichte z.B. herleiten, mit welcher Wahrscheinlichkeit wir eine ungerade Zahl würfeln:
Damit eine Funktion eine echte Dichte sein kann, muss sie zwei Bedingungen entsprechen:
- Sie darf nirgends kleiner als Null sein. Es muss also gelten:
für alle . Diskrete Dichten sind, wie der Name schon sagt, nur an einigen diskreten Punkten größer als Null, und auf den restlichen reellen Zahlen gleich Null. - Die Summe aller ihrer einzelnen Wahrscheinlichkeitswerte muss 1 ergeben. Das macht Sinn, da ja die Wahrscheinlichkeit, dass irgendein beliebiges Ergebnis eintritt, 1 ist.
Verteilungsfunktion
Die Verteilungsfunktion ist eine weitere Variante, eine Zufallsvariable und ihre möglichen Resultate zu beschreiben. Sie drückt aus, mit welcher Wahrscheinlichkeit das Resultat kleiner oder gleich eines bestimmten Werts ist. Die Verteilungsfunktion beschreibt also
Wenn wir die Dichte einer diskreten Zufallsvariablen haben, können wir leicht die Verteilungsfunktion berechnen. Beim Würfelwurf ist z.B.
Allgemein ist die Verteilungsfunktion definiert als
Der letzte Term beschreibt genau das, was wir im Beispiel zwei Zeilen höher berechnet haben:
Die komplette Verteilungsfunktion im Spezialfall Würfelwurf ist
Quantile
Das Quantil einer Zufallsvariablen ist sehr ähnlich zum empirischen Quantil von bereits gemessenen Daten definiert. So ist etwa das 5%-Quantil einer Zufallsvariable genau der Wert von
Allgemein ist ein
Erwartungswert
Auch wenn wir nicht wissen, welches Ergebnis unser Zufallsexperiment abwirft, können wir doch berechnen, mit welchem Ergebnis wir „im Mittel“ rechnen können. Wenn wir das Experiment also sehr oft durchführen, und den arithmetischen Mittelwert aller Ergebnisse bilden, erhalten wir den Erwartungswert. Der Erwartungswert für eine Zufallsvariable
Er lässt sich zum Glück auch von der Dichte berechnen, ohne das Experiment so oft durchführen zu müssen. Dazu summieren wir alle möglichen Ausprägungen, die wir mit ihren zugehörigen Wahrscheinlichkeiten gewichten, auf:
Der Erwartungswert der Augenzahl bei einem Würfelwurf ist zum Beispiel
Bei manchen Verteilungen, wie z.B. der Poissonverteilung, gibt es unendlich viele Ausprägungen, das heisst diese Summe ist unendlich lang. Sie lässt sich aber mit Hilfe eines Tricks (der Exponentialreihe) berechnen und hat ein festes Ergebnis. Meistens steht dieses Ergebnis natürlich in Formelsammlungen und Tabellen und muss nicht von Hand berechnet werden, daher gehe ich hier nicht näher darauf ein.
Varianz und Standardabweichung

Zwei beispielhafte Dichten. Oben sieht man eine Dichte mit niedriger Varianz, das Ergebnis der Zufallsvariable bewegt sich meist im Bereich von 0 bis 5. Unten eine Zufallsvariable mit höherer Varianz, hier ist die Dichte breit gestreut.
Die Varianz einer Zufallsvariablen wird mit
Dies ist nun ein Erwartungswert einer transformierten Zufallsvariable, und mit der entsprechenden Rechenregel können wir die Varianz so formulieren und berechnen:
Auch die Varianz ist für Zufallsvariablen ähnlich definiert wie die empirische Varianz für gemessene Daten. Bei gemessenen Daten wird aber erstens mit dem arithmetischen Mittel
Die Standardabweichung
Hi, danke erstmal für so eine umfangreiche Arbeit, es hat mir schon so oft geholfen die Sachen richtig zu verstehen.
Hier ist mir eine Sache aufgefallen:
bei der Definition von Quantile ist meine meinung nach ein Fehler
F(xp)=P(X≤xp)≥p – muss das nicht kleiner gleich sein?
LG Inna
Hi Inna,
falls du das zweite Zeichen meinst, dann muss das größer/gleich sein. Die Erklärung dazu findest du hier: https://www.crashkurs-statistik.de/quantile/
VG
Alex
In der Erklärung der Varianz ist mit Mittelwert das selbe wie Erwartungswert gemeint?
Jap. Eigentlich ist Erwartungswert sogar die korrekte Bezeichnung, da es sich um Zufallsvariablen, und nicht um eine Stichprobe handelt. Ich ändere das mal schnell ab 🙂
Hi,
vielen Dank für Deine hilfreichen Erklärungen und Beispiele! 🙂
Ich habe eine Frage bezüglich der Verteilungsfunktion:
In der Definition läuft die Summe über alle i : x_i < x.
Müsste das nicht ein kleiner gleich sein, statt strikt kleiner?
Ansonsten würde in dem Beispiel bei P(X<=3) der Summand f(3) wegfallen oder?
LG
Das war tatsächlich ein Fehler – vielen Dank für den Hinweis, ich hab’s schon korrigiert! 🙂
War echt hilfreich und sehr gut beschrieben. Top danke !
Hi, erstmal danke für diesen tollen Crashkurs, dass bringt micht enorm weiter vor meiner Prüfung! 🙂
In der rechten Grafik ist das 30%- Quantil bei dem Wert 0,3 eingezeichnet, und nimmt den Wert 2 an. Aber die Formel für das Quantil ist ja n*p hier 11*0,3 = 3,3 also ungerade. Müsste es deshlab nicht
n*p+1 = 4,3 ~ 4 also x4 = 3 sein ?
Moment, du verwechselst *deskriptive* Statistik und *Wahrscheinlichkeitsrechnung*. Hier, in der Wahrscheinlichkeitsrechnung, gibt es noch keine Stichprobe. Das ist nur die Dichte einer Zufallsvariablen, quasi *bevor* irgendwelche Zahlen daraus gezogen wurden. Es gibt daher auch noch kein .
Die Formel für das Quantil ist in der Wahrscheinlichkeitsrechnung anders. Speziell in diesem Bild ist es so, dass wir erwarten, dass 5% der Daten „0“ sein werden (das sieht man an der Dichte), dann ca 15% der Daten „1“, und ca. 22% der Daten werden „2“. Insgesamt erwarten wir also, dass ca. 20% der Daten *höchstens* „1“ sind (d.h. entweder „0“ oder „1“). Das heißt, dass das 20%-Quantil hier die „1“ ist — und das sieht man auch an der Grafik der Verteilungsfunktion rechts.
Beim 30%-Quantil ist es ähnlich, allerdings nehmen wir dann die „2“. Insgesamt erwarten wir aber ca. 40% der Daten als „höchstens 2“, was heißt dass das 40%-Quantil auch noch die „2“ ist.
— Ich würde diese Antwort gerne in den Artikel mit einbauen, daher wäre es super wenn du mir kurz sagst ob du es so verstanden hast, oder ob ein Teil noch unklar ist. Das würde ich dann entsprechend ergänzen. Viele Grüße, Alex.
Danke für die ausführliche Antwort, ich denke ich habe es verstanden.
Wäre dann nach Dichtefunktion das 42%-Quantil dann also auch noch 2, da 0,05+0,15+(~0,22) = 0,42 und das auf dem Wert 2 liegt, bzw. das 64%-Quantil beim Wert 3? Analog zur Verteilungsfunktion müsste es ja passen.
Das heißt aber für mich das ich einen bestimmten Quantil-Wert wie hier z.B. das 30%-Quantil nur aus der Verteilungsfunktion herleiten kann, und sozusagen nur ein paar bestimmte Quantile aus der Dichtefunktion?
Freut mich, das ich etwas zu deinem Artikel „beitragen“ kann! 🙂
LG Jan
Ja, genau. Stimmt alles. 🙂