In diesem Artikel schauen wir uns stetige Zufallsvariablen im Allgemeinen an. Spezielle Verteilungen wie die Exponentialverteilung oder Normalverteilung findet man im Abschnitt „Verteilungen“ im Inhaltsverzeichnis.

Im linken Bild sieht man ein Beispiel einer Dichte für eine stetige Zufallsvariable. Die gestrichelte Linie markiert den Erwartungswert von X. Rechts ist die Verteilungsfunktion derselben Zufallsvariablen abgebildet. Die gestrichelte Linie hier markiert das 30%-Quantil, das wir genau wie bei diskreten Zufallsvariablen bestimmen.
Dichte
Jede Dichtefunktion einer stetigen Zufallsvariablen hat zwei Eigenschaften:
- Die Funktion hat nirgends einen negativen Wert, ist also auf den gesamten reellen Zahlen entweder 0 oder größer als 0. Mathematisch ausgedrückt:
für alle . - Die Fläche unter der gesamten Dichtefunktion (ihr Integral) ergibt 1. Das ist analog zur Dichte bei diskreten Zufallsvariablen, wo die Summe aller ihrer einzelnen Wahrscheinlichkeiten 1 ergibt.
Der große Unterschied zwischen diskreten und stetigen Zufallsvariablen ist, dass die Dichte hier, bei stetigen Zufallsvariablen, nicht die Wahrscheinlichkeit für einen beliebigen Punkt repräsentiert. Im stetigen Fall ist es nun so, dass die Wahrscheinlichkeit für ein bestimmtes, festes Ergebnis immer Null ist. Im Beispielbild oben ist etwa
Im stetigen Fall kann man Wahrscheinlichkeiten nur für Intervalle bestimmen. Man kann also z.B. sagen, dass

Die Wahrscheinlichkeit, dass das Ergebnis unserer Zufallsvariablen zwischen 1 und 2 liegt, notieren wir mit
Verteilungsfunktion
Die Verteilungsfunktion
Sie wird jetzt nicht über die Summe der Dichte berechnet, sondern weil wir ja unendlich mögliche Werte für

Links sieht man die Dichtefunktion. Die Wahrscheinlichkeit, dass
Es gilt also:
Wer sich nun wundert, warum wir auf einmal
Möchten wir also die Wahrscheinlichkeit wissen, dass
Oft interessiert uns aber auch die Wahrscheinlichkeit, dass

Im ersten Schritt (weiter oben) berechneten wir

Im letzten Schritt ziehen wir
Formel oder Verteilungstabelle?
Die Dichte von allen relevanten Zufallsvariablen ist immer als Formel darstellbar. Es ist zum Beispiel für eine normalverteilte Variable
Quantilsfunktion
Die Quantilsfunktion
Die Umkehrfunktion von
Genauso macht man das bei der Quantilsfunktion: Man löst die Formel der Verteilungsfunktion nach
Umwandeln von der Dichte zur Verteilungsfunktion/Quantilsfunktion und wieder zurück
Eine Zufallsvariable ist schon eindeutig beschrieben, wenn man nur eine der drei Funktionen (Dichte, Verteilungsfunktion, oder Quantilsfunktion) hat. Man kann nämlich eindeutig zwischen den dreien hin- und herrechnen:
- Die Dichte ist die Ableitung der Verteilungsfunktion:
- Die Verteilungsfunktion ist die Fläche unter der Dichte, d.h. das Integral der Dichte:
- Die Quantilsfunktion ist die Umkehrfunktion der Verteilungsfunktion:
- Die Verteilungsfunktion ist die Umkehrfunktion der Quantilsfunktion:
Erwartungswert
Hinter dem Erwartungswert einer stetigen Zufallsvariable steckt genau dieselbe Idee wie im diskreten Fall. Hier wird lediglich statt der Summe ein Integral verwendet. Im diskreten Fall haben wir über alle möglichen Ausprägungen
Varianz und Standardabweichung
Auch die Varianz ist im stetigen Fall ähnlich aufgebaut wie bei diskreten Zufallsvariablen:
wobei
Meistens ist es einfacher, statt diesem komplizierten Integral den Verschiebungssatz anzuwenden. Die Varianz ist äquivalent bestimmbar als
Dabei ist der zweite Teil,
Dieses Integral ist leichter zu berechnen als das vorherige, und wenn man den Erwartungswert eh schon bestimmt hat, ist man mit dieser Methode meist schneller am Ziel. In der folgenden Beispielaufgabe bestimmen wir u.a. die Varianz, und verwenden beide Methoden, um den Unterschied zu sehen.
Beispielaufgabe
Als Beispiel schauen wir uns eine Zufallsvariable
Für diese Dichte werden wir nun
- die Funktion skizzieren
- nachweisen, dass es sich tatsächlich um eine Dichte handelt
- ihren Träger bestimmen
- den Erwartungswert berechnen
- die Varianz berechnen
- ihre Verteilungsfunktion bestimmen
- ihre Quantilsfunktion bestimmen
- die Wahrscheinlichkeit, dass
zwischen 0.5 und 0.6 liegt, bestimmen
Skizze der Funktion
Die Dichte
Ist es tatsächlich eine Dichte?
Um nachzuweisen dass eine Funktion
- Die Funktion darf auf den kompletten reellen Zahlen nicht negativ sein:
für alle . - Das Integral der Dichte, über die gesamten reellen Zahlen, muss 1 ergeben:
.
Die erste Eigenschaft ist schnell nachgewiesen: Im Bereich von 0 bis 1 ist
Um die zweite Eigenschaft nachzuweisen müssen wir also die Dichte integrieren. Zuerst teilen wir das Integral von
Der erste und dritte Teil fällt sofort weg: Die Fläche unter der Funktion, die konstant Null ist, ist natürlich auch Null. Wir integrieren also nur den Teil von 0 bis 1:
Das Integral ist also insgesamt 1, und damit ist
Was ist der Träger der Zufallsvariablen?
Der Träger einer Zufallsvariablen ist einfach die Menge aller möglichen Ergebnisse von
Was ist ihr Erwartungswert ?
Für den Erwartungswert wenden wir die Formel von oben an. Wir teilen das Integral wieder in drei Teile auf, wobei die Teile von
Vorsicht: Im Integral steht hier nicht nur
Somit ist
Was ist ihre Varianz ?
Die Varianz können wir mit zwei Methoden bestimmen. Zuerst verwenden wir die Methode mit Verschiebungssatz:
Da
Für den ersten Teil wenden wir die Transformationsregel an. Das Integral ist wieder nur im Bereich von 0 bis 1 ungleich Null, also interessiert uns nur dieser Bereich. Es ist ein häufiger Fehler, die Grenzen des Integrals bei
Und damit können wir die Varianz bestimmen:
Damit sind wir fertig:
Nur um zu sehen, wie kompliziert es ohne dieser Regel ist, berechnen wir die Varianz hier nocheinmal mit der ursprünglichen Formel (ich ersetze hier
Was ist ihre Verteilungsfunktion ?
Die Verteilungsfunktion an der Stelle
Da die Dichte stückweise definiert ist, d.h. einmal von
Die Fläche unter der Dichte von
Für den Bereich von 0 bis 1 müssen wir wieder ein Integral lösen:
Und schließlich, im Bereich von
Was ist die Quantilsfunktion ?
Die Quantilsfunktion ist nur von 0 bis 1 definiert, und ist in diesem Bereich die Umkehrfunktion der Verteilungsfunktion
Das lösen wir jetzt nach
Und das ist auch schon die Quantilsfunktion (nicht vergessen, nur im Bereich von 0 bis 1!)
Was ist die Wahrscheinlichkeit, dass zwischen 0.5 und 0.6 liegt?
Wir möchten also
Die Wahrscheinlichkeit liegt also bei 0.11.
In der komplizierteren Variante würden wir die Fläche unter der Dichte im Bereich von 0.5 bis 0.6 bestimmen, wir würden also das folgende Integral lösen:
Für die Wahrscheinlichkeit, dass X zwischen zwei Werten, z.B. zwischen 0.5 und 1.5 liegt, wurde gesagt, dass:
P(0.5 <= X <= 1.5) = P(X <= 1.5) – P(X <= 0.5) = F(1.5) – F(0.5) ist. Aber verlieren wir dabei nicht P(X=0.5), also ist nicht eigentlich P(X <= 1.5) – P(X <= 0.5) = P(0.5 < X <= 1.5)? D.h. wir müssten hier noch die Dichtefunktion für 0.5 hinzuaddieren?
Viele Grüße
Hi Lukas,
wenn es um diskrete Zufallsvariablen gehen würde, hättest du Recht 🙂
Aber bei stetigen Zufallsvariablen kann man die Dichte nicht einfach hinzuaddieren (dann käme man auch sehr schnell auf Wahrscheinlichkeiten größer als 1).
Bei stetigen Zufallsvariablen bedeutet die Dichte bei 0.5, also f(0.5) nicht dasselbe wie „Die Wahrscheinlichkeit dass das Ergebnis 0.5 ist“. Das (also, die Wahrscheinlichkeit dass das Ergebnis exakt 0.5 ist) ist bei stetigen Zufallsvariablen nämlich 0.
Deswegen ist mathematisch auch P(0.5 <= X <= 1.5) und P(0.5 < X < 1.5) der gleiche Wert. Ich hoffe das klärt es ein bisschen auf. Das ist ein bisschen verwirrend, ich weiß 🙂
Hi, super Artikel! Ich habe eine Frage: Wenn man die echte Dichte feststellen will, wieso lautet die Stammfunktion 2 x 0,5 x^2? Bei 2x dachte ich lautet die Stammfunktion: nur x^2 + C
Danke für Deine Hilfe 🙂
Jo, 2 * 0.5 * x^2 ist dasselbe wie x^2 🙂 Ich habs nur in ausführlich hingeschrieben.
Hallo
Von mir ebenfalls vielen Dank für die tolle Erklärung. Was mir nicht nahe kommt ist im Beispiel die Berechnung für die Verteilungsfunktion. Wann sind die Grenzen von „- unendlich“ bis „x“ und wann kann werden die Intervalle eingesetzt? Ich hatte nämlich gedacht dass Teil 1: „- unendlich bis 0“ Teil 2: „0 bis 1“ und Teil 3: „1 bis + unendlich“ lauten. Und in der Erklärung steht auch, wenn man die Verteilungsfunktion zwischen einem Intervall haben möchte, dass man dann an die Stelle von der oberen Grenze x, die Intervalle einsetzt. Wo ist mein Verständnisfehler? Liebe Grüße und vielen Dank <3
Hallo,
der Unterschied ist:
– Die Verteilungsfunktion F(x) ist definiert als , da geht es also bei los, egal wie sie aussieht. Bei der Normalverteilung ist es z.B. auch so.
– Nur bei so stückweise definierten Dichtefunktionen, so wie bei der beispielhaften hier in der Aufgabe, muss man beim Berechnen des Erwartungswerts usw. stückweise vorgehen, da f(x) ja auch stückweise definiert ist.
Das ist etwas schwer in Worten auszudrücken, leider. Die Erleuchtung kommt aber meist nach dem Rechnen einiger Aufgaben (mit Musterlösung idealerweise)
Viele Grüße
Alex
Vielen Dank Alex, ich rechne das nochmal durch, hoffentlich kommt die Erleuchtung. Ich denke aber ich weiß was du meinst!
Danke für deine schnelle Antwort. Ist eine tolle Seite.
LIebe Grüße Anuschka
Wie kommt man auf diesen Erwartungswert -.-
Ich dachte, wenn alles wegfällt, dann bleibt nur noch das Integral von 0-1 und da kam ja 1 raus wieso ist dann beim Erwartungswert 2/3? Habe irgendwie ein Denkfehler
Hi,
sorry für die späte Antwort, aber vielleicht hilft es ja noch: Das Integral ist hier nicht von f(x), dann wäre die Lösung 1.
Aber es ist x * f(x).
Vielen Dank für die guten Erklärungen hier!
Kürzlich bin ich allerdings im Rahmen des Durchstöberns von Preisbereitschaftsmessungen auf diese Methode gestoßen. Hierbei wird ein optimaler Preispunkt und am Ende der Seite eine Dichtefunktion für diesen Preis generiert.
https://de.linkedin.com/pulse/open-source-der-marktforschung-dirk-obermeier
Meine Fräge wäre, ob ich auch für eine solche sehr asymmetrische Dichtefunktion ein Quantil bestimmen kann. Brauche ich dafür Tabellen? Oder kann ich diese Dichtefunktion überhaupt richtig formelmäßig darstellen?
Ziel wäre es dann z.B. einen Wert definieren zu können, bei dem die Wahrscheinlichkeit, dass er unterschritten wird nur ein vorher definierter Prozentsatz ist.
Vielen Dank im Voraus.
Hi,
das ist keine Dichte aus der Stochastik, die mit einer einfachen Formel dargestellt werden kann, sondern eine empirische Dichte, also aus Daten gewonnen.
Dafür gibt es natürlich auch Quantile. Das sind dann wieder die empirischen Quantile. Einen Artikel dazu findest du hier: http://www.crashkurs-statistik.de/quantile/
Aus der empirischen Dichtefunktion kann man die nicht wirklich ablesen, aber aus der Verteilungsfunktion ginge es schon besser. Am besten ist natürlich, wenn man die Datenreihe vorliegen hat, dann kann man sie einfach sortieren, und die untersten 20% auswählen, und dort dann den Schnitt vornehmen, für das 20%-Quantil.
Ok vielen Dank für die schnelle Antwort.
Im Endeffekt brauche ich also die Dichtefunktion gar nicht.
Wenn ich es richtig verstanden habe gibt mir also das 20%-Quantil den Preis an (z.B. 250) der nur mit einer Wahrscheinlichkeit von 20% unterschritten wird. Das entspräche dann dem Integral der Dichtefunktion von minus unendlich bis 250, wobei ich als Ergebnis 0,2 bekomme.
Ich kann dann sagen, dass das Risiko einer Unterschreitung des Preises von 250 genau 20% beträgt?
Das ist alles richtig, bis auf ein Detail:
Das Risiko einer Unterschreitung beträgt in deinen Daten 20%. Das heißt nicht zwangsläufig, dass das Risiko in der Realität auch genau 20% ist. Durch zufällige Schwankungen in deiner Stichprobe gibt es da immer Unterschiede.
Danke.
Ja das stimmt natürlich. Das ist aber ja glaube ich grundsätzlich bei allen Risikomaßen so. Da hilft dann nur eine größere Stichprobe und das Bootstrapping-Verfahren sollte ja auch eine bessere Prognose ermöglichen.
Ich werde die Seite auf jeden Fall weiterempfehlen 🙂
Wenn ich, um die Varianz zu berechnen, den Verscheibungssatz anwende, muss ich also quasi nur ein x^2 vor die Formel setzen?
Vor das Integral für E(X^2), ja. Um die Varianz dann zu erhalten, fehlen aber noch ein paar Schritte.
Hallo zusammen,
die Erläuterungen sind wirklich klasse – vielen Dank!
Ich habe aber eine Frage zum Integrieren von der Dichte zur Verteilungsfunktion.
Muss ich nicht noch zusätzlich +C ausrechnen (über y=m*x+b oder ähnlich).
Oder kann ich das hier nicht bzw. kann ich das auch weglassen?
Danke und liebe Grüße
Jana
Hi Jana,
die Konstante musst du nur addieren wenn es um ein unbestimmtes Integral geht, also wenn die Grenzen nicht angegeben sind.
Bei uns geht es nur um bestimmte Integrale, die Grenzen sind immer mit angegeben (auch wenn es mal z.B. sein kann.
Ich sollte das im Artikel vielleicht ausführlicher beschreiben. Demnächst. 🙂
Hier ist aber auch eine gute Erklärung dazu: https://de.serlo.org/mathe/funktionen/stammfunktion-integral-flaechenberechnung/integrale/bestimmtes-unbestimmtes-integral
Viele Grüße,
Alex
Danke für den tollen Artikel!
Was mir mein Statistik – Professor in 3 Monaten nicht beibringen konnte, hast du in einem Artikel geschafft. Vielen Danke dafür, jetzt sehe ich nicht mehr ganz so Schwarz für meine Klausur am Donnerstag 😀
Beim letzten Satz beim Abschnitt „Varianz und Standardabweichung“ ist ein kleiner Tippfehler.
Behoben. Vielen Dank! 🙂