Binomialverteilung

Idee

Die Binomialverteilung entsteht, wenn man ein Bernoulli-Experiment mehrere Male wiederholt, und an der gesamten Anzahl der Erfolge interessiert ist.

Im vorherigen Artikel zur Bernoulliverteilung haben wir ein Beispiel betrachtet, in dem wir auf einem Schießstand am Jahrmarkt einen einmaligen Schuß mit einer Trefferwahrscheinlichkeit von p=0.2 abgeben. Wenn wir nun sechs Schüsse kaufen, folgt die Gesamtzahl der Treffer einer Binomialverteilung mit n=6 und p=0.2, oder:

 X \sim B(6, 0.2)

Klausuraufgaben

Träger

Bei sechs Schüssen auf dem Schießstand können wir zwischen 0 und 6 jede Trefferzahl haben. Man darf hier die Null nicht vergessen, das kann leicht vorkommen. Es ist nämlich durchaus möglich, gar keine Treffer zu landen. Der Träger im allgemeinen Fall sind alle Ganzzahlen von 0 bis n, also

 \mathcal{T} = \{0, 1, \ldots, n\}

Dichte

Die Dichte der Binomialverteilung mit den Parametern n und p lautet

 f(x) = {n \choose x} p^x (1-p)^{n-x}

Erinnert euch, dass für diskrete Zufallsvariablen die Bezeichnungen f(x) und \mathbb{P}(X=x) dasselbe bedeuten. Die Wahrscheinlichkeit für drei Treffer ist also \mathbb{P}(X=3), oder kurz f(3).

Der Wert {n \choose k} ist dabei der Binomialkoeffizient, der im Artikel Mathematische Symbole erklärt wird, und auch in der Kombinatorik angewendet wird.

Wenn man versteht, wie diese Formel zustandekommt, kann man sie sich sogar selbst herleiten, und muss nicht in einer Formelsammlung nachsehen (wenn nicht, ist das aber auch nicht so schlimm).

verteilungen-binomialverteilung-dichte

Die Dichte der Binomialverteilung mit n=6 und p=0.2. Man sieht, dass man mit hoher Wahrscheinlichkeit zwischen 0 und 3 Treffer erhalten wird. 5 oder 6 Treffer zu bekommen, ist sehr unwahrscheinlich.

Am Beispiel des Schießstandes: Die Wahrscheinlichkeit, dass wir zwei Treffer erhalten werden, ist laut Formel f(2) = {6 \choose 2} (0.2)^2 (0.8)^4. Interpretiert wird das so:

Die Wahrscheinlichkeit für einen Treffer (kurz: "T") ist 0.2, die für eine Niete (kurz: "N") ist 0.8. Wenn wir nun die Wahrscheinlichkeit für die Ergebnisfolge "TTNNNN" ausrechnen, multiplizieren wir die Wahrscheinlichkeiten, und landen bei 0.2^2 \cdot 0.8^4. Dies ist aber nur eine von vielen Möglichkeiten, zwei Treffer zu erhalten. Zum Beispiel liefern die Schussfolgen "TNNNNT", oder "TNTNNN" dasselbe Ergebnis, und haben alle dieselbe Wahrscheinlichkeit: 0.2^2 \cdot 0.8^4.

Wieviele solcher Folgen mit zwei Treffern aus sechs Schüssen gibt es nun? Es sind genau {6 \choose 2} = 15, wie im Artikel Kombinationen erklärt wird.

So erklärt man sich also nacheinander die drei Faktoren der Formel, zuerst p^x (die Wahrscheinlichkeit für einen Treffer, potenziert mit der Anzahl an Treffern), dann (1-p)^{n-x} (die Wahrscheinlichkeit für eine Niete, potenziert mit der Anzahl an Nieten), und dann n \choose k

Zwischenaufgabe

Berechne für das Beispiel Schießstand die Wahrscheinlichkeit, gar keinen Treffer zu erhalten, und überprüfe anhand der Abbildung oben, ob das Ergebnis plausibel ist.

Lösung (klick)

Verteilungsfunktion

Für die Verteilungsfunktion gibt es hier keine einfache Formel. In manchen Büchern (oder Klausuren) gibt es eine Verteilungstabelle zum einfachen Ablesen. In allen anderen Fällen muss man die einzelnen Wahrscheinlichkeiten also von Hand summieren. Das heisst, wenn man die Wahrscheinlichkeit für höchstens zwei Treffer berechnen möchte, also \mathbb{P}(X \leq 2), rechnet man sich die Wahrscheinlichkeit für null Treffer, einen Treffer, und zwei Treffer aus, und summiert sie:

 \begin{align*} \mathbb{P}(X \leq 2) &= \sum_{x=0}^2 \mathbb{P}(X = x) \\ &= \mathbb{P}(X = 0) + \mathbb{P}(X = 1) + \mathbb{P}(X = 2) \end{align*}

verteilungen-binomialverteilung-verteilungsfunktion

Anhand der Verteilungsfunktion kann man auch ablesen, dass die Wahrscheinlichkeit, höchstens 4 Treffer zu erhalten, schon nahezu 1 ist.

Zwischenaufgabe

Berechne die Wahrscheinlichkeit für höchstens fünf Treffer, d.h. \mathbb{P}(X \leq 5).

Lösung (klick)

Das war ziemlich aufwändig, oder? Bei der Binomialverteilung gibt es einen Trick, der die Berechnung der Verteilungsfunktion oft schneller machen kann. Solche Aufgaben kommen oft in Klausuren vor, so dass man diesen Trick am besten verinnerlicht:

Statt alle Wahrscheinlichkeiten von x=0 bis x=5 aufzusummieren, kann man äquivalent die Wahrscheinlichkeiten aller "Gegenereignisse", also in diesem Fall f(6), von 1 abziehen, und man erhält dieselbe Zahl. Denn wenn die Wahrscheinlichkeit für höchstens fünf Treffer 0.9999 ist, dann ist die Wahrscheinlichkeit für mehr als fünf (also 6) Treffer genau die Gegenwahrscheinlichkeit, d.h. 1-0.9999 = 0.0001.

Ein weiteres Beispiel (und wer das nachvollziehen kann, hat die Idee vollständig kapiert):

Uns interessiert nun die Wahrscheinlichkeit, zwischen einem und fünf Treffern (inklusive der eins und der fünf) zu erhalten. Die folgenden drei Formulierungen entsprechen den jeweiligen Formeln, und alle drei Formeln drücken genau dasselbe aus:

\mathbb{P}(1 \leq X \leq 5)
Die Wahrscheinlichkeit, eine Trefferzahl zwischen (inklusive) 1 und 5 zu erhalten
\mathbb{P}(X=1) + \mathbb{P}(X=2) + \mathbb{P}(X=3) + \mathbb{P}(X=4) + \mathbb{P}(X=5)
Die Wahrscheinlichkeit für einen, zwei, drei, vier, oder fünf Treffer
1 - \mathbb{P}(X=0) - \mathbb{P}(X=6)
Die Wahrscheinlichkeit, alles außer 0 und 6 Treffer zu erhalten

Ausrechnen kann man diesen Wert nun über die zweite oder dritte Formel dieser Liste. Es kommt natürlich dieselbe Zahl raus, wobei der letztere Weg der schnellere ist. Wichtig ist hier aber, dass man die Wahrscheinlichkeit für null Treffer, also f(0), nicht vergisst. Das passiert im Eifer des Gefechts nämlich gerne.

Erwartungswert

Der Erwartungswert der Binomialverteilung ist einfach:

 \mathbb{E}(X) = n \cdot p

Da der Erwartungswert für ein einzelnes Experiment p ist (siehe Bernoulliverteilung), erwartet man bei n Wiederholungen genau die n-fache Anzahl, also n\cdot p Treffer.

Varianz

Die Varianz der Binomialverteilung ist

 \mathbb{V}(X) = n \cdot p \cdot (1-p).

Die Herleitung ist etwas aufwändiger, weshalb wir sie uns hier ersparen.

9 Gedanken zu „Binomialverteilung

  1. Jones

    Es gibt noch die Formel X + Y ~ B(n + m, p) . Diese gilt bei Unabhängigkeit. Könntest DU dazu evtl. ein Beispiel erklären?

    Antworten
  2. Marvin

    Hallo,
    Sollte die Lösung für die Wahrscheinlichkeit bei höchstens fünf Treffern nicht eigentlich lauten:
    ∑5i=0P(X=i)=0.2621+0.3932+0.2458+0.0819+0,0154+0.0015=0.9999
    So wie es da steht, würde bei der Addition nicht 0,9999 heraus kommen

    Mit freundlichen Grüßen

    Antworten
    1. AlexAlex Beitragsautor

      Hi Marvin,
      ja, da habe ich beim Abschreiben P(X=4) übersehen 🙂
      Vielen Dank für die Info, ich habs gerade korrigiert!
      Gruß,
      Alex

      Antworten
      1. Caro

        Müsste über dem Summenzeichen nicht auch statt der 4 eine 5 stehen?
        Sind übrigens alles super Erklärungen hier!!!

        Antworten
  3. Anna

    Hallo!
    Sollte die Formel für die Dichte heißen :
    (n über k)*p^k*(1-p)^n-k

    also entweder alles mit k, oder alles mit x, dann sollte es aber auch n über x sein.

    Viele Grüße

    Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.