Was sind Zufallsvariablen?

Zufallsvariablen werden meistens mit \(X\), und manchmal mit \(Y\) oder \(Z\) beschrieben. Sie sind Variablen, mit denen wir das Ergebnis eines noch nicht durchgeführten Zufallsexperiments beschreiben. Betrachten wir zum Beispiel den Wurf eines Würfels, können wir die Zufallsvariable dafür \(X\) nennen. Vor dem Würfelwurf ist der Wert von \(X\) unbekannt, und nach dem Wurf nimmt \(X\) einen Wert von \(1, 2, 3, 4, 5, 6\) an. Diesen Wert nennt man Realisierung der Zufallsvariable, und nennt ihn verallgemeinert \(x\).

Klausuraufgaben
Im eBook-Shop gibt es Klausuraufgaben zu diesem Thema!
Zu den eBooks

Der Unterschied zwischen \(X\) und \(x\) ist also, dass \(X\) die tatsächliche Zufallsvariable ist, und keinen festen Wert hat, sondern quasi für das noch unbekannte Ergebnis des Zufallsexperiments steht, und \(x\) für eine feste Zahl steht, die für das Ergebnis nach dem Experiment steht. Man sieht also für das Beispiel Würfelwurf Schreibweisen wie \(\mathbb{P}(X=1) = \frac{1}{6}\). Da aber die Wahrscheinlichkeit für jede Augenzahl \(x=1,2,3,4,5,6\) gleich ist, schreibt man verallgemeinert \(\mathbb{P}(X=x) = \frac{1}{6}\). Gesprochen wird das so: „Die Wahrscheinlichkeit, dass X gleich x ist, beträgt ein Sechstel.“

Es ist wichtig, dass die möglichen Werte der Zufallsvariablen immer Zahlen sind. Für einen Münzwurf können wir also nicht \(\mathbb{P}(X=\text{Kopf})\) schreiben, sondern müssen die Werte vorher kodieren, z.B. in \(\text{Kopf}=0\) und \(\text{Zahl}=1\). Das ist wichtig, um später Erwartungswerte der Zufallsvariablen bilden zu können. Es ist nämlich unmöglich, den Mittelwert von \(\text{Kopf}\) und \(\text{Zahl}\) zu bilden, aber der Mittelwert von \(0\) und \(1\) ist \(0.5\).

Diskrete und stetige Zufallsvariablen

Es gibt zwei verschiedene Klassen von Zufallsvariablen. Diskrete Zufallsvariablen können nur eine endliche oder abzählbar unendliche Menge an Werten annehmen. Das bedeutet meist, dass es entweder eine feste Anzahl an Werten gibt (wie z.B. beim Würfelwurf), oder dass es sich um Zähldaten handelt, wie etwa die Anzahl an Bankkunden an einem Tag, oder die Anzahl an Blitzen in einem Gewitter. Theoretisch sind beliebig hohe Werte möglich, aber die möglichen Werte sind doch abzählbar.

Stetige Zufallsvariablen hingegen können innerhalb eines beliebigen Intervalls unendlich viele Werte annehmen. Wenn wir die Körpergröße eines Menschen messen, sind theoretisch unendlich viele Werte zwischen z.B. 165.3cm und 166.84cm möglich. Man nennt diese Wertebereiche überabzählbar unendlich.

Der Träger einer Zufallsvariablen

Mit dem Wort „Träger“ – und dem Zeichen \(\mathcal{T}\) bezeichnen wir die Menge aller möglichen Ergebnisse einer Zufallsvariablen. Für das obige Beispiel eines Würfelwurfs wäre der Träger z.B. \(\mathcal{T} = {1, 2, 3, 4, 5, 6}\). Für die Körpergröße eines Menschen kommen theoretisch alle positiven reellen Zahlen in Frage, hier wäre der Träger also \(\mathbb{R}^+\).

Verteilung von Zufallsvariablen

Für alle Zufallsexperimente, mit denen wir uns (zumindest in den einführenden Veranstaltungen, und in einfachen Anwendungsproblemen) beschäftigen, existieren bekannte Verteilungen. Wir wissen also vor dem Experiment zwar nicht, welches Ergebnis wir bekommen, aber wir wissen, wie wahrscheinlich bestimmte Ergebnisse sind. Diese Information stellen wir dar, indem wir sagen, \(X\) folgt einer bestimmten Verteilung. Mathematisch notiert wird das so: \[ X \sim P_\theta \] Dabei steht \(P\) für eine bestimmte Verteilung (bei der Normalverteilung würde hier z.B. \(N\) stehen, und \(\theta\) sind die Parameter dieser Verteilung (bei der Normalverteilung wäre das der Mittelwert, \(\mu\), und die Varianz, \(\sigma^2\)).

Man kann die möglichen Werte einer Zufallsvariable und die Wahrscheinlichkeitsverteilung über alle diese Werte auf drei verschiedene Arten darstellen: Mit der Dichte, der Verteilungsfunktion, und der Quantilsfunktion. Alle diese Arten sind gleichwertig, spezifizieren die Eigenschaften der Zufallsvariablen vollständig, und man kann auf dem Papier zwischen allen drei Arten hin-und-her-rechnen.

Parameter von Verteilungen

Jede Verteilungsklasse (als Beispiel wieder die Normalverteilung) kann natürlich mehr als nur eine Verteilung beschreiben. Parameter sind Variablen, die zu einer Verteilungsklasse gehören, und mit denen die Verteilung einer Zufallsvariablen \(X\) dann vollständig spezifiziert ist.

Wenn wir zum Beispiel mit \(X\) den Intelligenzquotienten von einigen Personen messen, folgt das Ergebnis einer Normalverteilung mit Mittelwert 100 und Varianz 225, also \(X \sim N(100, 225)\). Messen wir aber von einigen Autos die Geschwindigkeit innerorts, erhalten wir vielleicht eine Normalverteilung mit Mittelwert 55 und Varianz 25, also \(X \sim N(55, 25)\).

7 Gedanken zu „Was sind Zufallsvariablen?

  1. Dark Tron

    Hi danke für den Artikel. Hier eine kleine Anmerkung:
    „Für die Körpergröße eines Menschen kommen theoretisch alle positiven reellen Zahlen in Frage, hier wäre der Träger also R.“
    Der Träger wären alle positiven reellen Zahlen wie du schon sagst, also R+.

    Antworten
  2. Lucas1

    „Stetige Zufallsvariablen hingegen können innerhalb eines beliebigen Intervalls unendlich viele Werte annehmen. Wenn wir die Körpergröße eines Menschen messen, sind theoretisch unendlich viele Werte zwischen z.B. 165.3cm und 166.84cm möglich. Man nennt diese Wertebereiche überabzählbar unendlich.“

    Da es sich hier um die Realisationen der Zufallsvariable handelt, müsste es nicht Definitionsbereich heißen (und nicht Wertebereich) ?

    Antworten
    1. Alex Beitragsautor

      Uff, das wird jetzt kurz sehr technisch 🙂

      Ich hab das Wort ‚Wertebereich‘ hier eigentlich nicht mit der Bedeutung wie bei Funktionen verwendet. Aber wenn du eine Zufallsvariable tatsächlich als Funktion betrachtest (was sie ja ist (Details)), dann ist sie in diesem Fall einfach die Identitätsfunktion von den reellen Zahlen in die reellen Zahlen, also der Definitionsbereich ist genau gleich dem Wertebereich.

      Antworten
      1. Lucas1

        Danke erstmal.
        Ich habe es jetzt insgesamt so verstanden, dass der Definitionsbereich aus den Werten besteht, deren Wahrscheinlichkeit man ausrechnen will (also hier die Körpergröße) und der Wertebereich ist die Wahrscheinlichkeit selbst. Stimmt das so oder steh ich hier auf dem Schlauch?

        LG

        Antworten
        1. Alex Beitragsautor

          Hm, im Speziallfall von diskreten Zufallsvariablen könnte man das so sehen. Aber ich würde den Gedanken wieder verwerfen… wenn man Statistik nur anwenden möchte, ist es glaube ich nur unnötig verwirrend, die Themen in eine „echte“ Funktion verpacken zu wollen.

          Falls du es aber tatsächlich tun willst, kannst du hier mal schauen: https://de.wikipedia.org/wiki/Wahrscheinlichkeitsma%C3%9F#Wahrscheinlichkeitsfunktionen

          Das Wahrscheinlichkeitsmaß ist so eine Funktion. Es ist dann aber auf *Mengen* definiert, z.B. dem Intervall [0.5, 0.6]. Der Wertebereich ist dann die Wahrscheinlichkeit, mit der die ZV in diesem Intervall landet.

          Antworten

Schreibe einen Kommentar zu Alex Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.