Was sind Zufallsvariablen? | Crashkurs Statistik

Zufallsvariablen werden meistens mit \(X\), und manchmal mit \(Y\) oder \(Z\) beschrieben. Sie sind Variablen, mit denen wir das Ergebnis eines noch nicht durchgeführten Zufallsexperiments beschreiben. Betrachten wir zum Beispiel den Wurf eines Würfels, können wir die Zufallsvariable dafür \(X\) nennen. Vor dem Würfelwurf ist der Wert von \(X\) unbekannt, und nach dem Wurf nimmt \(X\) einen Wert von \(1, 2, 3, 4, 5, 6\) an. Diesen Wert nennt man Realisierung der Zufallsvariable, und nennt ihn verallgemeinert \(x\).

Klausuraufgaben

Im eBook-Shop gibt es Klausuraufgaben zu diesem Thema!
Zu den eBooks

Der Unterschied zwischen \(X\) und \(x\) ist also, dass \(X\) die tatsächliche Zufallsvariable ist, und keinen festen Wert hat, sondern quasi für das noch unbekannte Ergebnis des Zufallsexperiments steht, und \(x\) für eine feste Zahl steht, die für das Ergebnis nach dem Experiment steht. Man sieht also für das Beispiel Würfelwurf Schreibweisen wie \(\mathbb{P}(X=1) = \frac{1}{6}\). Da aber die Wahrscheinlichkeit für jede Augenzahl \(x=1,2,3,4,5,6\) gleich ist, schreibt man verallgemeinert \(\mathbb{P}(X=x) = \frac{1}{6}\). Gesprochen wird das so: „Die Wahrscheinlichkeit, dass X gleich x ist, beträgt ein Sechstel.“

Es ist wichtig, dass die möglichen Werte der Zufallsvariablen immer Zahlen sind. Für einen Münzwurf können wir also nicht \(\mathbb{P}(X=\text{Kopf})\) schreiben, sondern müssen die Werte vorher kodieren, z.B. in \(\text{Kopf}=0\) und \(\text{Zahl}=1\). Das ist wichtig, um später Erwartungswerte der Zufallsvariablen bilden zu können. Es ist nämlich unmöglich, den Mittelwert von \(\text{Kopf}\) und \(\text{Zahl}\) zu bilden, aber der Mittelwert von \(0\) und \(1\) ist \(0.5\).

Diskrete und stetige Zufallsvariablen

Es gibt zwei verschiedene Klassen von Zufallsvariablen. Diskrete Zufallsvariablen können nur eine endliche oder abzählbar unendliche Menge an Werten annehmen. Das bedeutet meist, dass es entweder eine feste Anzahl an Werten gibt (wie z.B. beim Würfelwurf), oder dass es sich um Zähldaten handelt, wie etwa die Anzahl an Bankkunden an einem Tag, oder die Anzahl an Blitzen in einem Gewitter. Theoretisch sind beliebig hohe Werte möglich, aber die möglichen Werte sind doch abzählbar.

Stetige Zufallsvariablen hingegen können innerhalb eines beliebigen Intervalls unendlich viele Werte annehmen. Wenn wir die Körpergröße eines Menschen messen, sind theoretisch unendlich viele Werte zwischen z.B. 165.3cm und 166.84cm möglich. Man nennt diese Wertebereiche überabzählbar unendlich.

Der Träger einer Zufallsvariablen

Mit dem Wort „Träger“ – und dem Zeichen \(\mathcal{T}\) bezeichnen wir die Menge aller möglichen Ergebnisse einer Zufallsvariablen. Für das obige Beispiel eines Würfelwurfs wäre der Träger z.B. \(\mathcal{T} = {1, 2, 3, 4, 5, 6}\). Für die Körpergröße eines Menschen kommen theoretisch alle positiven reellen Zahlen in Frage, hier wäre der Träger also \(\mathbb{R}^+\).

Verteilung von Zufallsvariablen

Für alle Zufallsexperimente, mit denen wir uns (zumindest in den einführenden Veranstaltungen, und in einfachen Anwendungsproblemen) beschäftigen, existieren bekannte Verteilungen. Wir wissen also vor dem Experiment zwar nicht, welches Ergebnis wir bekommen, aber wir wissen, wie wahrscheinlich bestimmte Ergebnisse sind. Diese Information stellen wir dar, indem wir sagen, \(X\) folgt einer bestimmten Verteilung. Mathematisch notiert wird das so: \[ X \sim P_\theta \] Dabei steht \(P\) für eine bestimmte Verteilung (bei der Normalverteilung würde hier z.B. \(N\) stehen, und \(\theta\) sind die Parameter dieser Verteilung (bei der Normalverteilung wäre das der Mittelwert, \(\mu\), und die Varianz, \(\sigma^2\)).

Man kann die möglichen Werte einer Zufallsvariable und die Wahrscheinlichkeitsverteilung über alle diese Werte auf drei verschiedene Arten darstellen: Mit der Dichte, der Verteilungsfunktion, und der Quantilsfunktion. Alle diese Arten sind gleichwertig, spezifizieren die Eigenschaften der Zufallsvariablen vollständig, und man kann auf dem Papier zwischen allen drei Arten hin-und-her-rechnen.

Parameter von Verteilungen

Jede Verteilungsklasse (als Beispiel wieder die Normalverteilung) kann natürlich mehr als nur eine Verteilung beschreiben. Parameter sind Variablen, die zu einer Verteilungsklasse gehören, und mit denen die Verteilung einer Zufallsvariablen \(X\) dann vollständig spezifiziert ist.

Wenn wir zum Beispiel mit \(X\) den Intelligenzquotienten von einigen Personen messen, folgt das Ergebnis einer Normalverteilung mit Mittelwert 100 und Varianz 225, also \(X \sim N(100, 225)\). Messen wir aber von einigen Autos die Geschwindigkeit innerorts, erhalten wir vielleicht eine Normalverteilung mit Mittelwert 55 und Varianz 25, also \(X \sim N(55, 25)\).

7 Gedanken zu „Was sind Zufallsvariablen?“

Dark Tron 9. August 2019 um 11:41

Hi danke für den Artikel. Hier eine kleine Anmerkung:
„Für die Körpergröße eines Menschen kommen theoretisch alle positiven reellen Zahlen in Frage, hier wäre der Träger also R.“
Der Träger wären alle positiven reellen Zahlen wie du schon sagst, also R+.

Antworten ↓
John 30. Mai 2019 um 00:43

Ich habe einmal eine Frage zu dem Träger. Ist der Träger das selbe wie die Ergebnismenge Omega ?

Antworten ↓
1. Alex Beitragsautor3. Juni 2019 um 04:26
  
  Bis auf mathematische Feinheiten kann man das so annehmen, denke ich – ja.
  
  Antworten ↓
Lucas1 13. Februar 2018 um 03:31

„Stetige Zufallsvariablen hingegen können innerhalb eines beliebigen Intervalls unendlich viele Werte annehmen. Wenn wir die Körpergröße eines Menschen messen, sind theoretisch unendlich viele Werte zwischen z.B. 165.3cm und 166.84cm möglich. Man nennt diese Wertebereiche überabzählbar unendlich.“

Da es sich hier um die Realisationen der Zufallsvariable handelt, müsste es nicht Definitionsbereich heißen (und nicht Wertebereich) ?

Antworten ↓
1. Alex Beitragsautor14. Februar 2018 um 19:05
  
  Uff, das wird jetzt kurz sehr technisch 🙂
  
  Ich hab das Wort ‚Wertebereich‘ hier eigentlich nicht mit der Bedeutung wie bei Funktionen verwendet. Aber wenn du eine Zufallsvariable tatsächlich als Funktion betrachtest (was sie ja ist (Details)), dann ist sie in diesem Fall einfach die Identitätsfunktion von den reellen Zahlen in die reellen Zahlen, also der Definitionsbereich ist genau gleich dem Wertebereich.
  
  Antworten ↓
  1. Lucas1 14. Februar 2018 um 19:29
    
    Danke erstmal.
    Ich habe es jetzt insgesamt so verstanden, dass der Definitionsbereich aus den Werten besteht, deren Wahrscheinlichkeit man ausrechnen will (also hier die Körpergröße) und der Wertebereich ist die Wahrscheinlichkeit selbst. Stimmt das so oder steh ich hier auf dem Schlauch?
    
    LG
    
    Antworten ↓
    1. Alex Beitragsautor14. Februar 2018 um 20:11
      
      Hm, im Speziallfall von diskreten Zufallsvariablen könnte man das so sehen. Aber ich würde den Gedanken wieder verwerfen… wenn man Statistik nur anwenden möchte, ist es glaube ich nur unnötig verwirrend, die Themen in eine „echte“ Funktion verpacken zu wollen.
      
      Falls du es aber tatsächlich tun willst, kannst du hier mal schauen: https://de.wikipedia.org/wiki/Wahrscheinlichkeitsma%C3%9F#Wahrscheinlichkeitsfunktionen
      
      Das Wahrscheinlichkeitsmaß ist so eine Funktion. Es ist dann aber auf *Mengen* definiert, z.B. dem Intervall [0.5, 0.6]. Der Wertebereich ist dann die Wahrscheinlichkeit, mit der die ZV in diesem Intervall landet.
      
      Antworten ↓

Antworte auf den Kommentar von Alex Antwort abbrechen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.