Konfidenzintervall für die Varianz

Das Konfidenzintervall für die Varianz eines Merkmals berechnet man mit Hilfe der \(\chi^2\)-Verteilung. Man benötigt zum Berechnen eines Konfidenzintervalls nun zwei Werte aus der Tabelle der \(\chi^2\)-Verteilung: Falls wir z.B. ein 90%-Konfidenzintervall berechnen möchten, brauchen wir die Schranken zu den äußeren 10% der \(\chi^2\)-Verteilung, das heißt also auf der linken Seite das 5%-Quantil, und auf der rechten Seite das 95%-Quantil.

Allgemein gesagt benötigen wir für ein KI mit der Irrtumswahrscheinlichkeit \(\alpha\) die beiden Quantile \(\chi^2_{\frac{\alpha}{2}}(n-1)\) und \(\chi^2_{1-\frac{\alpha}{2}}(n-1)\). Bei einem 90%-KI ist die Irrtumswahrscheinlichkeit 10%, also ist \(\alpha = 0.1\). In diesem Fall brauchen wir das Quantil \(\chi^2_{0.05}(n-1)\) sowie \(\chi^2_{0.95}(n-1)\). In den Klammern steht die Anzahl der Freiheitsgrade (damit finden wir die relevante Zeile in der Tabelle), und die kommt auf die Stichprobengröße \(n\) an.

Die Formel für das KI der Varianz lautet insgesamt:

\[ \left[ \frac{(n-1) \cdot S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}, \frac{(n-1) \cdot S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)} \right] \]

Und wie üblich darf man sich von auf den ersten Blick komplizierten Notationen nicht erschrecken lassen: Im Nenner steht jeweils nur eine einzelne Dezimalzahl, nämlich ein Quantil der \(\chi^2\)-Verteilung mit \(n-1\) Freiheitsgraden. Das linke Ende des KIs ist einfach das \(\frac{\alpha}{2}\) Quantil (z.B. das 5%-Quantil), und das rechte Ende das \(1-\frac{\alpha}{2}\) Quantil (z.B. das 95%-Quantil).

Das \(S^2\) im Zähler ist die Stichprobenvarianz, die wir mit der üblichen Formel \(S^2 = \sum_{i=1}^n (x_i – \bar{x})^2\) berechnen.

Beispielaufgabe

Wir möchten herausfinden, in welchem Bereich die Varianz der Körpergröße von Männern wohl liegen wird. Dazu befragen wir 14 Männer nach ihrer Größe. Wir erhalten glücklicherweise nicht die rohen Daten, sondern schon die folgenden Zusammenfassungen der Stichprobe:

  • \(\bar{x} = 174cm\)
  • \(S^2 = 97.33\)

Berechne mit diesen Angaben ein 90%-Konfidenzintervall für die Varianz der Körpergröße unter Männern.


Wir betrachten einfach die Formel für das Konfidenzintervall, und füllen nacheinander alle fehlenden Zahlen ein:

\[ \left[ \frac{(n-1) \cdot S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}, \frac{(n-1) \cdot S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)} \right] \]

Wir benötigen also die Werte:

  • \(n-1\), das ist 13, denn wir haben \(n=14\) Männer befragt.
  • \(S^2 = 97.33\), das haben wir aus dem Aufgabentext entnommen. (Manchmal muss man aber die Stichprobenvarianz \(S^2\) in einer Klausur erst selbst aus den Rohdaten berechnen.)
  • \(\alpha\) ist die Irrtumswahrscheinlichkeit. Wenn wir ein 90%-Konfidenzintervall suchen, dann ist die Irrtumswahrscheinlichkeit 10% bzw. 0.1, also ist \(\alpha=0.1\)
  • \(\chi^2_{1-\frac{\alpha}{2}}(n-1)\) – das ist das 95%-Quantil (denn \(\alpha = 0.1\)) der \(\chi^2\)-Verteilung mit 13 Freiheitsgraden. Aus der Tabelle lesen wir in der Zeile \(df=13\) und der Spalte \(q=0.95\) ab, dass dieser Wert 22.362 ist.
  • \(\chi^2_{\frac{\alpha}{2}}(n-1)\) – das ist das 5%-Quantil derselben \(\chi^2\)-Verteilung. In der Zeile \(df=13\) und der Spalte \(q=0.05\) lesen wir also den Wert 5.892 ab.

Damit können wir alle Werte in das Intervall einsetzen:

\[ \left[ \frac{13 \cdot 97.33}{22.362}, \frac{13 \cdot 97.33}{5.892} \right] = \left[ 56.58, 214.75 \right] \]

Das 90%-Konfidenzintervall für die Varianz der Körpergrösse von Männern ist also [56.58, 214.75], d.h. die wahre Varianz liegt wahrscheinlich in diesem Bereich.

Klausuraufgabe

Im 100-Meter-Sprint auf der Olympiade 2016 in Rio waren die Zeiten der 8 Teilnehmer die folgenden:

Platz Name Land Zeit
Gold Usain Bolt JAM 9.81
Silber Justin Gatlin USA 9.89
Bronze Andre De Grasse CAN 9.91
4. Yohan Blake JAM 9.93
5. Akani Simbine RSA 9.94
6. Ben Youssef Meite CIV 9.96
7. Jimmy Vicaut FRA 10.04
8. Trayvon Bromell USA 10.06

Berechne einen Schätzer für die Varianz der Sprintergebnisse, und erstelle danach ein 90%-Konfidenzintervall für die Varianz.

Lösung (klick)

Um den Schätzer für die Varianz auszurechnen, verwenden wir die Formel für die Stichprobenvarianz, also \(S^2\):

\[ \hat{\sigma}^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i-\bar{x})^2 \]

Wir brauchen zuerst den Mittelwert der 8 Zeiten: er ist 9.9425. Der Schätzer für die Varianz, also \(\hat{\sigma}^2\) ist dann \(S^2 = 0.00645\).

Die gesamte Formel für das KI lautet:

\[ \left[ \frac{(n-1) \cdot S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}, \frac{(n-1) \cdot S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)} \right] \]

Wir sammeln also die einzelnen Werte, die wir dort einsetzen müssen:

  • \(S^2\) ist der Schätzer für die Varianz, den haben wir gerade berechnet: \(S^2 = 0.00645\).
  • \(\alpha\) ist die Irrtumswahrscheinlichkeit. Da wir ein 90%-Intervall möchten, ist die Irrtumswahrscheinlichkeit 10%, also ist \(\alpha = 0.1\).
  • \(\chi^2_{1-\frac{\alpha}{2}}(n-1)\) sieht etwas tricky aus, aber es ist nur ein einzelner Wert, den wir in der Tabelle der Chi-Quadrat-Verteilung nachschlagen müssen: Wir brauchen das \(1-\frac{\alpha}{2}\)-Quantil, also das 95%-Quantil der Chi-Quadrat-Verteilung mit \(n-1\), also mit 7 Freiheitsgraden (da wir \(n=8\) Sprinter in der Stichprobe hatten). In der Tabelle sehen wir also in der Zeile df=7 und in der Spalte q=0.95 nach, und finden dort den Wert 14.067
  • \(\chi^2_{\frac{\alpha}{2}}(n-1)\) ist ganz analog dazu das 5%-Quantil, bei immer noch 7 Freiheitsgraden. Dieser Wert ist 2.167.
  • \(n-1\) ist 7, da wir 8 Personen in der Stichprobe haben.

Wir können also nun alle Werte in der Formel ersetzen:

\[ \left[ \frac{7 \cdot 0.00645}{14.067}, \frac{7 \cdot 0.00645}{2.167} \right] \]

Das fertige Intervall ist dann \([0.0032, 0.0208]\). Wir können also mit einer Irrtumswahrscheinlichkeit von 10% davon ausgehen, dass die wahre Varianz unter den olympischen Sprintern sich irgendwo zwischen 0.0032 und 0.0208 bewegt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.