Konfidenzintervall für den Erwartungswert

Das KI für den Erwartungswert folgt einem ähnlichen Prinzip wie das bereits besprochene KI für einen Anteilswert:

\[ \text{Parameter} \pm \text{Quantil} \cdot \sqrt{\frac{\text{Varianz}}{n}} \]

In den meisten Fällen in der Realität ist die wahre Varianz nicht bekannt, und wird auch einfach aus der Stichprobe geschätzt. In einer Klausur wird der Fall, dass die Varianz \(\sigma^2\) bekannt ist, allerdings noch gefordert – daher betrachten wir ihn hier extra.

Die Formeln für die Konfidenzintervalle der beiden Varianten unterscheiden sich nur minimal:

  • Wenn die wahre Varianz \(\sigma^2\) bekannt ist, nehmen wir in der Formel direkt die wahre Varianz \(\sigma^2\) – anderenfalls schätzen wir sie durch die Stichprobenvarianz \(s^2\) und nehmen diesen Wert.
  • Wenn die wahre Varianz \(\sigma^2\) bekannt ist, dann nehmen wir das Quantil der Normalverteilung – anderenfalls nehmen wir das Quantil der t-Verteilung mit \(n-1\) Freiheitsgraden.
    • Wenn wir allerdings eine ausreichend große Stichprobe haben, z.B. \(n>30\), dann können wir doch wieder das Quantil der Normalverteilung verwenden.

Sehen wir uns die Formeln der beiden KIs also an:

KI für den Erwartungswert \(\mu\), falls Varianz \(\sigma^2\) bekannt

Für das Konfidenzintervall brauchen wir die folgenden Werte:

  • Die Stichprobengröße \(n\)
  • Den Mittelwert der Stichprobe \(\bar{x}\)
  • Die wahre Varianz \(\sigma^2\)
    • In der Formel brauchen wir allerdings ihre Wurzel, die Standardabweichung, also \(\sigma\). Diese beiden Werte zu verwechseln, ist ein häufiger Fehler in der Klausur.
  • Die gewünschte Irrtumswahrscheinlichkeit \(\alpha\)
    • Damit berechnen wir das passende \(1-\frac{\alpha}{2}\)-Quantil der Normalverteilung, das wir in der Formel brauchen – also den Wert \(z_{1-\frac{\alpha}{2}}\). Für eine gewünschte Irrtumswahrscheinlichkeit von 5% brauchen wir also später das 97,5%-Quantil (das ist 1.96, wer es nachprüfen möchte).

Die untere Grenze des Intervalls ist dann:

\[ u =  \bar{x} – z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Für die obere Grenze ersetzen wir einfach das erste Minus durch ein Plus:

\[ o =  \bar{x} + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Insgesamt lautet das Konfidenzintervall also

\[ \left[ \bar{x} – z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}, \, \, \bar{x} + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \right] \]

Oder, in Kurzschreibweise mit dem \(\pm\) Zeichen:

\[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Beispielaufgabe

Der Intelligenzquotient (IQ) ist so erstellt worden, dass er in der Gesamtbevölkerung normalverteilt ist mit einem Mittelwert von 100 und einer Standardabweichung von 15 (d.h. einer Varianz von \(15^2 = 225\). Wir haben nun eine Stichprobe von \(n=35\) Social-Media-Powerusern, die täglich mehr als 3 Stunden in sozialen Netzen unterwegs sind. Ich erspare euch die „Rohdaten“, d.h. die einzelnen 35 IQs, und liefere direkt den MIttelwert der Stichprobe:

  • \(\bar{x} = 93.523\)

Wir können die Varianz in der Gruppe als bekannt annehmen, nämlich als \(\sigma^2 = 225\). Berechne nun ein 95%-Konfidenzintervall (d.h. \(\alpha=0.05\)) für den mittleren IQ in der Grundgesamtheit aller Social-Media-Poweruser.


Die Formel dafür kennen wir:

\[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Dort tragen wir jetzt einfach alle geforderten Werte nacheinander ein. Manche müssen wir berechnen, andere aus einer Tabelle ablesen, und wieder andere einfach einsetzen:

  • \(\bar{x} = 93.523\), das steht in der Aufgabe
  • \(\alpha = 0.05\), denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05.
  • \(z_{1-\frac{\alpha}{2}}\) ist \(z_{0.975}\), also das 97,5%-Quantil der Normalverteilung. Aus der Verteilungstabelle lesen wir ab, dass das 1.96 ist.
  • \(\sigma\) ist die Standardabweichung (Vorsicht: Die Wurzel aus der Varianz! Nicht verwechseln!). Bei uns ist \(\sigma = \sqrt{\sigma^2} = \sqrt{225} = 15\)
  • \(\sqrt{n} = \sqrt{35} = 5.916\)

Damit können wir das Intervall berechnen:

\[ 93.523 \pm 1.96 \cdot \frac{15}{5.916}\]

Das gesuchte Konfidenzintervall ist also \( 93.523 \pm 4.97\), also als Intervall geschrieben \([88.553, 98.493]\). Der mittlere IQ unter Social-Media-Powerusern liegt also wahrscheinlich in diesem Bereich.

KI für den Erwartungswert \(\mu\), falls Varianz \(\sigma^2\) unbekannt

Wie bereits erwähnt: Das Prinzip ist hier dasselbe, das KI wird berechnet durch

\[ \text{Parameter} \pm \text{Quantil} \cdot \sqrt{\frac{\text{Varianz}}{n}} \]

Die einzigen beiden Unterschiede sind, dass statt dem \(z\)-Quantil der Normalverteilung nun das der t-Verteilung verwendet wird, und dass nicht mehr die wahre Standardabweichung \(\sigma\) verwendet wird (da sie ja jetzt unbekannt ist), sondern die Stichprobenvarianz \(s^2\), bzw. ihre Wurzel \(s\) verwendet wird. Diese berechnen wir auf die bekannte Art und Weise: \(s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i-\bar{x})^2\).

Die Formel für das Konfidenzintervall ist von der Bedeutung her identisch mit dem Fall, wenn die wahre Varianz \(\sigma^2\) bekannt ist, nur mit den oben besprochenen Unterschieden:

\[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\]

Die Bezeichnung \(t_{1-\frac{\alpha}{2}}(n-1)\) sieht vielleicht etwas furchteinflößend aus, aber sie ist ganz einfach das \(1-\frac{\alpha}{2}\)-Quantil der t-Verteilung mit \(n-1\) Freiheitsgraden – das ist am Ende nur eine harmlose Dezimalzahl. Ihren Wert findet man in der Tabelle der t-Verteilung.

Anmerkung: Falls die Stichprobe mehr als 30 Beobachtungen hat, kann man im Normalfall doch wieder das \(z\)-Quantil der Normalverteilung (statt dem Quantil der t-Verteilung) verwenden.

Beispielaufgabe

Wir interessieren uns für den mittleren Intelligenzquotienten (IQ) in einer Förderschule für Hochbegabte. In der breiten Bevölkerung ist zwar bekannt, dass der IQ normalverteilt ist mit \(\mu=100\) und \(\sigma^2=225\), aber in dieser Untergruppe kann man weder vom selben Mittelwert noch von derselben Varianz ausgehen. Wir erheben also durch einen IQ-Test die Zahlen für eine Stichprobe von \(n=22\) Hochbegabten, und erhalten:

  • \(\bar{x} = 134.32\)
  • \(s^2 = 98.83\)

Berechne nun ein 95%-Konfidenzintervall für den mittleren IQ von Hochbegabten in Förderklassen.


Wir verwenden ganz einfach die Formel für das KI, und setzen alle Werte nacheinander ein:

\[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\]

Die Werte, die wir brauchen sind:

  • \(\bar{x} = 134.32\), das steht direkt im Aufgabentext
  • \(\alpha = 0.05\), denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05.
  • \(t_{1-\frac{\alpha}{2}}(n-1)\) ist das \(1-\frac{\alpha}{2}\)-Quantil, also das 97,5%-Quantil der t-Verteilung mit \(n-1\), also mit 21 Freiheitsgraden. In der Verteilungstabelle lesen wir ab, dass dieser Wert \(t_{0.975}(21) = 2.080\) ist
  • \(s = \sqrt{s^2} = \sqrt{98.83} = 9.941\)
  • \(\sqrt{n} = \sqrt{21} = 4.583\)

Wir setzen also diese Werte ein und rechnen aus:

\[ 134.32 \pm 2.080 \cdot \frac{9.941}{4.583}\]

Das gesuchte Konfidenzintervall ist also \( 134.32 \pm 4.51\), also in Intervallschreibweise \([129.81, 138.83]\). Der IQ unter Förderschülern liegt also ziemlich wahrscheinlich in diesem Bereich.

Klausuraufgabe

  • a) Eine Fluglinie möchte das durchschnittliche Gewicht von Passagieren möglichst sicher abschätzen. Die „wahre“ Varianz des Körpergewichts in der Grundgesamtheit ist aus früheren Erhebungen bekannt und beträgt \(\sigma^2 = 120\). Der Mittelwert könnte sich aber in den letzten Jahren verändert haben. Die Airline wiegt daher 105 Passagiere, und bekommt den Stichprobenmittelwert \(\bar{x}=79.83\) Kilogramm heraus.
    Bestimme ein 99%-Konfidenzintervall für den wahren Erwartungswert \(\mu\) des Körpergewichts in der Grundgesamtheit von allen Passagieren.
  • b) Um den Blutdruck von Leistungssportlern zu schätzen, nimmt ein Sportinstitut von 24  Marathonläufern den Blutdruck. Die Ergebnisse wurden bereits in Stichprobenmittelwert und Standardabweichung zusammengefasst, und lauten:
    • \(\bar{x} = 128.3\)
    • \(s = 11.43\)

    Berechne ein 95%-Konfidenzintervall für den wahren Erwartungswert des Blutdrucks unter Marathonläufern.

Lösung (klick)
  • a) Da in diesem Fall die wahre Varianz schon bekannt ist, brauchen wir die Stichprobenvarianz nicht zu berechnen. Wir verwenden direkt die Formel:
    \[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\] Um die untere Grenze des Intervalls zu berechnen, ersetzen wir das \(\pm\)-Zeichen durch ein Minus, und für die obere Grenze ersetzen wir es durch ein Plus.
    Wir benötigen die folgenden Werte zum Einsetzen in die Formel:

    • \(\bar{x}\) ist der Stichprobenmittelwert, den haben wir schon bekommen: Er ist 79.83
    • \(\alpha\) ist die Irrtumswahrscheinlichkeit des Konfidenzintervalls. Bei einem 99%-KI ist sie 1%, also ist \(\alpha = 0.01\).
    • \(z_{1-\frac{\alpha}{2}}\) ist das \(1-\frac{\alpha}{2}\)-Quantil, also das 99,5%-Quantil der Standardnormalverteilung. Aus ihrer Tabelle können wir diesen Wert ablesen: Er ist 2.57.
    • \(\sigma\) ist die wahre Standardabweichung, die hier ja bekannt ist. Vorsicht: In der Aufgabenstellung haben wir die Varianz bekommen, also \(\sigma^2\), und sie ist 120. Wir brauchen die Standardabweichung \(\sigma\), also ihre Wurzel (Das ist ein typischer Fehler in einer Klausur). Die Standardabweichung ist \(\sigma = \sqrt{120} = 10.95\)
    • \(\sqrt{n}\) ist \(\sqrt{105} = 10.25\)

    Das KI ist also, nachdem alles eingesetzt wurde, \(79.83 \pm 2.57 \cdot \frac{10.95}{10.25}\). Vereinfacht ist es dann \(79.83 \pm 2.75\), und somit ist die untere Grenze \(79.83 – 2.75 = 77.08\), und die obere Grenze ist \(79.83 + 2.75 = 82.58\).
    Wir können also mit einer Irrtumswahrscheinlichkeit von 1% sagen, dass der wahre Erwartungswert \(\mu\) des Körpergewichts aller Passagiere zwischen 77.08kg und 82.58kg liegt.

  • b) Wir möchten ein Konfidenzintervall für den Mittelwert haben, aber kennen die wahre Varianz \(\sigma^2\) nicht (so ist es in der Realität aber meistens auch). Die Formel für dieses KI lautet
    \[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\] Wir müssen hier die folgenden Werte einsetzen:

    • \(\bar{x}\) ist in der Aufgabe als 128.3 gegeben.
    • \(\alpha\), die Irrtumswahrscheinlichkeit, ist 5%, da wir ein 95%-Konfidenzintervall möchten. Also: \(\alpha=0.05\).
    • \(t_{1-\frac{\alpha}{2}}(n-1)\) ist der fiese Teil in dieser Formel. Aber man muss nur wissen, was damit gemeint ist: Wir suchen das \(1-\frac{\alpha}{2}\)-Quantil, also das 0.975-Quantil (oder äquivalent das 97,5%-Quantil) der t-Verteilung, und zwar der mit \(n-1\) Freiheitsgraden – das sind bei uns 21, denn die Stichprobengröße ist hier \(n=22\).
      Wir brauchen also den Wert \(t_{0.975}(21)\). Dafür müssen wir in der Tabelle der t-Verteilung nun nachsehen, und zwar in der Spalte „Quantil = 0.975“, und in der Zeile „df = 21“. Der Wert der dort steht ist 2.080.
    • \(s\) ist die Standardabweichung in der Stichprobe, die wurde freundlicherweise schon in der Aufgabenstellung für uns berechnet: \(s = 11.43\).
    • \(\sqrt{n} = \sqrt{22} = 4.69\)

    Damit können wir jetzt alles in die Formel einsetzen:
    \[ 128.3 \pm 2.080 \cdot \frac{11.43}{4.69}\] Vereinfacht steht dann da \(128.3 \pm 5.069\), und somit geht das Konfidenzintervall von unten \(128.3 – 5.069 = 123.23\) bis oben \(128.3 + 5.069\) = 133.37.
    Wir können also sagen, dass mit 5%-iger Irrtumswahrscheinlichkeit der erwartete Blutdruck von Marathonläufern zwischen 123.23 und 133.37 liegt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.