Konfidenzintervall für den Erwartungswert

Das KI für den Erwartungswert folgt einem ähnlichen Prinzip wie das bereits besprochene KI für einen Anteilswert:

\[ \text{Parameter} \pm \text{Quantil} \cdot \sqrt{\frac{\text{Varianz}}{n}} \]

In den meisten Fällen in der Realität ist die wahre Varianz nicht bekannt, und wird auch einfach aus der Stichprobe geschätzt. In einer Klausur wird der Fall, dass die Varianz \(\sigma^2\) bekannt ist, allerdings noch gefordert – daher betrachten wir ihn hier extra.

Die Formeln für die Konfidenzintervalle der beiden Varianten unterscheiden sich nur minimal:

  • Wenn die wahre Varianz \(\sigma^2\) bekannt ist, nehmen wir in der Formel direkt die wahre Varianz \(\sigma^2\) – anderenfalls schätzen wir sie durch die Stichprobenvarianz \(s^2\) und nehmen diesen Wert.
  • Wenn die wahre Varianz \(\sigma^2\) bekannt ist, dann nehmen wir das Quantil der Normalverteilung – anderenfalls nehmen wir das Quantil der t-Verteilung mit \(n-1\) Freiheitsgraden.
    • Wenn wir allerdings eine ausreichend große Stichprobe haben, z.B. \(n>30\), dann können wir doch wieder das Quantil der Normalverteilung verwenden.

Sehen wir uns die Formeln der beiden KIs also an:

KI für den Erwartungswert \(\mu\), falls Varianz \(\sigma^2\) bekannt

Für das Konfidenzintervall brauchen wir die folgenden Werte:

  • Die Stichprobengröße \(n\)
  • Den Mittelwert der Stichprobe \(\bar{x}\)
  • Die wahre Varianz \(\sigma^2\)
    • In der Formel brauchen wir allerdings ihre Wurzel, die Standardabweichung, also \(\sigma\). Diese beiden Werte zu verwechseln, ist ein häufiger Fehler in der Klausur.
  • Die gewünschte Irrtumswahrscheinlichkeit \(\alpha\)
    • Damit berechnen wir das passende \(1-\frac{\alpha}{2}\)-Quantil der Normalverteilung, das wir in der Formel brauchen – also den Wert \(z_{1-\frac{\alpha}{2}}\). Für eine gewünschte Irrtumswahrscheinlichkeit von 5% brauchen wir also später das 97,5%-Quantil (das ist 1.96, wer es nachprüfen möchte).

Die untere Grenze des Intervalls ist dann:

\[ u =  \bar{x} – z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Für die obere Grenze ersetzen wir einfach das erste Minus durch ein Plus:

\[ o =  \bar{x} + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Insgesamt lautet das Konfidenzintervall also

\[ \left[ \bar{x} – z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}, \, \, \bar{x} + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \right] \]

Oder, in Kurzschreibweise mit dem \(\pm\) Zeichen:

\[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Beispielaufgabe

Der Intelligenzquotient (IQ) ist so erstellt worden, dass er in der Gesamtbevölkerung normalverteilt ist mit einem Mittelwert von 100 und einer Standardabweichung von 15 (d.h. einer Varianz von \(15^2 = 225\). Wir haben nun eine Stichprobe von \(n=35\) Social-Media-Powerusern, die täglich mehr als 3 Stunden in sozialen Netzen unterwegs sind. Ich erspare euch die „Rohdaten“, d.h. die einzelnen 35 IQs, und liefere direkt den MIttelwert der Stichprobe:

  • \(\bar{x} = 93.523\)

Wir können die Varianz in der Gruppe als bekannt annehmen, nämlich als \(\sigma^2 = 225\). Berechne nun ein 95%-Konfidenzintervall (d.h. \(\alpha=0.05\)) für den mittleren IQ in der Grundgesamtheit aller Social-Media-Poweruser.


Die Formel dafür kennen wir:

\[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\]

Dort tragen wir jetzt einfach alle geforderten Werte nacheinander ein. Manche müssen wir berechnen, andere aus einer Tabelle ablesen, und wieder andere einfach einsetzen:

  • \(\bar{x} = 93.523\), das steht in der Aufgabe
  • \(\alpha = 0.05\), denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05.
  • \(z_{1-\frac{\alpha}{2}}\) ist \(z_{0.975}\), also das 97,5%-Quantil der Normalverteilung. Aus der Verteilungstabelle lesen wir ab, dass das 1.96 ist.
  • \(\sigma\) ist die Standardabweichung (Vorsicht: Die Wurzel aus der Varianz! Nicht verwechseln!). Bei uns ist \(\sigma = \sqrt{\sigma^2} = \sqrt{225} = 15\)
  • \(\sqrt{n} = \sqrt{35} = 5.916\)

Damit können wir das Intervall berechnen:

\[ 93.523 \pm 1.96 \cdot \frac{15}{5.916}\]

Das gesuchte Konfidenzintervall ist also \( 93.523 \pm 4.97\), also als Intervall geschrieben \([88.553, 98.493]\). Der mittlere IQ unter Social-Media-Powerusern liegt also wahrscheinlich in diesem Bereich.

KI für den Erwartungswert \(\mu\), falls Varianz \(\sigma^2\) unbekannt

Wie bereits erwähnt: Das Prinzip ist hier dasselbe, das KI wird berechnet durch

\[ \text{Parameter} \pm \text{Quantil} \cdot \sqrt{\frac{\text{Varianz}}{n}} \]

Die einzigen beiden Unterschiede sind, dass statt dem \(z\)-Quantil der Normalverteilung nun das der t-Verteilung verwendet wird, und dass nicht mehr die wahre Standardabweichung \(\sigma\) verwendet wird (da sie ja jetzt unbekannt ist), sondern die Stichprobenvarianz \(s^2\), bzw. ihre Wurzel \(s\) verwendet wird. Diese berechnen wir auf die bekannte Art und Weise: \(s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i-\bar{x})^2\).

Die Formel für das Konfidenzintervall ist von der Bedeutung her identisch mit dem Fall, wenn die wahre Varianz \(\sigma^2\) bekannt ist, nur mit den oben besprochenen Unterschieden:

\[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\]

Die Bezeichnung \(t_{1-\frac{\alpha}{2}}(n-1)\) sieht vielleicht etwas furchteinflößend aus, aber sie ist ganz einfach das \(1-\frac{\alpha}{2}\)-Quantil der t-Verteilung mit \(n-1\) Freiheitsgraden – das ist am Ende nur eine harmlose Dezimalzahl. Ihren Wert findet man in der Tabelle der t-Verteilung.

Anmerkung: Falls die Stichprobe mehr als 30 Beobachtungen hat, kann man im Normalfall doch wieder das \(z\)-Quantil der Normalverteilung (statt dem Quantil der t-Verteilung) verwenden.

Beispielaufgabe

Wir interessieren uns für den mittleren Intelligenzquotienten (IQ) in einer Förderschule für Hochbegabte. In der breiten Bevölkerung ist zwar bekannt, dass der IQ normalverteilt ist mit \(\mu=100\) und \(\sigma^2=225\), aber in dieser Untergruppe kann man weder vom selben Mittelwert noch von derselben Varianz ausgehen. Wir erheben also durch einen IQ-Test die Zahlen für eine Stichprobe von \(n=22\) Hochbegabten, und erhalten:

  • \(\bar{x} = 134.32\)
  • \(s^2 = 98.83\)

Berechne nun ein 95%-Konfidenzintervall für den mittleren IQ von Hochbegabten in Förderklassen.


Wir verwenden ganz einfach die Formel für das KI, und setzen alle Werte nacheinander ein:

\[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\]

Die Werte, die wir brauchen sind:

  • \(\bar{x} = 134.32\), das steht direkt im Aufgabentext
  • \(\alpha = 0.05\), denn da wir ein 95%-KI brauchen, ist die Irrtumswahrscheinlichkeit 5%, also 0.05.
  • \(t_{1-\frac{\alpha}{2}}(n-1)\) ist das \(1-\frac{\alpha}{2}\)-Quantil, also das 97,5%-Quantil der t-Verteilung mit \(n-1\), also mit 21 Freiheitsgraden. In der Verteilungstabelle lesen wir ab, dass dieser Wert \(t_{0.975}(21) = 2.080\) ist
  • \(s = \sqrt{s^2} = \sqrt{98.83} = 9.941\)
  • \(\sqrt{n} = \sqrt{21} = 4.583\)

Wir setzen also diese Werte ein und rechnen aus:

\[ 134.32 \pm 2.080 \cdot \frac{9.941}{4.583}\]

Das gesuchte Konfidenzintervall ist also \( 134.32 \pm 4.51\), also in Intervallschreibweise \([129.81, 138.83]\). Der IQ unter Förderschülern liegt also ziemlich wahrscheinlich in diesem Bereich.

Klausuraufgabe

  • a) Eine Fluglinie möchte das durchschnittliche Gewicht von Passagieren möglichst sicher abschätzen. Die „wahre“ Varianz des Körpergewichts in der Grundgesamtheit ist aus früheren Erhebungen bekannt und beträgt \(\sigma^2 = 120\). Der Mittelwert könnte sich aber in den letzten Jahren verändert haben. Die Airline wiegt daher 105 Passagiere, und bekommt den Stichprobenmittelwert \(\bar{x}=79.83\) Kilogramm heraus.
    Bestimme ein 99%-Konfidenzintervall für den wahren Erwartungswert \(\mu\) des Körpergewichts in der Grundgesamtheit von allen Passagieren.
  • b) Um den Blutdruck von Leistungssportlern zu schätzen, nimmt ein Sportinstitut von 22  Marathonläufern den Blutdruck. Die Ergebnisse wurden bereits in Stichprobenmittelwert und Standardabweichung zusammengefasst, und lauten:
    • \(\bar{x} = 128.3\)
    • \(s = 11.43\)

    Berechne ein 95%-Konfidenzintervall für den wahren Erwartungswert des Blutdrucks unter Marathonläufern.

Lösung (klick)
  • a) Da in diesem Fall die wahre Varianz schon bekannt ist, brauchen wir die Stichprobenvarianz nicht zu berechnen. Wir verwenden direkt die Formel:
    \[ \bar{x} \pm z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\] Um die untere Grenze des Intervalls zu berechnen, ersetzen wir das \(\pm\)-Zeichen durch ein Minus, und für die obere Grenze ersetzen wir es durch ein Plus.
    Wir benötigen die folgenden Werte zum Einsetzen in die Formel:

    • \(\bar{x}\) ist der Stichprobenmittelwert, den haben wir schon bekommen: Er ist 79.83
    • \(\alpha\) ist die Irrtumswahrscheinlichkeit des Konfidenzintervalls. Bei einem 99%-KI ist sie 1%, also ist \(\alpha = 0.01\).
    • \(z_{1-\frac{\alpha}{2}}\) ist das \(1-\frac{\alpha}{2}\)-Quantil, also das 99,5%-Quantil der Standardnormalverteilung. Aus ihrer Tabelle können wir diesen Wert ablesen: Er ist 2.57.
    • \(\sigma\) ist die wahre Standardabweichung, die hier ja bekannt ist. Vorsicht: In der Aufgabenstellung haben wir die Varianz bekommen, also \(\sigma^2\), und sie ist 120. Wir brauchen die Standardabweichung \(\sigma\), also ihre Wurzel (Das ist ein typischer Fehler in einer Klausur). Die Standardabweichung ist \(\sigma = \sqrt{120} = 10.95\)
    • \(\sqrt{n}\) ist \(\sqrt{105} = 10.25\)

    Das KI ist also, nachdem alles eingesetzt wurde, \(79.83 \pm 2.57 \cdot \frac{10.95}{10.25}\). Vereinfacht ist es dann \(79.83 \pm 2.75\), und somit ist die untere Grenze \(79.83 – 2.75 = 77.08\), und die obere Grenze ist \(79.83 + 2.75 = 82.58\).
    Wir können also mit einer Irrtumswahrscheinlichkeit von 1% sagen, dass der wahre Erwartungswert \(\mu\) des Körpergewichts aller Passagiere zwischen 77.08kg und 82.58kg liegt.

  • b) Wir möchten ein Konfidenzintervall für den Mittelwert haben, aber kennen die wahre Varianz \(\sigma^2\) nicht (so ist es in der Realität aber meistens auch). Die Formel für dieses KI lautet
    \[ \bar{x} \pm t_{1-\frac{\alpha}{2}}(n-1) \cdot \frac{s}{\sqrt{n}}\] Wir müssen hier die folgenden Werte einsetzen:

    • \(\bar{x}\) ist in der Aufgabe als 128.3 gegeben.
    • \(\alpha\), die Irrtumswahrscheinlichkeit, ist 5%, da wir ein 95%-Konfidenzintervall möchten. Also: \(\alpha=0.05\).
    • \(t_{1-\frac{\alpha}{2}}(n-1)\) ist der fiese Teil in dieser Formel. Aber man muss nur wissen, was damit gemeint ist: Wir suchen das \(1-\frac{\alpha}{2}\)-Quantil, also das 0.975-Quantil (oder äquivalent das 97,5%-Quantil) der t-Verteilung, und zwar der mit \(n-1\) Freiheitsgraden – das sind bei uns 21, denn die Stichprobengröße ist hier \(n=22\).
      Wir brauchen also den Wert \(t_{0.975}(21)\). Dafür müssen wir in der Tabelle der t-Verteilung nun nachsehen, und zwar in der Spalte „Quantil = 0.975“, und in der Zeile „df = 21“. Der Wert der dort steht ist 2.080.
    • \(s\) ist die Standardabweichung in der Stichprobe, die wurde freundlicherweise schon in der Aufgabenstellung für uns berechnet: \(s = 11.43\).
    • \(\sqrt{n} = \sqrt{22} = 4.69\)

    Damit können wir jetzt alles in die Formel einsetzen:
    \[ 128.3 \pm 2.080 \cdot \frac{11.43}{4.69}\] Vereinfacht steht dann da \(128.3 \pm 5.069\), und somit geht das Konfidenzintervall von unten \(128.3 – 5.069 = 123.23\) bis oben \(128.3 + 5.069\) = 133.37.
    Wir können also sagen, dass mit 5%-iger Irrtumswahrscheinlichkeit der erwartete Blutdruck von Marathonläufern zwischen 123.23 und 133.37 liegt.

4 Gedanken zu „Konfidenzintervall für den Erwartungswert

  1. AvatarTilman Busch

    Hallo bei mir in der Formelsammlung steht : x¯± (σx/√n) * z1−(α/2) falls die wahre Varianz bekannt ist.. was ist denn nun richtig?

    Antworten
  2. AvatarEsra

    In den Lösungen zu b) ist ein kleiner Fehler. Dort steht für n=22, in der Aufgabenstellung jedoch n=24.
    Dies führt natürlich nur zu minimalen Fehlern, jedoch könnte es den einen oder anderen verwirren.

    Antworten
    1. AlexAlex Beitragsautor

      Hi Esra,
      vielen Dank für den Hinweis. Ich hab die Zahl in der Aufgabenstellung zu 22 korrigiert 🙂
      Viele Grüße
      Alex

      Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.