Gepaarter t-Test: Vorher/Nachher-Mittelwertsvergleich

Der gepaarte t-Test wird immer dann verwendet, wenn man zwar zwei Stichproben (d.h. zwei „Gruppen“) hat, diese aber verbunden sind. Verbunden bedeutet in diesem Fall, dass jeder Beobachtung aus der ersten Gruppe direkt eine aus der zweiten Gruppe zugeordnet werden kann, die beiden Beobachtungen gehören also zusammen. In den meisten Fällen ist das der Fall, wenn man einen vorher/nachher-Vergleich machen möchte. Andere Fälle, in denen die Beobachtungen zweier Gruppen „zusammengehören“, also verbunden sind, sind zum Beispiel Zwillingsstudien, in denen je ein Zwilling in eine Gruppe kommt, und dann Unterschiede bezüglich Verhalten oder Eigenschaften getestet werden.

Als Beispiel eines vorher/nachher-Vergleichs misst man etwa bei 9 Personen den Blutdruck, führt sie dann 30 Minuten durch eine Meditation, und misst danach an denselben Personen nochmal den Blutdruck.

In diesem Beispiel könnten die Daten dann wie folgt aussehen:

Person \(x_i\) Blutdruck vorher Blutdruck nachher
1 130 124
2 145 142
3 151 138
4 143 143
5 129 122
6 138 141
7 143 140
8 113 108
9 133 127

Wir möchten nun zum Signifikanzniveau \(\alpha=0.1\) testen, ob diese Personen nach der 30-minütigen Meditation einen niedrigeren Blutdruck haben, ob sich also der durchschnittliche Blutdruck gesenkt hat.

Das Schöne an einer gepaarten Stichprobe ist nun, dass wir uns eines Tricks bedienen können, nach dem wir dann einfach den bekannten Einstichproben-t-Test verwenden können:

Da die beiden Gruppen verbunden sind, es also jeweils dieselbe Person in der vorher- bzw. nachher-Gruppe ist, können wir für jede Person die Differenz der beiden Messungen berechnen. Wir fügen eine neue Spalte an die Tabelle von eben an, in der wir einfach „nachher minus vorher“ rechnen:

Person \(x_i\) Blutdruck vorher Blutdruck nachher Differenz / „Effekt“
1 130 124 -6
2 145 142 -3
3 151 138 -13
4 143 143 0
5 129 122 -7
6 138 141 +3
7 143 140 -3
8 113 108 -5
9 133 127 -6

Wir rechnen „nachher minus vorher“, und nicht „vorher minus nachher“, damit eine negative Zahl, z.B. -6, darauf hindeutet, dass der Blutdruck nach der Meditation gesunken ist.

Die letzte Spalte beinhaltet nun also den „Effekt“ der Meditation (falls es einen gibt). Die erste Person hatte zum Beispiel nach der Meditation einen um 6 Punkte niedrigeren Blutdruck als vorher.

Der bequeme und erfreuliche Effekt dieser Nebenrechnung ist jetzt, dass wir die Vorher- bzw. Nachher-Messungen wegwerfen können, und nur noch mit der Differenz weiterarbeiten. Da das nur noch eine einzige Variable ist, können wir mit ihr den bereits bekannten Einstichproben-t-Test durchführen.

Die Hypothesen werden dann abhängig davon gebildet, welchen Effekt man testen möchte. Wenn wir – wie in diesem Beispiel – nachweisen möchten, dass die Nachher-Messung niedriger ist, dann wäre die Alternativhypotese demnach, dass der Mittelwert der eben berechneten Differenzen kleiner als Null ist, also \(H_1: \mu < 0\). (Warum das so ist, wird in diesem Artikel erklärt).

Ab jetzt können wir also den Einstichproben-t-Test durchführen, und brauchen hier daher kein neues Vorgehen, keine separate Erklärung mehr. Die Daten, mit denen wir den Einstichproben-t-Test durchführen, sind:

  • \(H_0: \mu \geq 0\)
  • \(H_1: \mu < 0\)
  • Signifikanzniveau: \(\alpha = 0.1\)
  • \(x = (-6, -3, -13, 0, -7, +3, -3, -5, -6)\). Das ist die letzte Spalte der Tabelle oben, unsere „neue“ Stichprobe, nämlich die der Differenzen von vorher zu nachher.

Damit können wir direkt in Schritt 5 der Abfolge beim Hypothesentest einsteigen, dem Berechnen der Prüfgröße. Dieser und alle weiteren Schritte kann man nun genauso durchführen wie im Artikel zum Einstichproben-t-Test erklärt.

Ergebnis

Wer diese Aufgabe selbst zuende rechnen und nachprüfen möchte, für den fasse ich hier die Ergebnisse kurz zusammen. Das Vorgehen ist wie gesagt im entsprechenden Artikel detailliert beschrieben.

  • Mittelwert: \(\bar{x} = -4.444\)
  • Standardabweichung: \(s = 4.531\)
  • Stichprobengröße: \(n = 9\)

Schritt 5: Prüfgröße berechnen

\[T = \sqrt{n} \cdot \frac{\bar{x} \, – \, \mu_0}{s} = \sqrt{9} \cdot \frac{-4.444 \, – \, 0}{4.531} = -2.942 \]

Schritt 6: Verteilung der Prüfgröße bestimmen

\[T \sim t(8) \]

Schritt 7: Kritischen Bereich (oder p-Wert) berechnen

Vorsicht: In dieser Aufgabe ist das Signifikanzniveau \(\alpha\) nicht 0.05, wie es normalerweise ist, sondern 0.1.

Der kritische Bereich ist das linke Ende der t-Verteilung, die „niedrigen“ Zahlen, denn die Alternativhypothese zielt auf Bereiche ab, in denen die Differenz stark negativ ist.

Für die kritische Schranke brauchen wir das 10%-Quantil der t-Verteilung mit 8 Freiheitsgraden. Laut t-Tabelle ist es -1.383.

Der kritische Bereich, in dem wir die Nullhypothese ablehnen, sind also alle Werte für \(T\), die kleiner als -1,383 sind.

Schritt 8: Testentscheidung treffen

Hier ist \(T=-2.942\), und der kritische Bereich ist alles was kleiner als -1,383 ist. Daher liegt die Prüfgröße im kritischen Bereich, und somit können wir die Nullhypothese bei dieser Untersuchung ablehnen.

Klausuraufgabe

Für ein neues Medikament soll geprüft werden, ob es einen Einfluss auf die Reaktionszeit von Patienten hat. Dabei sollen beide Seiten geprüft werden, also sowohl ob sie länger wird, als auch ob sie kürzer wird.

Dazu wird bei 8 Patienten die Reaktionszeit in einem kurzen Test gemessen: Man zeigt ein großes X auf dem Bildschirm, und misst die Zeit in Millisekunden (ms), bis die Person mit der Maus klickt.

Im Anschluß wird diesen Patienten eine Dosis des neuen Medikaments gegeben, und derselbe Test nochmal durchgeführt. Die Ergebnisse sind in der folgenden Tabelle zusammengefasst:

Person \(x_i\) Reaktionszeit vorher Reaktionszeit nachher
1 300ms 268ms
2 520ms 522ms
3 412ms 384ms
4 324ms 295ms
5 292ms 262ms
6 378ms 339ms
7 401ms 359ms
8 264ms 235ms

Führe einen Hypothesentest zum Niveau \(\alpha=0.1\) durch, um zu prüfen ob die mittlere Reaktionszeit durch das Medikament verändert wurde. Wir können für diese Aufgabe vereinfachend von einer Normalverteilung der Reaktionszeit ausgehen.

Lösung (klick)

Wir gehen nach den üblichen 8 Schritten beim Testen vor:

1. Hypothesen aufstellen

Da wir sowohl eine kürzere als auch eine längere Reaktionszeit entdecken möchten, verwenden wir hier einen zweiseitigen Test. Die Hypothesen lauten also erstmal

  • \(H_0: \mu_{\text{vorher}} = \mu_{\text{nachher}}\)
  • \(H_1: \mu_{\text{vorher}} \neq \mu_{\text{nachher}}\)

Wir sehen aber, dass es sich um eine verbundene Stichprobe handelt, daher können wir direkt die Differenzen der beiden Reaktionszeiten verwenden. Wenn wir uns nur auf diese Differenzen und ihren Mittelwert konzentrieren, können wir die Hypothesen umformen und vereinfachen:

  • \(H_0: \mu_d = 0\)
  • \(H_1: \mu_d \neq 0\)

2. Test wählen

Anhand der Tabelle zur Testwahl finden wir den passenden Test: Wir haben eine normalverteilte Zielgröße, und als Einflussgröße zwei Gruppen, die allerdings gepaart sind. Daher ist der gepaarte t-Test hier angebracht.

3. Signifikanzniveau festlegen

Das Niveau \(\alpha\) wird in Klausuraufgaben meist vorgegeben sein. Hier ist es \(\alpha = 0.1\)

4. Daten sammeln

Die rohen Daten sind schon gegeben, aber wir müssen noch die Differenzen berechnen. Für die erste Person erhalten wir z.B. 268ms – 300ms = -32ms, also eine um 32ms niedrigere Reaktionszeit. Insgesamt sind unsere Daten dann:

\[x = (-32, +2, -28, -29, -30, -39, -42, -29) \]

5. Prüfgröße berechnen

Ab hier geht es weiter wie beim Einstichproben-t-Test. Die Prüfgröße berechnet man durch

\[ T = \sqrt{n} \cdot \frac{\bar{x} \, – \, \mu_0}{s} \]

Die einzelnen Werte berechnen wir:

  • Die Stichprobengröße \(n = 8\)
  • Der Mittelwert \(\bar{x} = -28.375\)
  • Die Standardabweichung \(s = 13.298\)
  • Der unter \(H_0\) angenommene Mittelwert der Differenz. Da unter \(H_0\) die beiden Mittelwerte gleich sein sollen, wäre dann der Mittelwert der Differenz \(\mu_0 = 0 \)

Die Prüfgröße ist im Ergebnis also:

\[ T = \sqrt{8} \cdot \frac{-28.375 \, – \, 0}{13.298} = -6.035\]

6. Verteilung der Prüfgröße bestimmen

Falls die Nullhypothese gilt, dann ist unsere Prüfgröße \(T\) t-verteilt mit \(n-1\), also mit 7 Freiheitsgraden:

\[ T \sim t(7)\]

7. Kritischen Bereich (oder p-Wert) berechnen

Den kritischen Bereich erhalten wir aus der Tabelle der t-Verteilung. Da wir einen zweiseitigen Test verwenden, und das Signifikanzniveau aus dem 2. Schritt \(\alpha = 0.10\) ist, suchen wir zwei Schranken, auf der linken sowie rechten Seite der t-Verteilung, wo sich jeweils die äußeren 5%, also die Hälfte der 10% aus dem Signifikanzniveau 0.10 befinden. Wir brauchen also das 5%-Quantil sowie das 95%-Quantil der t-Verteilung mit 7 Freiheitsgraden.

Laut Tabelle ist das 95%-Quantil bei 7 Freiheitsgraden 1,895. Wegen der Symmetrie der t-Verteilung wissen wir dann auch, dass das 5%-Quantil genau das Negative des 95%-Quantils ist, also -1.895.

Falls also die Prüfgröße \(T\) kleiner als -1.895 oder größer als 1.895 ist, können wir die Nullhypothese ablehnen, andernfalls behalten wir sie bei.

8. Testentscheidung treffen

In Schritt 5 haben wir die Prüfgröße berechnet als \(T=-6.035\). In Schritt 7 haben wir den kritischen Bereich bestimmt als der Bereich kleiner als -1.895, und der Bereich größer als 1.895. Da die Prüfgröße extrem klein ist, liegt sie im kritischen Bereich (im linken Teil). Wir lehnen die Nullhypothese daher ab, und haben ausreichende Beweise für die Alternativhypothese \(H_1\) gefunden.

Wir können also schlussfolgernd nachweisen, dass die Reaktionszeit durch das Medikament verändert, und genauer gesagt verkürzt wurde.

2 Gedanken zu „Gepaarter t-Test: Vorher/Nachher-Mittelwertsvergleich

  1. AvatarMaja Santo

    Vielen Dank für diese tolle Seite!
    Ich habe die Beispiel-Aufgabe zur Übung (gepaarter t-test) zur Übung mal nachgerechnet und ich glaube du hast bei Schritt 5: Prüfgröße berechnen vergessen den Bruch *√9 zu rechnen. Im Ergebnis könnte dann doch die H0 abgelehnt werden, was man vom intuitiven Beurteilen der Differenzwerte oben ja auch annehmen würde, oder?

    VG
    Maja

    Antworten
    1. AlexAlex Beitragsautor

      Hallo Maja,
      du hast Recht, da habe ich die \(\sqrt{9}\) vergessen 🙂 Ich hab den Artikel gerade korrigiert. Vielen Dank für den Hinweis!
      Liebe Grüße
      Alex

      Antworten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.