Prognose mit neuen Daten

Im vorherigen Artikel haben wir gelernt, wie man die beiden Koeffizienten a und b berechnet. Jetzt möchten wir mit Hilfe der Parameter auch für neue Daten x vorhersagen, welchen Wert für y wir erwarten.

Das Ziel, das wir mit der Regression erreichen wollen, ist nämlich folgendes: Angenommen es kommt eine neue Person, von der wir nur die Körpergröße x=170 wissen. Was ist dann der Erwartungswert der Ringgröße y? Wir suchen also \mathbb{E}(y|x), den bedingten Erwartungswert von y, gegeben man kennt x.

Vorhersage bei der einfachen linearen Regression

Bei der einfachen linearen Regression gibt es ja nur eine Einflussgröße x. Die Regressionsgerade lautet also

 y = a + b\cdot x

Um eine Vorhersage für die Zielgröße y zu erhalten, müssen wir also einfach den zugehörigen Wert für x in die Gleichung einsetzen. Die Werte für a und b haben wir vorher schon berechnet.

Als Beispiel: Im Beispiel aus dem vorherigen Artikel haben wir die Werte a=2.8457 und b=0.2836 bestimmt. Welche Ringgröße ist nun bei deiner Freundin zu erwarten, wenn sie eine Körpergröße von x=170cm hat? Dafür berechnen wir:

 y = a + b\cdot x = 2.8457 + 0.2836 \cdot 170 = 51.06

Ein Ring mit der Größe 51 sollte also gut bei ihr passen.

Es ist hier noch wichtig zu erwähnen, dass wir nur den Erwartungswert von y vorhersagen. Die Ringgröße wird also nicht exakt 51.06 sein, sondern es gibt immer einen kleinen Fehler, den man im linearen Modell \epsilon (sprich: Epsilon) nennt. In Wirklichkeit lautet die Regressionsgleichung also

 y = a + b \cdot x + \epsilon

wobei \epsilon einen zufälligen und unbekannten Fehler bezeichnet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.