Idee
Die Normalverteilung ist aus vielen Gründen die wichtigste Verteilung in der Statistik:
- Modelle (zum Beispiel das lineare Regressionsmodell) mit Normalverteilung sind besonders einfach zu rechnen, da die Formeln zur Bestimmung der Parameter
im Normalverteilungsfall sehr leicht auszuwerten sind. - Der Durchschnitt einer Stichprobe mit beliebiger Verteilung folgt einer Normalverteilung. Das ist weitaus wichtiger als es beim ersten Mal lesen klingt. Ich kann 100 Zufallszahlen aus irgendeiner Verteilung (stetig oder diskret, auch selbstgebastelte Verteilungen mit irgendeiner Dichte) ziehen, und ihr Mittelwert folgt immer einer Normalverteilung. Dieses Phänomen ist als zentraler Grenzwertsatz bekannt, und wird z.B. beim klassischen
-Test wichtig. Dort bildet man nämlich einen Stichprobenmittelwert und nutzt aus, dass er annähernd normalverteilt ist. - Viele natürliche Merkmale folgen einer Normalverteilung. Besonders wenn es ein Merkmal ist, dass aus dem Durchschnitt vieler einzelner Eigenschaften gebildet wird, ist das Resultat am Ende zumindest annähernd normalverteilt. Die Körpergrösse einer Person ist zum Beispiel das Ergebnis (der „Durchschnitt“) vieler verschiedener genetischen Faktoren, und kann für ein gegebenes Geschlecht auch sehr gut mit einer Normalverteilung modelliert werden.
Parameter
Die Glockenkurve der Normalverteilung ist abhängig von zwei Parametern: Dem Mittelwert
Mit dem Mittelwert
Vorsicht: Der Parameter ist meist die Varianz, also
Träger
Bei jeder Normalverteilung, also egal welche Parameter
Das erscheint vielleicht etwas seltsam, da man die Normalverteilung oft auch dazu verwendet, Dinge wie die Körpergrösse zu modellieren, und es kann ja keine negativen Körpergrössen geben. Man sollte aber zwei Dinge beachten:
- Bei der Modellierung der Körpergrösse wird zum Beispiel eine Normalverteilung mit
cm und verwendet. Da liegt die Wahrscheinlichkeit, dass eine Realisation kleiner als 0 herauskommt, bei ungefähr . Diese Zahl ist eine Null, ein Komma, 60 Nullen, und dann erst eine zwei. Das ist so vernachlässigbar klein, dass in der gesamten Geschichte der Menschheit keine Person in diesem Bereich erwartet wird. - Die Normalverteilung ist natürlich nur ein „gut genug“ passendes Modell, das zur Beschreibung der Körpergrösse verwendet wird. Die wahre Verteilung der Körpergrösse von Menschen sieht anders aus (und hat natürlich nur einen positiven Träger), aber niemand kennt diese Verteilung, und sie lässt sich wohl auch nicht durch eine so einfache Formel hinschreiben. Daher verwendet man bekannte Verteilungen als Approximation. Man sagt, dass eine bestimmte Verteilung gut genug zur Modellierung ist, und nimmt solche, mit denen man besonders einfach rechnen kann.
Erwartungswert
Der Erwartungswert ist direkt der erste Parameter,
Varianz
Die Varianz der Normalverteilung ist der zweite Parameter,
Dichte
Die Dichtefunktion einer normalverteilten Zufallsvariablen
Wenn man sich statt der Varianz
Verteilungsfunktion
Die Verteilungsfunktion der Normalverteilung kann man nicht mit einer Formel im Taschenrechner berechnen. Das Integral über die Dichtefunktion lässt sich nämlich nicht mit Stift und Papier lösen:
Man nimmt daher eine Verteilungstabelle her, die man häufig am Ende von Statistikbüchern, oder in der Anlage zu Klausuren findet. Wie man die abliest, wird im entsprechenden Artikel erklärt.
Zum Ablesen von Verteilungstabellen
Nun hat man das Problem, dass es unendlich viele Normalverteilungen gibt, mit jeweils unterschiedlichen Parametern
Standardisieren von normalverteilten Zufallsvariablen
Angenommen, wir haben eine Zufallsvariable

Die linke Fläche, d.h.
Man standardisiert eine normalverteilte Zufallsvariable
Das Teilen durch die Standardabweichung streckt bzw. staucht die Glockenkurve so, dass danach ihre Varianz gleich 1 ist.
Damit kann man nun die Verteilungsfunktion jeder beliebigen Normalverteilung bestimmen.
Es gilt also:
Die Standardnormalverteilung wird dabei statt
Damit können wir nun den oben gesuchten Wert
Den Wert 0.8413 haben wir dabei mit der Verteilungstabelle bestimmt. Wir mussten die Umrechnung
Der Wert
Aufgaben zum Standardisieren
Das Standardisieren muss man einfach einige Male drillen, dann hat man das Prinzip verinnerlicht und Leichtsinnsfehler beseitigt. Bestimme zur Übung die folgenden Werte für verschiedene Normalverteilungen. Beachte, dass der zweite Parameter,
- a) Sei
. Bestimme . - b) Sei
. Bestimme . - c) Sei
. Bestimme . - d) Sei
. Bestimme . - e) Sei
. Bestimme .
Quantile bestimmen
Das
Man schlägt zuerst das
Aufgaben zum Bestimmen von Quantilen
- a) Sei
. Bestimme das 75%-Quantil . - b) Sei
. Bestimme das 50%-Quantil . - c) Sei
. Bestimme das 97.5%-Quantil . - d) Sei
. Bestimme das 2.5%-Quantil . - e) Sei
. Bestimme das 10%-Quantil .
Hi,
ich bin keine Mathematikerin. Daher meine vielleicht „unfachliche“ Frage: Ab welcher „Größe“ kann ich von einer Gauß´schen Normalverteilung ausgehen, d. h. wie viele Vergleichswerte brauche ich. Müssen es 100 sein oder reichen z. B. auch 25?
Vielen Dank vorab!
Oh, Vorsicht! Wenn die Stichprobe nicht normalverteilt ist, dann ist sie es auch bei 100 Beobachtungen nicht. Aber ihr Mittelwert wird zunehmend „normalverteilter“ werden. Die meisten Leute orientieren sich da an 30 Beobachtungen, ab der sie einfach eine Normalverteilung verwenden.
Hi Alex,
erstmal vielen Dank für deinen Blog, ist wirklich super hilfreich in der Klausurvorbereitung !
Ich hab eine Frage zur Standardisierung von Zufallsvariablen : Ist die Standardisierung nur bei normalverteilten Zufallsvariablen möglich? In unserem Skript steht, dass man die Formel zur Standardisierung nutzen kann, wenn es sich um eine ZV mit Erwartungswert μ und Standardabweichung
𝜎 > 0 handelt, aber die könnte ich ja auch von anderen Verteilungen bilden..
Würde mich super über eine Antwort freuen,
LG Anna
Ja, man kann Daten mit beliebigen Verteilungen standardisieren. Manchmal macht das Sinn, wenn z.B. alle Variablen in einem ähnlichen Bereich „leben“ sollen.
Der einzige Unterschied im Spezialfall von normalverteilten Daten ist, dass man dann eben *standard*normalverteilte Daten erhält, d.h. immer noch normalverteilte Daten, aber jetzt mit und .
VG,
Alex
Hallo Alexander,
vorab: Machst sehr stabile Arbeit mit deinem Blog. Habe hiermit nur für meine Klausur gelernt und mein Tutorium bedient sich auch vieler deiner Erklärungen.
Frage: Müsste es bei „Aufgaben zum Bestimmen von Quantilen“ bei Aufgabe a) nicht „q0.75“ statt „q0.25“ sein?
Freundliche Grüße
Khai
Hallo Khai,
ja, da habe ich mich verschrieben. Ist korrigiert, vielen Dank für den Hinweis 🙂
Mann, du machst eine riesige Arbeit. Top!
P.S. du hast minus auf dem Schaubild vom Standardisieren vergessen . P(Z<=-1) statt P(Z<=1)
Oh stimmt, danke. Ich habs gerade korrigiert 🙂
Hammer, vielen vielen Dank!
Beim Standardisieren einer normalverteilten Zufallsvariable hast du bei x=1 das Minus vergessen.
Aber mach weiter so, deine Seite ist wirklich sehr übersichtlich, verständlich und informativ
Oh, richtig! Vielen Dank, ich habs gerade verbessert.
Viele Grüße,
Alex
Dieser Artikel hat mir grad so sehr geholfen, vielen Dank!!! 🙂
Hi, woher weiß ich denn dass es 3SIGMA sind?
Das ist nur eine ungefähre Angabe, keine genaue Regel.
VG,
Alex
Bei der Beispielaufgabe ganz unten a) steht: “ Die Standardabweichung σ ist 10. Die Glockenform fällt also im Bereich vom Mittelwert 175 bis zu ±3σ, also im Intervall [145,195] ab“ .
Müsstes es nicht [145,205] sein?
Ja, richtig. Ich habe es gerade korrigiert – vielen Dank! 🙂