Varianz, Standardabweichung & Co
Streuungsmaße, auch Dispersionsmaße genannt, sind Kennwerte, die die Abweichung einer typischen bzw. repräsentativen Beobachtung vom "Zentrum" beschreiben. In der Praxis am häufigsten anzutreffen sind:
- Varianz
- Standardabweichung
Stellen Sie sich vor, Sie haben zwei Stichproben mit jeweils 3 Beobachtungen vorliegen.
Stichprobe | Körpergröße |
---|---|
1 | 1,70 cm |
1 | 1,70 cm |
1 | 1,70 cm |
2 | 1,60 cm |
2 | 1,70 cm |
2 | 1,80 cm |
Wie Sie wahrscheinlich sofort erkennen können, ist das arithmetische Mittel und der Median in beiden Stichproben ident (1,70 cm), aber die Beobachtungen streuen unterschiedlich um das "Zentrum". Und genau diese Streuung soll in einer Maßzahl zum Ausdruck kommen.
Da wir die "typische Abweichung" beschreiben wollen, bedeutet das letztlich, dass wir wissen wollen, was die "durchschnittliche Abweichung" einer Beobachtung bspw. vom Mittelwert ist. Damit wäre aber auch bereits gesagt, wie man vorgehen könnte. Man könnte nämlich ganz einfach für jeden Wert die Abweichung vom Mittelwert berechnen und dann die durchschnittliche Abweichungen berechnen. Die Tabelle zeigt, welches Problem dabei jedoch besteht.
Stichprobe | Körpergröße | Abweichung vom Mittelwert |
---|---|---|
1 | 1,70 cm | 0 cm |
1 | 1,70 cm | 0 cm |
1 | 1,70 cm | 0 cm |
2 | 1,60 cm | - 10 cm |
2 | 1,70 cm | 0 cm |
2 | 1,80 cm | + 10 cm |
Erkennen Sie das Problem? Das Problem ist, dass in beiden Stichproben die mittlere Abweichung 0 cm ist. D.h., die typische Beobachtung streut nicht um den Mittelwert - und das ist offensichtlich nicht richtig. Aber wodurch entsteht das Problem?
Das Problem ist, dass sich negative und positive Abweichungen aufheben. Daher ist die Lösung gefunden, wenn man dieses Problem behebt.
AD-Streuung
Berechnet man an Stelle der Abweichung die absolute Abweichung [1], gibt es keine negativen Werte mehr und wir sind das Problem los.
Wird nun der Mittelwert der absoluten Abweichungen berechnet, so ergibt sich in Stichprobe 1 eine AD-Streuung ("average-deviation") von 0 cm und in der 2. von 6,67 cm.
Stichprobe | Körpergröße | Absolute Abweichung vom Mittelwert |
---|---|---|
1 | 1,70 cm | 0 cm |
1 | 1,70 cm | 0 cm |
1 | 1,70 cm | 0 cm |
2 | 1,60 cm | 10 cm |
2 | 1,70 cm | 0 cm |
2 | 1,80 cm | 10 cm |
Damit wäre das Problem grundsätzlich gelöst, hat sich aber gleichzeitig ein anderes eingefangen. Das "neue" Problem hängt damit zusammen, dass es manchmal von Interesse ist zu berechnen, ob die Streuung minimal ist, und wie Sie aus der Mathematik vielleicht noch wissen, muss dazu die 1. (und 2.) Ableitung gebildet werden - und das geht nicht, wenn wir Absolutbeträge ansehen, weil Ableitungen stetige Variablen voraussetzen. Daher wäre es gut, wenn wir eine andere Lösung für unser Vorzeichenproblem finden könnten - was uns zur Varianz bringt.
Varianz
Man könnte nämlich alternativ ganz einfach alle Abweichungen quadrieren und den Mittelwert dieser quadrierten Abweichungen bilden.
Stichprobe | Körpergröße | Quadrierte Abweichung vom Mittelwert |
---|---|---|
1 | 1,70 cm | 0 cm2 |
1 | 1,70 cm | 0 cm2 |
1 | 1,70 cm | 0 cm2 |
2 | 1,60 cm | 100 cm2 |
2 | 1,70 cm | 0 cm2 |
2 | 1,80 cm | 100 cm2 |
Die solcherart berechnete Streuung beträgt in Stichprobe 1 wieder 0 und in Stichprobe 2 66,67 und bringt so die Unterschiede tatsächlich zum Ausdruck - aber was ist die Einheit?
Da die Abweichungen in Zentimeter ausgedrückt sind, haben die quadrierten Abweichungen die Einheit Quadratzentimeter und damit ein Flächenmaß (cm2) - und die Interpretation wird damit wenig intuitiv, weil was soll es bedeuten, dass eine typische Beobachtung um 66,67 cm2 von der mittleren Körpergröße abweicht?
Um ein Streuungsmaß zu erhalten, das in derselben Maßeinheit gemessen wird, wie die Variable selbst, muss von der Varianz die (Quadrat-)Wurzel gezogen werden. Das Ergebnis ist die Standardabweichung.
Standardabweichung
Die Standardabweichung beträgt in der 1. Stichprobe 0 cm und in der 2. Stichprobe 8,16 cm.
Umsetzung in SPSS
- Wählen Sie Analysieren ⟶ Deskriptive Statistiken ⟶ Häufigkeiten...
- Unter Statistik finden Sie die Lagemaße.
[1] Der Absolutbetragt kann als Abstand (bspw. zwischen zwei Punkten) ohne Richtungsangabe betrachtet werden und hat dementsprechend kein Vorzeichen.