Telekolleg - Statistik III Spannweite und der Quartilsabstand
Streuungsmaße, bei denen der Mittelwert keine Rolle spielt, sind die Spannweite und der Quartilsabstand. Die Spannweite ist das einfachste Streuungsmaß und berechnet sich als Distanz zwischen dem größten und dem kleinsten Messwert.
Die Spannweite ist die Distanz zwischen dem größten und dem kleinsten Messwert - klicken Sie bitte auf die Lupe.
Als Beispiel dient wieder die Größenaufstellung der männlichen Telekollegteilnehmer. Hier ist der Abstand von xmin bis xmax die Spannweite w, d.h. die Differenz zwischen dem größten und dem kleinsten Wert einer Reihe von Beobachtungswerten xi wird als Spannweite w bezeichnet.
Die Spannweite ist also ein Maß für die Breite des Streubereichs einer Häufigkeitsverteilung. Eventuelle Ausreißer als kleinster oder größter Wert können aber zu Ergebnisverfälschungen führen. Um diese Ausreißer unter den Daten für weitere Interpretationen unschädlich zu machen, wählt man statt der Spannweite gerne den sogenannten Quartilsabschnitt.
Quartile sind Teilbereiche, die jeweils 25 Prozent der Beobachtungswerte beschreiben - bitte klicken Sie auf die Lupe.
Die Tabelle zeigt die Rangwertliste für die Körpergrößen. Der Median teilt den sortierten Datensatz so, dass links und rechts gleich viele Beobachtungswerte liegen. Unterteilt man die linke und die rechte Hälfte nach der gleichen Vorschrift, wie man den Median bestimmt, so erhält man vier gleich große Bereiche, die durch drei Quartile aufgeteilt werden.
Es ergeben sich Teilbereiche, die jeweils 25 Prozent der Beobachtungswerte beschreiben. 25% kleinste Werte und 25% größte Werte. Die Grenzen bilden das 1. und das 3. Quartil. Zwischen diesen beiden Quartilen liegen 50% aller Beobachtungswerte. Dieser Bereich, der mittlere 50% - Bereich aller Beobachtungswerte heißt Quartilsabstand Q. Für die Berechnung gilt:
Der Quartilsabstand
Der Quartilsabstand Q ist gleich der Differenz aus dem dritten und dem ersten Quartil.
In unserem Beispiel also ist Q gleich 7. 50 % der Daten liegen also in einem Bereich der Bandbreite 7 cm bzw. 50 % der Körpergrößen liegen zwischen 178 cm und 185 cm.
Gegenüber der Spannweite ist also der Quartilsabstand von Ausreißern unabhängig, da er die Breite des mittleren Bereichs angibt, in dem ca. 50% aller Werte liegen. Dem zu folge liefert er genauere Informationen als die Spannweite. Er gibt aber nur Informationen über die Breite der Verteilung.
Mittlere Abweichungen
Der Beobachtungswert bildet den Zentralwert, jeder andere Beobachtungswert hat einen bestimmten Abstand davon - bitte klicken Sie auf die Lupe.
Ein Streuungsmaß, das die durchschnittliche Abweichung der Werte von einem Mittelwert angibt, ist die "mittlere Abweichung". Die mittlere Abweichung kann von verschiedenen Mittelwerten berechnet werden. Als Beispiel dient zunächst die mittlere Abweichung vom Zentralwert der Größenrangwertliste. Der Beobachtungswert x7 der Tabelle bildet den Zentralwert. Jeder andere Beobachtungswert, z.B. der Wert für x3, hat einen bestimmten Abstand vom Zentralwert, hier x3 minus xz. Der Beobachtungswert x9 hat den Abstand x9 minus xz. Für x3 minus xz ergibt sich, da die Rangwertliste der Größe nach geordnet ist, ein negativer Zahlenwert, hier minus drei. Da Abstände aber nur einen positiven Wert aufweisen können, wählt man den Betrag, also plus drei. x9 - xz ist positiv, die Abweichung beträgt zwei.
Um den Mittelwert zu erhalten, muss man die 13 ermittelten Abstände addieren und dann den Summenwert durch 13 teilen - klicken Sie auf die Lupe.
Jeder Beobachtungswert der Liste hat seinen besonderen Abstand. Man erhält also bei n Beobachtungen n Abstände, in unserem Beispiel 13. Möchte man daraus den Mittelwert erhalten, muss man die 13 ermittelten Abstände addieren und dann den Summenwert durch 13 teilen. Dazu wird die Rangwertliste um die Zeile Betrag von xi – xz erweitert. x7 bildet den Zentralwert und es ergeben sich in der dritten Zeile der Tabelle x1 minus xz Betrag 8, x2 minus xz Betrag 5, und so weiter. Bildet man nun die Summe von i = 1 bis n, in unserem Fall 13 der ermittelten Beträge xi minus xz , so ergibt sich der Wert 68. Um die mittlere Abweichung zu erhalten, muss dieser Wert durch die Anzahl n der Beobachtungswerte, also 13, geteilt werden und es ergibt sich 5,23.
Gibt man dieser mittleren Abweichung vom Zentralwert einen Namen, beispielsweise dz – d Distanz und z Zentralwert – so erhält man eine Formel zur Berechnung der mittleren Abweichung vom Zentralwert: dz ist 1 durch n mal die Summe der Beträge xi minus xz von i=1 bis n. Wählt man für Zentralwert den Begriff Median gilt dementsprechend dmed ist 1 durch n mal die Summe der Beträge xi minus xmed von i=1 bis n.
Tabellen mit den Körpergrößen und den Abweichungen vom arithmetischen Mittel - bitte klicken Sie auf die Lupe.
Wie die mittlere Abweichung vom Median lässt sich auch die mittlere Abweichung vom arithmetischen Mittel x quer berechnen. Das arithmetische Mittel x quer ist 1 geteilt durch n mal Summe von xi für i=1 bis n.
Die mittlere Abweichung e vom arithmetischen Mittel ergibt den Wert 5,38 - bitte klicken Sie auf die Lupe.
Es ergibt sich für die bekannte Rangwertliste der Körpergrößen der Wert x quer gleich 182 und somit für Betrag von xi minus x quer in der dritten Zeile der Tabelle die Werte von 10 bei x1 bis 20 bei x13. In der Formel für die Abweichung vom Zentralwert steht statt xz bzw xmed nun x quer. Wählt man für die mittlere Abweichung vom arithmetischen Mittel den Buchstaben e, so ergibt sich die Formel e ist gleich 1 durch n mal die Summe der Beträge xi minus x quer von i=1 bis i=n. Im Beispiel gilt e = 5,38 .