Telekolleg - Mathematik


11

Telekolleg - Statistik III Varianz und Standardabweichung

Für große statistische Schlussfolgerungen sind die mittleren Abweichungen nur beschränkt einsetzbar. Hierzu verwendet man ein weiteres Streuungsmaß, die sogenannte mittlere quadratische Abweichung von einem Mittelwert und nennt diese Varianz.

Stand: 10.12.2019 | Archiv

Beispiel zur Statistik | Bild: BR

Für die Varianz klein v ergibt sich v ist 1 durch n mal Summe aus den Quadraten über xi minus x quer von i=1 bis i=n.

Für die 13 Beobachtungswerte erhält man als Standardabweichung s den Wert 7,38 - klicken Sie bitte auf die Lupe.

Allerdings sind nun die Einheiten quadriert (z.B. cm2), was nicht sinnvoll ist. Um diesem Problem aus dem Weg zu gehen und wieder auf die ursprüngliche Einheit zu kommen, zieht man die Quadratwurzel aus der Varianz und erhält die Standardabweichung klein s. s ist die Quadratwurzel aus v. Mit der Formel für v eingesetzt ergibt sich s ist Quadratwurzel aus 1 durch n mal der Summe über den Quadraten von x minus x quer von i=1 bis n.

Für die Berechnung einer Standardabweichung dient das gleiche Beispiel. Die Tabelle wird durch eine vierte Zeile ergänzt, in der die Quadrate über xi minus x quer eingetragen sind. Es ergeben sich die Werte 100 in Spalte x1 bis 400 in Spalte x13. Die Summe der vierten Zeile ergibt 708. Für die 13 Beobachtungswerte erhält man als Standardabweichung s die Quadratwurzel aus 1 durch 13 mal 708 gleich 7,38.

In vielen Fällen sind die mittlere quadratische Abweichung und die Standardabweichung günstiger anzuwenden als die mittlere Abweichung. Welches Streuungsmaß man am besten wählt, ergibt sich aus dem Typ der Verteilung und der zu behandelnden Problemstellung.

Die Summe der Schülerzahlen ist 25 - klicken Sie bitte auf die Lupe.

Bisher wurden Varianz und Standardabweichung auf der Grundlage einer Rangwertliste erstellt. Wie sieht es aber aus, wenn die Berechnung auf der Grundlage einer Häufigkeitstabelle erfolgt? Als Beispiel soll das Ergebnis einer Prüfungsaufgabe dienen. Es wurde 4 mal die Note 1, 5 mal die Note 2, 7 mal die Note 3, 6 mal die Note 4, 2 mal die Note 5 und 1 mal die Note 6 vergeben. Die Summe der Schülerzahlen der zweiten Zeile, Summe i=1 bis 6 von ni ergibt 25 Schüler.

Das arithmetische Mittel der Häufigkeitstabelle ergibt den Wert 3,0 - klicken Sie bitte auf die Lupe.

Nach der Formel x quer ist 1 durch n mal Summe von xi mal ni für i=1 bis i=k, also von 1 bis 6, erhalten wir x quer ist 1/25 mal Klammer auf 1·4 plus 2·5 plus 3·7 plus 4·6 plus 5·2 und plus 6·1, das ergibt den Wert 3,0. Das arithmetische Mittel mit dem Wert 3,0 zeigt uns in diesem Beispiel den Notendurchschnitt der Klasse an.

Berechnung der Varianz der Häufigkeitstabelle, 1. Schrittt - klicken Sie bitte auf die Lupe.

Um die Varianz zu berechnen, wird die bereits verwendete Formel v ist 1 durch n mal Summe aus den Quadraten über xi minus x quer von i=1 bis i=k angewendet. Jetzt handelt es sich aber um keine Rangwertliste, in der jeder Beobachtung genau ein Wert zugeordnet ist, sondern um eine Häufigkeitstabelle, in der jeder Beobachtung die betroffene absolute Häufigkeit zugeordnet wird. Deshalb muss das Quadrat aus der Differenz von xi und x quer mit dem Faktor der absoluten Häufigkeit multipliziert werden und es ergibt sich v ist gleich der bisherige Term mit dem Ergänzungsfaktor ni.

Berechnung der Varianz der Häufigkeitstabelle, 2. Schritt - klicken Sie bitte auf die Lupe.

D.h., v ist 1 durch 25, das war die Anzahl der Schüler, mal Klammer auf und nochmal Klammer auf Note minus Durchschnitt 3 Klammer zu zum Quadrat mal 4 – weil die Note 1 viermal vorkommt – plus... und das immer wieder für alle sechs Notenstufen. v = 1/25 · ( 16 + 5 + 0 + 6 + 8 + 9 ).

Berechnung der Varianz (3. Schritt) und der Standardabweichung der Häufigkeitstabelle - klicken Sie bitte auf die Lupe.

Die Varianz hat den Wert 1,76. Und wie erhalten wir jetzt noch die Standardabweichung? Dies ergibt sich nach der gleichen Gesetzmäßigkeit wie bei der Rangwertliste, nämlich aus s für Standardabweichung ist Quadratwurzel aus v. Für das Beispiel gilt s ist Quadratwurzel aus 1,76 und somit gleich 1,3266.

Standardabweichung bei Häufigkeitstabellen bei absoluter und relativer Häufigkeit - klicken Sie bitte auf die Lupe.

Zusammenfassend ergibt sich als Formel für die Standardabweichung bei Häufigkeitstabellen: s ist Quadratwurzel aus 1/n mal Summe über xi minus x quer zum Quadrat mal ni , i ist 1 bis k. Auch über die relative Häufigkeit lässt sich diese Standardabweichung ermitteln, hier gilt die Formel: s ist Quadratwurzel aus der Summe über xi minus x quer zum Quadrat mal hi von i ist 1 bis k, wobei die relative Häufigkeit hi gleich ni /n ist.

Die Standardabweichung ist ein Maß für die Aussagekraft des arithmetischen Mittels. Eine kleine Standardabweichung bedeutet, dass alle Beobachtungswerte nahe am Mittelwert liegen. Bei einer großen Standardabweichung sind die Beobachtungswerte weit um den Mittelwert gestreut.

Kleine und große Streuung der Beobachtungswerte

Grafisch kann man sich das folgendermaßen vorstellen: Sind die Beobachtungswerte nahe am Mittelwert anliegend, heißt das kleine Streuung, bzw. kleine Standardabweichung. Sind die Beobachtungswerte weit vom Mittelwert entfernt, bedeutet das eine große Streuung.

Glockenkurve bei Normalverteilungen

Häufigkeitstabelle der Prüfungsnoten

In einem Koordinatensystem grafisch dargestellt gibt die Häufigkeitstabelle der Prüfungsnoten eine Kurve in Glockenform. Auf der Rechtswertachse sind die Notenstufen und auf der Hochwertachse die absoluten Häufigkeiten der vorkommenden Noten angetragen. Es ergibt in diesem Fall eine Kurve mit einem höchsten Punkt, der zufälligerweise auch dem Mittelwert 3,0 unserer Verteilung entspricht.

Glockenkurve einer Normalverteilung

Verteilungen, welche in ihrer grafischen Darstellung die Form einer Glockenkurve aufweisen, nennt man Normalverteilungen. Sie sind eingipflig und annähernd symmetrisch. Die Kurve zeigt einen Extremwert und besitzt auch eine Art Symmetrieachse.

Einfluss der Standardabweichung s auf die Form der Glockenkurve

Welchen Einfluss hat die Standardabweichung s auf die Form der Kurve? Gegeben ist eine Kurve mit einer bestimmten Standardabweichung s1. Wird die Standardabweichung kleiner, also s2 kleiner als s1, so wird die Kurve schmäler, wird die Standardabweichung größer, angenommen s3 größer s1, so wird die Kurve breiter. Die Standardabweichung s gibt also die Streuung, das heißt die Breite der Verteilung an.

Statistik: Quiz | Bild: BR zum Quiz Telekolleg Mathematik Quiz: Statistik 3

Was wissen Sie noch über Quartilsabstand, mittlere Abweichung, arithmetisches Mittel, Varianz und Standardabweichung? Testen Sie Ihr Wissen! [mehr]


11