Binomialverteilung
Man kann nun für diesen durchgeführten Zufallsversuch die Wahrscheinlichkeiten nicht nur empirisch bestimmen, sondern die einzelnen Ergebnisse mit einer sogenannten Binomialverteilung auch berechnen.
Die Formel dafür setzt sich so zusammen: B steht für Binomialverteilung von n, für die Gesamtzahl der Möglichkeiten, in unserem Fall die 60 Kugeln in der Urne; p für die Trefferwahrscheinlichkeit und k für die Anzahl der Treffer. B ist gleich n über k mal p hoch k mal 1 minus p in Klammern hoch n minus k.
Dabei wird "n über dem k in einer Klammer" auch so gesprochen und heißt n über k. Es ist eine Kurzschreibweise für n/1 · (n-1)/2 · (n-2)/drei · ... bis [n - (k-1)]/k. Zum Beispiel bedeutet "5 über 3" = 5/1 · (5 - 1)/2 · (5 – 2)/3 = 10.
Ein zweites Beispiel: "60 über 2" = 60/1 · (60 – 1)/2 = 1770.
Praktisches Beispiel
Mit dieser Formel lässt sich zum Beispiel berechnen, wie groß ist die Wahrscheinlichkeit ist, bei 60 Griffen in die Urne keine gelbe Kugel zu erwischen: n steht für 60 Zugriffe, p für die Trefferwahrscheinlichkeit bei 15 gelben Kugeln aus 100 Kugeln eine gelbe zu greifen, also 15/100 = 0,15. k steht für die Anzahl der Treffer. Für k = 0 ergibt sich dann "60 über 0" · 0,150 · (1 - 0,15)60-0.
Aus der Potenzrechnung ist bekannt, dass jede Zahl hoch Null gleich eins ist, ferner hat jeder Binomialkoeffizient "n über Null" den Wert 1. "60 über Null" = 1, d.h. 1 · 0,150 · (1 - 0,15)60-0 = 1 · 1 · 0,8560 = 5,823 · 10-5. Die Wahrscheinlichkeit, bei 60 Zugriffen keine gelbe Kugel zu bekommen ist 0,00005, also nahezu Null.
Schließlich, um eine Tendenz zu erkennen, noch die Wahrscheinlichkeit, 2 gelbe Kugeln aus 60 zu greifen: "60 über 2" · 0,152 · (1 - 0,15)60-2 = 60/1 · (60-1)/2 · 0,152 · 0,8558 = 3,210·10-3 .
Tabellarische und grafische Darstellung
Die Werte für die Wahrscheinlichkeit wachsen und sind jetzt nicht mehr annähernd gleich Null, sie bewegen sich schon im Tausendstelbereich. Die Tabelle zeigt die Wahrscheinlichkeiten für alle 15 Kugeln. In der linken Spalte steht die Anzahl der gelben Kugeln und in der rechten Spalte die dazugehörige Wahrscheinlichkeit.
Stellt man die Tabellenwerte grafisch dar, indem auf der Rechtswertachse die Anzahl der gelben Kugeln und an der Hochwertachse die Wahrscheinlichkeiten aufgetragen werden, gibt sich der farbig gekennzeichnete Graph. Setzt man noch Schranken bei jeweils 5 % ein, so lässt sich erkennen, dass die Anzahl der gegriffenen gelben Kugeln zu über 90 Prozent zwischen 5 und 13 liegt.
Analyse der Ergebnisse
Eine Analyse dieser Ergebnisse zeigt, dass bei einer Stichprobe von 60 gegriffenen Kugeln aus einer Urne mit 85 schwarzen und 15 gelben Kugeln die Wahrscheinlichkeit gelbe Kugeln zu greifen mit mehr als 90 Prozent zwischen 5 und 13 liegt. Auf die Studie zur neuen Skilehrmethode übertragen bedeutet dies, dass die Anzahl der gestürzten Skifahrer mit über 90-prozentiger Wahrscheinlichkeit zwischen 5 und 13 liegt, wenn die Nullhypothese als Basis dient. In der Studie am Skihang sind aber von 60 Kursteilnehmern nur vier gestürzt, somit ist die Hypothese H0 zu verwerfen. Die Alternativhypothese HA hat Gültigkeit, die besagt, dass die neue Methode zum Erlernen des Skifahrens besser ist als die alte.
Vollständiger Hypothesentest
Bestandteile eines vollständigen Hypothesentests:
- Aufstellen von Nullhypothese und Alternativhypothese
- Festlegung einer Irrtumswahrscheinlichkeit (Signifikanzniveau)
- Bestimmung einer Testverteilung
- Berechnung eines Wahrscheinlichkeitswertes
- Annahme oder Ablehnung der Nullhypothese
- Interpretation des Testergebnisses
Trotz des scheinbar großen rechnerischen Aufwands handelt es sich hier um einen sehr vereinfachten Hypothesentest. Ein vollständiger Hypothesentest besteht aus folgenden Teilen: Zu Beginn steht das Aufstellen einer Nullhypothese und der dazugehörigen Alternativhypothese. Dann folgt die Festlegung einer Irrtumswahrscheinlichkeit, oftmals als Signifikanzniveau bezeichnet, worauf hier verzichtet wurde. Danach wird die Testverteilung bestimmt. Dann wird ein Wahrscheinlichkeitswert mittels der Daten einer Stichprobe berechnet. Zum Schluss folgt die Annahme oder Ablehnung der Nullhypothese. Als Zusatzaufgabe kann man das Testergebnis noch interpretieren.
Ein Sechser im Lotto?
Zum Schluss dieses Beitrags folgt die Berechnung einer Wahrscheinlichkeit, die sehr viele interessiert. Wie groß ist die Wahrscheinlichkeit, im Lotto "6 aus 49" den Hauptgewinn, also für 6 richtige Zahlen, zu erreichen?
Beim Zahlenlotto können aus n = 49 Zahlen k = 6 verschiedene Zahlen ausgewählt werden. Der Binomialkoeffizient "49 über 6" = 49/1 · (49 – 1)/2 ... bis (49 – 5)/6. Es ergeben sich 13 Millionen 983 Tausend und 816 Tippmöglichkeiten.
Wie groß ist dann die Wahrscheinlichkeit, mit einem Tippfeld sechs Richtige zu haben? Diese Trefferwahrscheinlichkeit beim Zahlenlotto lässt sich über die Hypergeometrische Verteilung ermitteln. Sie führt zu der Formel für die Wahrscheinlichkeit p = "6 über r" / "49 über 6", wobei klein r für die Anzahl der Richtigen steht. Bei 6 Richtigen ist für r sechs einzusetzen, also p = "6 über 6" / "49 über 6" . Mit dem Taschenrechner ermittelt ergibt sich eine Wahrscheinlichkeit von 7,15 ∙ 10-8 . Diese Wahrscheinlichkeit ist zwar sehr klein, aber doch nicht gleich Null, wie Berichte über glückliche Lottogewinner zeigen.