Drei-Sigma-Regel
Wählt man in der tschebyschewschen Ungleichung für den Parameter Vielfache der Standardabweichung , setzt man also , so erhält man:
Die Wahrscheinlichkeit, dass X einen Wert annimmt, der von EX um mindestens das n-fache der Standardabweichung abweicht, ist folglich höchstens .
Für die Spezialfälle ergibt sich dann Folgendes:
Diese aus der tschebyschewschen Ungleichung gewonnenen Aussagen werden als oder bezeichnet.
- Satz: Die Wahrscheinlichkeit, dass eine endliche Zufallsgröße X mit dem Erwartungswert und der Streuung
– Werte im annimmt, beträgt mindestens 0,75;
– Werte im annimmt, mindestens .
Wir betrachten ein Beispiel.
- Beispiel: Mit welcher Wahrscheinlichkeit weicht die Zufallsgröße X um mehr als 2DX von EX ab?
In einer ersten Stufe der Bearbeitung des Beispiels setzen wir nur die Kenntnis von EX und voraus. Der Vorteil der besteht darin, dass sie auch dann angewendet werden kann, wenn man die Wahrscheinlichkeitsverteilung der Zufallsgröße X nicht kennt, sondern nur ihren Erwartungswert EX und ihre Streuung .
Es sei und . Nach der erhält man:
Das heißt: Mit einer Wahrscheinlichkeit von höchstens 0,25 weicht die Zufallsgröße X um mehr als 2DX von EX ab.
In einer zweiten Stufe setzen wir zusätzlich die Kenntnis der Wahrscheinlichkeitsverteilung der Zufallsgröße X voraus. Es sei
Wie man sich überzeugen kann, hat X die oben angegebenen Werte für den Erwartungswert und die Streuung. Jetzt ist es möglich, die gesuchte Wahrscheinlichkeit direkt zu berechnen:
Die Zufallsgröße X weicht also mit einer Wahrscheinlichkeit von 0,125 um mehr als 2DX von EX ab.
Das Beispiel zeigt, dass die auf der beruhenden Abschätzungen relativ grob sind. Dies schränkt die Möglichkeiten einer praktischen Nutzung der Regel ein. Trotzdem ist sie nicht ohne praktische Relevanz.
Wir betrachten im Folgenden ein Anwendungsbeispiel.
- Beispiel: Lars Spielmann besitzt noch einen alten, abgenutzten und lädierten Würfel, dessen Beschriftung mit den Zahlen 1 bis 6 teilweise nur noch schwer zu erkennen ist. Trotzdem hängt er an diesem Würfel. Er möchte deshalb gern wissen, ob er ihn noch benutzen kann, wenn das betreffende Würfeln fair ablaufen soll.
Dazu würfelt er 1000-mal mit diesem Würfel und registriert die absoluten Häufigkeiten für die einzelnen Zahlen. Als relative Häufigkeiten erhält er dann die in der folgenden Tabelle enthaltenen Werte
k | 1 | 2 | 3 | 4 | 5 | 6 |
0,153 | 0,271 | 0,174 | 0,163 | 0,080 | 0,159 |
Da Lars Spielmann fair würfeln möchte, muss er von der Annahme ausgehen, dass alle Zahlen gleichwahrscheinlich auftreten, und zwar mit dem Erwartungswert
und der Standardabweichung
Das zugehörige ist .
Da die relativen Häufigkeiten für die Würfelzahlen 2 und 5 außerhalb des liegen, wird sich Lars Spielmann wohl von diesem Würfel trennen müssen, denn die angenommene Gleichwahrscheinlichkeit der Augenzahlen kann mit einer Fehlerwahrscheinlichkeit von höchstens verworfen werden.
Eigene Würfelergebnisse kann man mit dem „gezinkten Taschenrechnerwürfel “ interaktiv gewinnen.
So ist es z.B. möglich, zu untersuchen,
- wie stark man den Würfel „zinken“ muss, um bei festen n relative Häufigkeiten zu bekommen, die außerhalb des liegen, oder
- wie oft man einen speziell „gezinkten“ Würfel werfen muss, um relative Häufigkeiten zu erhalten, die außerhalb des liegen.
Zur Demonstration wird die „Zinkung“
gewählt.
Mithilfe des Programms simgezw(mat,n,x) erhält man z.B. die folgenden Simulationsergebnisse:
n | ||
1 | ||
5 | ||
10 | ||
100 | ||
200 |
Vergleicht man die relativen Häufigkeiten mit dem jeweiligen , so sieht man, dass bei dieser Simulation die relativen Häufigkeiten erstmals für n = 100 außerhalb des liegen.
Bei einer Zufallsgröße X mit und verschärft sich die Aussage der zu
(wobei die Dichtefunktion von X ist).
Unter Beachtung der Symmetrie der Glockenkurve gilt:
Somit begeht man beim Berechnen von
auf zwei Dezimalen gerundet keinen Fehler, wenn dabei die untere Integrationsgrenze durch ersetzt wird, was einen beträchtlichen Zeitgewinn bei der Nutzung des TI-92 bedeutet.