Drei-Sigma-Regel

  • Satz: Die Wahrscheinlichkeit, dass eine endliche Zufallsgröße X mit dem Erwartungswert E X = μ und der Streuung D 2 X = σ 2
    – Werte im 2 σ - I n t e r v a l l ] μ 2 σ ; μ + 2 σ [ annimmt, beträgt mindestens 0,75;
    – Werte im 3 σ - I n t e r v a l l ] μ 3 σ ; μ + 3 σ [ annimmt, mindestens 0, 8 ¯ .

Wir betrachten ein Beispiel.

  • Beispiel: Mit welcher Wahrscheinlichkeit weicht die Zufallsgröße X um mehr als 2DX von EX ab?

In einer ersten Stufe der Bearbeitung des Beispiels setzen wir nur die Kenntnis von EX und D 2 X voraus. Der Vorteil der σ - Re g e l besteht darin, dass sie auch dann angewendet werden kann, wenn man die Wahrscheinlichkeitsverteilung der Zufallsgröße X nicht kennt, sondern nur ihren Erwartungswert EX und ihre Streuung D 2 X .

Es sei E X = 0,125 und D 2 X = 1,609375 . Nach der 3 σ - Re g e l erhält man:
P ( | X E X | 2 D X ) 0,25

Das heißt: Mit einer Wahrscheinlichkeit von höchstens 0,25 weicht die Zufallsgröße X um mehr als 2DX von EX ab.

In einer zweiten Stufe setzen wir zusätzlich die Kenntnis der Wahrscheinlichkeitsverteilung der Zufallsgröße X voraus. Es sei X ( 2 0 3 0,125 0,750 0,125 ) .

Wie man sich überzeugen kann, hat X die oben angegebenen Werte für den Erwartungswert und die Streuung. Jetzt ist es möglich, die gesuchte Wahrscheinlichkeit direkt zu berechnen:
P ( | X E X | 2 D X ) = P ( | X 0,125 | 2 1,609375 ) = 1 P ( | X 0,125 | < 2 1,609375 ) = 1 P ( 2 1,609375 + 0,125 < X < 2 1,609375 + 0,125 ) = 1 P ( X = 2 ) P ( X = 0 ) = 1 0,125 0,750 = 0,125

Die Zufallsgröße X weicht also mit einer Wahrscheinlichkeit von 0,125 um mehr als 2DX von EX ab.

Das Beispiel zeigt, dass die auf der 3 σ - Re g e l beruhenden Abschätzungen relativ grob sind. Dies schränkt die Möglichkeiten einer praktischen Nutzung der Regel ein. Trotzdem ist sie nicht ohne praktische Relevanz.

Wir betrachten im Folgenden ein Anwendungsbeispiel.

  • Beispiel: Lars Spielmann besitzt noch einen alten, abgenutzten und lädierten Würfel, dessen Beschriftung mit den Zahlen 1 bis 6 teilweise nur noch schwer zu erkennen ist. Trotzdem hängt er an diesem Würfel. Er möchte deshalb gern wissen, ob er ihn noch benutzen kann, wenn das betreffende Würfeln fair ablaufen soll.

Dazu würfelt er 1000-mal mit diesem Würfel und registriert die absoluten Häufigkeiten für die einzelnen Zahlen. Als relative Häufigkeiten erhält er dann die in der folgenden Tabelle enthaltenen Werte

k123456
h 1000 ( { k } ) 0,1530,2710,1740,1630,0800,159

Da Lars Spielmann fair würfeln möchte, muss er von der Annahme ausgehen, dass alle Zahlen gleichwahrscheinlich auftreten, und zwar mit dem Erwartungswert
μ = E ( h 1000 ( { 2 } ) ) = P ( { 2 } ) = 0,1 6 ¯

und der Standardabweichung
σ = D 2 ( h 1000 ( { 2 } ) ) = 1 1000 ( 1 6 1 36 ) 0,0118.

Das zugehörige 3 σ - I n t e r v a l l ist ] μ 3 σ ; μ + 3 σ [ = ] 0,131... ; 0,202... [ .

Da die relativen Häufigkeiten für die Würfelzahlen 2 und 5 außerhalb des 3 σ - I n t e r v a l l s liegen, wird sich Lars Spielmann wohl von diesem Würfel trennen müssen, denn die angenommene Gleichwahrscheinlichkeit der Augenzahlen kann mit einer Fehlerwahrscheinlichkeit von höchstens 0, 1 ¯ verworfen werden.

Eigene Würfelergebnisse kann man mit dem „gezinkten Taschenrechnerwürfel interaktiv gewinnen.

Programm zur Simulation des Werfens eines gezinkten Würfels mit der Verteilungsmatris mat

Programm zur Simulation des Werfens eines gezinkten Würfels mit der Verteilungsmatris mat

So ist es z.B. möglich, zu untersuchen,

  1. wie stark man den Würfel „zinken“ muss, um bei festen n relative Häufigkeiten zu bekommen, die außerhalb des 3 σ - I n t e r v a l l liegen, oder
  2. wie oft man einen speziell „gezinkten“ Würfel werfen muss, um relative Häufigkeiten zu erhalten, die außerhalb des 3 σ - I n t e r v a l l liegen.

Zur Demonstration wird die „Zinkung“
( 1 2 3 4 5 6 0,15 0,31 0,17 0,16 0,07 0,14 )
gewählt.

Mithilfe des Programms simgezw(mat,n,x) erhält man z.B. die folgenden Simulationsergebnisse:

n 3 σ - I n t e r v a l l

Bild

1 ] 0,951... ; 1,28... [
5 ] 0, 3 ¯ ; 0, 6 ¯ [
10 ] 0,186... ; 0,520... [
100 ] 0,0548... ; 0,278... [
200 ] 0,0876... ; 0,245... [

Vergleicht man die relativen Häufigkeiten mit dem jeweiligen 3 σ - I n t e r v a l l , so sieht man, dass bei dieser Simulation die relativen Häufigkeiten erstmals für n = 100 außerhalb des 3 σ - I n t e r v a l l s liegen.

Bei einer N ( 0 ; 1 ) -verteilten Zufallsgröße X mit μ = 0 und σ = 1 verschärft sich die Aussage der 3 σ - Re g e l zu
P ( X [ 3 ; 3 ] ) = 3 3 ϕ ( x ) d x > 0,99
(wobei ϕ die Dichtefunktion von X ist).

Unter Beachtung der Symmetrie der Glockenkurve gilt:
3 ϕ ( x ) d x < 1 2 ( 1 0,99 ) = 0,005.

Bild

Somit begeht man beim Berechnen von
Φ ( a ) = a ϕ ( x ) d x
auf zwei Dezimalen gerundet keinen Fehler, wenn dabei die untere Integrationsgrenze durch 3 ersetzt wird, was einen beträchtlichen Zeitgewinn bei der Nutzung des TI-92 bedeutet.

Stand: 2010
Dieser Text befindet sich in redaktioneller Bearbeitung.

Lexikon Share
Mathe Note verbessern?
 

Kostenlos bei Duden Learnattack registrieren und ALLES 48 Stunden testen.

Kein Vertrag. Keine Kosten.

  • 40.000 Lern-Inhalte in Mathe, Deutsch und 7 weiteren Fächern
  • Hausaufgabenhilfe per WhatsApp
  • Original Klassenarbeiten mit Lösungen
  • Deine eigene Lern-Statistik
  • Kostenfreie Basismitgliedschaft

Einloggen