Boxplots

Unter dem 1. Quartil versteht man einen Wert, vor dem mindestens 25 % und nach dem höchstens 75 % der Werte der Urliste liegen; als 3. Quartil bezeichnet man einen Wert, vor dem mindestens 75 % und nach dem höchstens 25 % der Werte der Urliste liegen.

Die Boxplotdarstellung ist ein gutes Hilfsmittel für den Vergleich von Verteilungen, da man zum Beispiel erkennt, welchen Bereich (welche Spannweite) die ermittelten Daten einnehmen, ob die Verteilung bezüglich des Medians symmetrisch, rechts- oder linksschief ist.

Ein Boxplot entsteht wie folgt:
Auf einer Zahlengeraden werden dazu die entsprechenden Werte der zu untersuchenden Zufallsgröße markiert. Über dieser Geraden zeichnet man dann ein vom unteren bis zum oberen Viertelwert reichendes Rechteck (eine Box) und kennzeichnet darin den Zentralwert x ˜ n durch einen senkrechten Strich.

Die außerhalb dieses Rechtecks liegenden extremen Beobachtungswerte x min und x max werden durch Kreuze markiert. Mitunter werden links und rechts vom Kasten noch Linien gezeichnet, welche die Verteilung außerhalb des Kastens andeuten. Im Allgemeinen werden diese Linien so lang gewählt, dass jeweils nicht mehr als 10 % der Daten außerhalb liegen.

Boxplot

Boxplot

Beispiel: Ein Institut beschäftigt 11 Mitarbeiter, deren Gehaltsverteilung aus folgender Tabelle ersichtlich ist:

Anzahl der
Mitarbeiter
213311
Gehalt
in Euro
180020002200250032007500

Um eine Boxplot-Darstellung der Häufigkeitsverteilung zu erhalten, geht man etwa in folgenden Schritten vor:

(1) Ordnen der Werte und Kennzeichnen der fünf Lageparameter

Bild

(2) Festlegen eines geeigneten Maßstabs und Darstellen im Boxplot

Bild

Der „Kasten“ (die „Box“) wird längs einer Zahlengeraden als ein vom 1. bis zum 3. Quartil reichendes Rechteck gezeichnet, in dem der Median (Zentralwert) durch einen senkrechten Strich gekennzeichnet ist. Den maximalen und den minimalen Wert gibt man durch Punkte oder Kreuze auf der Zahlengeraden an.

Die Darstellung macht deutlich (was im vorliegenden einfachen Fall zwar bereits aus der Tabelle erkennbar, bei einem großen Datenumfang aber wesentlich schwerer zu übersehen ist): Die Gehaltsverteilung ist sehr unausgeglichen – bedingt durch den „Ausreißerwert“ 7500 Euro ist der Abstand von 3. Quartil zum Maximum sehr groß. Die Mehrheit der Gehälter und auch der Median drängen sich auf dem relativ kleinen und sehr niedrigen Intervall von 2000 bis 2500 Euro zusammen.

Lexikon Share
Mathe Note verbessern?
 

Kostenlos bei Duden Learnattack registrieren und ALLES 48 Stunden testen.

Kein Vertrag. Keine Kosten.

  • 40.000 Lern-Inhalte in Mathe, Deutsch und 7 weiteren Fächern
  • Hausaufgabenhilfe per WhatsApp
  • Original Klassenarbeiten mit Lösungen
  • Deine eigene Lern-Statistik
  • Kostenfreie Basismitgliedschaft

Einloggen