Fandom

Marktforschungs-Wiki

Box-Plot

90Seiten in
diesem Wiki
Seite hinzufügen
Diskussion1 Teilen

Box-Plots gehören zu den wichtigsten Darstellungsformen in der explorativen Datenanalyse. Sie bieten einen direkten Verteilungsüberblick und eignen sich insbesondere zum Verteilungsvergleich. Dabei zeigen sie sowohl die Lage (die Quartile lassen sich unmittelbar aus dem Median ablesen) als auch die Streuung (Interquartilsabstand und Spannweite sind unmittelbar zu erkennen) der Werte und ermöglichen zudem die Identifikation von Ausreißern.

Box-plot.jpg

Aufbau eines Box-Plots Bearbeiten

Die Box, das zentrale Rechteck des Box-Plots, verläuft vom oberen (75%) Quartil zum unteren (25%) Quartil, das mittlere (50%) Quartil, welches auch als Median bekannt ist, wird deutlich erkennbar in die Box eingezeichnet. Der Median liegt keineswegs immer in der Mitte der Box – seine Lage hängt von der Form der Verteilung ab, die somit ebenfalls direkt aus dem Box-Plot abgelesen werden kann. Da die Box zwischen dem oberen und dem unteren Quartil verläuft, entspricht ihre Länge auch genau dem IQR.

Nun wird ein Abstand von jeweils 1,5 IQR auf die obere und die untere Kante der Box „aufgerechnet“, so dass sich ein Feld mit einer Gesamtlänge von 4 IQR ergibt. Zwei Werte, der größte und der kleinste in der Verteilung real beobachtete Wert, die noch in diesem Bereich von 4 IQR liegen, bilden nun die Grenzpunkte für den oberen und den unteren Zaun des Box-Plots, die jeweils durch eine Linie mit der Box verbunden werden. Zu beachten ist unbedingt, dass die Zäune nicht an der Grenze von +/- 1,5 IQR um die beiden Enden der Box liegen, sondern dort, wo der größte bzw. der kleinste Wert der Verteilung innerhalb dieser beiden Abstände liegen. Nur in dem unwahrscheinlichen Fall, dass ein empirisch beobachteter Wert mit einem der Grenzwerte übereinstimmt, würde ein Zaun an diesem Punkt verlaufen.

Alle Werte die außerhalb der Zäune liegen sind Ausreißer, wobei der erweiterte Box-Plot noch zwischen Ausreißern und Extremwerten – extremen Ausreißern – unterscheidet. Als Ausreißer werden alle Werte gekennzeichnet, die innerhalb eines Abstands von + 1,5 IQR vom oberen Zaun bzw. - 1,5 IQR vom unteren Zaun liegen. Sie werden mit einem Kreis und der Nummer des entsprechenden Datensatzes gekennzeichnet. Alle Werte außerhalb dieses nun auf 7 IQR angewachsenen Bereichs werden als Extremwerte ebenfalls mit der Nummer des Datensatzes sowie einem Sternchen gekennzeichnet. Die Kennzeichnung mit der Datensatznummer macht den Box-Plot zu einem der beliebtesten Instrumente für die Identifikation von Ausreißern, da der Analytiker direkt am Box-Plot ablesen kann, welche Datensätze der genaueren Überprüfung bedürfen. Es ist allerdings anzumerken, dass die Definition des Begriffs „Ausreißer“, die hier bei der Konstruktion des Box-Plots zur Anwendung kommt, keineswegs allgemeingültig ist.

Vergleiche mit Box-Plots Bearbeiten

Sollen mehrere Verteilungen oder aber mehrere überschneidungsfreie (disjunkte) Untergruppen innerhalb einer einzigen Verteilung, beispielsweise Männer und Frauen, grafisch miteinander verglichen werden, so ist es möglich, Box-Plots einander gegenüberzustellen.

Box-plot-vergleich.jpg

Weitergehende Vergleiche sind über die sogenannten gruppierten Box-Plots möglich. Hier erfolgt eine Aufteilung anhand mehr als nur eines Merkmals. Beispiel: Die Verteilung der Gehälter aus dem obigen Box-Plot soll nun nicht nur für die Gruppen der Männern und Frauen getrennt betrachtet werden, es soll zudem auch noch in Personen unterschieden werden, die einer Minderheit angehören. Dadurch ergeben sich insgesamt vier verschiedenen Gruppen, die in einem gruppierten Box-Plot dargestellt werden können.

Box-plot-gruppiert.jpg

Quellen Bearbeiten

C. Reinboth: Multivariate Analyseverfahren in der Marktforschung, LuLu-Verlagsgruppe, Morrisville, 2006.

Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (1999). Statistik. Der Weg zur Datenanalyse (2. Aufl.). Berlin: Springer.

Brosius, F. (2002). SPSS 11. Bonn: mitp-Verlag

Weblinks Bearbeiten

http://statistikberatung.blogspot.com/2009/01/neues-lernmodul-box-plots-erstellen-und.html

Störung durch Adblocker erkannt!


Wikia ist eine gebührenfreie Seite, die sich durch Werbung finanziert. Benutzer, die Adblocker einsetzen, haben eine modifizierte Ansicht der Seite.

Wikia ist nicht verfügbar, wenn du weitere Modifikationen in dem Adblocker-Programm gemacht hast. Wenn du sie entfernst, dann wird die Seite ohne Probleme geladen.

Auch bei Fandom

Zufälliges Wiki