UPDATE: Jetzt mit Beispiel-Dateianhang. :-) Aktuell bin ich bei meinem Arbeitgeber leider auf Excel XP (aka 2002) ohne jegliche Erweiterungen beschränkt, was die Datenvisualisierungs- und Analysemöglichkeiten doch sehr einschränkt. SPSS ist zwar bestellt, wird dem Vernehmen nach aber noch eine Weile brauchen. Kostenlose, boxplottaugliche Alternativen für den kommerziellen Einsatz sind mir nur unter den Namen R, KNIME oder Gnumeric bekannt, wobei ersteres reichlich Lernaufwand erfordert, zweiteres derzeit wohl nur Einzel-Boxplots beherrscht (ich brauchte rund 90), und mir letzteres in der aktuellen Windows-Version nicht erlaubte festzulegen, ob die Daten in den Zeilen oder den Spalten liegen – statt 90 Boxplots mit ein bis acht Samples bekam ich immer acht Boxplots mit bis zu 90 Samples zu sehen, auch das Transponieren brachte nichts.
Also machte ich mich schweren Herzens an eine manuelle Boxplot-Erstellung, wie sie im Netz mehrfach beschrieben ist. Die ansprechendste Anleitung dazu fand ich hier, wenngleich die Formeln für die Whisker-Begrenzungen kleine Fehler aufweisen. Diese sind aber, da man sich ja ohnehin geistig mit der Erstellung auseinandersetzt, recht schnell behoben. Auch eine Formel zur Ausreißer-Bestimmung war schnell nachreicht, da die beschriebene manuelle Bestimmung bei mehr als einer Handvoll Boxplots kaum durchführbar ist.
Das Ergebnis kann sich durchaus sehen lassen (siehe Aufmacherbild): Ein hübscher Boxplot mit den bekannt flexiblen, optischen Gestaltungsmöglichkeiten, die auch frühe Excel-Versionen im Gegensatz zu SPSS zu bieten haben. SPSS soll diesbezüglich jetzt zwar aufgeholt haben (ich kenne es nur bis v11), kostet aber immer noch ein Vielfaches dessen, was für das Flaggschiff aus dem Hause Microsoft verlangt wird.
In einem späteren Beitrag werde ich entweder die ganze Boxplot-Erstellung noch einmal vollständig, richtig und auf Deutsch dokumentieren, oder (so mein eigentlicher Plan) ein Excel-Makro dafür abliefern – das kann eigentlich auch für Gelegenheitsprogrammierer wie mich nicht allzu schwer sein. :-)
UPDATE: Auf wiederholten Wunsch jetzt mit Beispiel-Download und einigen Erklärungen dazu (wenn ich denn die Option dazu finde *g*):
- Zeilen P25, P50 und P75 als Stapelbalkendiagramm generieren
- Dem untersten Balken (P25) negative Fehlerbalken hinzufügen (Datensatz whisker-lo)
- 2.) Den untersten Fehlerbalken ohne Umriss und Füllung formatieren (also unsichtbar machen), P50 und P75 rot ausfüllen
- Dem obersten Balken (P75) positive Fehlerbalken hinzufügen (Datensatz whisker-hi)
- Alle Ausreißerdatensätze (out-lo1 bis out-hi4) kopieren und im Diagramm einfügen
- Einen der häßlichen Zusatzbalken anklicken, sodass der Datensatz markiert ist. Im Rechtsklick-Kontextmenü “Diagrammtyp” auswählen und auf “Streudiagramm” ändern. Für alle anderen Ausreißerbalken wiederholen, am einfachsten mit “Strg+Y”.
- Ausreißer-Datenpunkte nach Belieben formatieren, z.B. als schwarz ausgefüllte Kreise.
Anhang:
