Writing Science

Pearson- & Spearman-Korrelation

Korrelationsanalysen mit Pearson- und Spearman-Korrelation

Unabhängig davon, ob statistische Auswertungen für Seminararbeiten, Bachelorarbeiten, Masterarbeiten oder Dissertationen durchgeführt werden müssen – Korrelationsanalyse spielen für die meisten Auswertungen mit SPSS, Stata und RStudio eine wichtige Rolle. StudentInnen und Ghostwriter für Statistik prüfen mit diesen Verfahren, ob zwischen zwei oder mehr Variablen ein statistischer Zusammenhang besteht. Gleichzeitig kann mit den Korrelationskoeffizienten nach Pearson und Spearman ermittelt werden, ob es sich um einen positiven oder negativen Zusammenhang handelt. Ob das eine oder andere Verfahren bei einer statistischen Auswertung mit SPSS, Stata und RStudio eingesetzt wird, hängt von mehreren Voraussetzungen ab. Abschließend diskutieren wir als Sonderfall, der aber für Masterarbeiten und Doktorarbeiten von immer größerer Bedeutung wird, noch die partielle Korrelation.

Voraussetzungen der Pearson-Korrelation in SPSS, Stata und RStudio

Ähnlich wie es bereits für die Ermittlung von signifikanten Mittelwertunterschieden mittels t-Test und Wilcoxon- bzw. Mann-Whitney-U-Test diskutiert wurde, sind auch an die Entscheidung für die Korrelationsanalyse nach Pearson oder Spearman in der Statistik mehrere Voraussetzungen geknüpft. StudentInnen und Ghostwriter für Statistik sollten sich bei einer statistischen Auswertung mit SPSS, Stata und RStudio für die Pearson-Korrelation entscheiden, wenn folgende Voraussetzungen erfüllt sind:

  1. Soll eine Pearson-Korrelation berechnet werden, müssen die beiden Variablen entweder ordinal- oder intervallskaliert vorliegen.
  2. Der Zusammenhang zwischen beiden Variablen muss linear sein, was sich daraus ergibt, dass der Korrelationskoeffizient einen Wertebereich von -1 bis +1 annimmt.
  3. Die Variablen sollten eine Normalverteilung aufweisen. Zwar ist das keine Voraussetzung für die Berechnung der Pearson-Korrelation selbst, aber fast immer muss auch angegeben werden, ob die Korrelation signifikant (p-Wert ≤ 0,05) ist. Dafür ist eine Normalverteilung Voraussetzung.

Das Ergebnis der Pearson-Korrelation sind in SPSS, Stata und RStudio ein Korrelationskoeffizient (r) und ein p-Wert. Letzterer drückt aus, ob das Ergebnis der statistischen Auswertung signifikant ist oder nicht, während der Korrelationskoeffizient in der Statistik ein Maß für die Stärke (Betrag) und die Richtung (Vorzeichen) des Zusammenhangs darstellt.

Die Spearman-Korrelation als parameterfreie Alternative zur Pearson-Korrelation

Für den Fall, dass die Voraussetzungen für die Berechnung der Pearson-Korrelation in SPSS, Stata oder RStudio nicht erfüllt sind, können StudentInnen und Ghostwriter für Statistik auf die parameterfreie Spearman-Korrelation ausweichen. Für die sinnvolle Interpretation des Spearman-Korrelationskoeffizienten sollte der Zusammenhang zwischen den Variablen jedoch linear sein; eine Normalverteilung der korrelierenden Variablen wird aber auch für den Signifikanztest nicht vorausgesetzt. Im Grunde handelt es sich bei der Spearman-Korrelation um die Pearson-Korrelation, die jedoch auf rangtransformierte Variablen angewendet wird. Gerade im englischsprachigen Raum und bei statistischen Auswertungen für höhere Qualifikationsstufen (Dissertationen bzw. Doktorarbeiten), wird die Spearman-Korrelation von Kendalls Tau als parameterfreie Alternative verdrängt.

Einflüsse anderer Variablen mit partieller Korrelation eliminieren

Die partielle Korrelation untersucht den Zusammenhang zwischen zwei Variablen, wobei der Einfluss einer dritten Variable ‚herausgerechnet‘ wird. Bei der Auswertung wird oft vergessen, dass selbst signifikante Korrelationen keinen Kausalzusammenhang nachweisen. Ein Beispiel ist der Zusammenhang zwischen der zu Käse verarbeiteten Kuhmilch in der Schweiz und dem deutschen Import von Rosen im gleichen Zeitraum, der mit einem Korrelationskoeffizienten von 0,944 sehr stark ist. Mithilfe einer partiellen Korrelation könnte dieser Zusammenhang um den Einfluss von Währungsschwankungen, welche den deutschen Import und die Schweizer Käseproduktion beeinflussen, bereinigt werden. Für die Untersuchung solcher ‚Scheinzusammenhänge‘ ist die partielle Korrelation interessant, jedoch sollten nicht zu viele Kontrollvariablen genutzt werden, da sonst die Gefahr eines ‚Overfitting‘ besteht.

SPSS-Statistik einer signifikanten Analyse des Zusammenhangs zwischen zwei Variablen mit Pearson- und Spearman-Korrelation, Kendalls Tau sowie partieller Korrelation

Korrelationsanalysen in SPSS, Stata und RStudio

Bei näherer Betrachtung zur Pearson- und Spearman-, zur partiellen Korrelation und Kendalls Tau zeigt sich also, dass SPSS, Stata und RStudio eine Vielzahl von statistischen Berechnungsmöglichkeiten bereitstellen, aus denen StudentInnen und Ghostwriter für Statistik die richtige auswählen müssen, denn bei der Masterarbeit oder Dissertation wird die Rechtfertigung der genutzten Analyseverfahren spätestens bei der Disputation zur Pflicht, da Fragen zur Statistik gerade bei der Verteidigung immer mehr an Bedeutung gewinnen. Writing Science steht Ihnen diesbezüglich gerne beratend zur Seite!