Streudiagramm-Rechner - Korrelation & lineare Regression

Berechnen Sie den Korrelationskoeffizienten (r), R² und die Regressionsgerade für zwei Datensätze — sofortige Streudiagramm-Statistiken.

Geben Sie durch Kommas getrennte X- und Y-Werte ein, um lineare Regression, den Pearson-Korrelationskoeffizienten und wichtige deskriptive Statistiken zu berechnen.

Streudiagramm-Rechner - Korrelation & lineare Regression
Berechnen Sie den Korrelationskoeffizienten (r), R² und die Regressionsgerade für zwei Datensätze — sofortige Streudiagramm-Statistiken.

Über den Streudiagramm-Rechner

Ein Streudiagramm ist eine Form der Datenvisualisierung, die zwei numerische Variablen als Punkte in einem kartesischen Koordinatensystem darstellt. Jeder Punkt steht für eine Beobachtung: seine horizontale Position entspricht dem X-Wert und seine vertikale Position dem Y-Wert. Anhand des Musters der Punkte lässt sich beurteilen, ob zwischen den beiden Variablen ein Zusammenhang besteht, wie stark er ist und ob er linear oder nicht linear ist. Dieser Streudiagramm-Rechner berechnet drei Gruppen von Statistiken. Die erste Gruppe ist deskriptiv: die Anzahl der Datenpunkte n, der Mittelwert von X (x̄) und der Mittelwert von Y (ȳ). Die zweite Gruppe ist die lineare Regressionsgerade — die Gerade, die die Summe der quadrierten vertikalen Abstände jedes Punktes zur Linie minimiert. Sie wird durch die Gleichung y = mx + b beschrieben, wobei m die Steigung und b der y-Achsenabschnitt ist. Die Steigung m wird als Σ[(xᵢ − x̄)(yᵢ − ȳ)] / Σ[(xᵢ − x̄)²] berechnet, und der Achsenabschnitt b = ȳ − m·x̄. Die dritte Gruppe sind Korrelationsstatistiken. Der Pearson-Korrelationskoeffizient r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² · Σ(yᵢ − ȳ)²] misst Stärke und Richtung des linearen Zusammenhangs zwischen X und Y. Er liegt zwischen −1 und +1. Ein Wert nahe +1 weist auf einen starken positiven Zusammenhang hin (wenn X steigt, steigt Y), ein Wert nahe −1 auf einen starken negativen Zusammenhang und ein Wert nahe 0 auf wenig oder keinen linearen Zusammenhang. R² (das Bestimmtheitsmaß) entspricht r² und gibt an, welcher Anteil der Varianz in Y durch die lineare Regression auf X erklärt wird. Ein R² von 0.90 bedeutet zum Beispiel, dass 90% der Streuung in Y durch den linearen Zusammenhang mit X erklärt werden. Typische Anwendungen sind die Wirtschaft (Preis und Nachfrage), Biologie (Zusammenhang zwischen Größe und Gewicht), Bildung (Lernzeit und Testergebnisse), Ingenieurwesen (Ausgabe aus Eingabevariablen vorhersagen) und Business-Analytics (Werbeausgaben und Umsatz). Bei der Interpretation gilt: Korrelation bedeutet nicht Kausalität. Ein hoher r-Wert zeigt nur, dass sich zwei Variablen linear gemeinsam bewegen; er sagt nichts darüber aus, ob die eine die andere verursacht. Außerdem setzt die lineare Regression voraus, dass der Zusammenhang tatsächlich linear ist. Wenn das Streudiagramm eine Kurve zeigt, ist ein lineares Modell unabhängig von der Anzahl der Datenpunkte eine schlechte Anpassung. Prüfen Sie immer die Residuen oder stellen Sie die Daten gemeinsam mit der Geraden dar, um das Modell zu validieren.

Beispiele für den Streudiagramm-Rechner

Drei repräsentative Datensätze mit berechneten Korrelationskoeffizienten und Regressionsgeraden.

X-Werte, Y-WerteWichtige ErgebnisseInterpretation
X: 1,2,3,4,5 — Y: 2,4,5,4,5m≈0.7, b≈2.0, r≈0.8165, R²≈0.6667Mäßiger positiver linearer Zusammenhang. 67% der Y-Varianz werden durch X erklärt.
X: 1,2,3,4,5 — Y: 5,4,3,2,1m=−1, b=6, r=−1, R²=1Perfekter negativer linearer Zusammenhang. Jeder Anstieg von X um 1 verringert Y genau um 1.
X: 2,4,6,8,10 — Y: 3,7,8,13,15m≈1.5, b≈−0.2, r≈0.9918, R²≈0.9837Sehr starker positiver Zusammenhang. Die Gerade y = 1.5x − 0.2 erklärt 98.4% der Variation in Y.

So verwenden Sie den Streudiagramm-Rechner

  1. Geben Sie Ihre X-Daten als durch Kommas getrennte Zahlen in das Feld 'X-Achsen-Werte' ein — zum Beispiel: 1, 2, 3, 4, 5.
  2. Geben Sie die zugehörigen Y-Daten in das Feld 'Y-Achsen-Werte' ein. Die Anzahl der Werte muss mit dem X-Feld übereinstimmen.
  3. Klicken Sie auf Berechnen. Das Tool berechnet die Regressionssteigung m, den Achsenabschnitt b, den Korrelationskoeffizienten r und R².
  4. Lesen Sie die Regressionsgleichung y = mx + b, um Y für jeden neuen X-Wert vorherzusagen.
  5. Interpretieren Sie r: Werte nahe ±1 deuten auf starke lineare Zusammenhänge hin; Werte nahe 0 auf eine schwache oder keine lineare Korrelation.

FAQ zum Streudiagramm-Rechner

Was ist der Pearson-Korrelationskoeffizient r?
Der Pearson-Korrelationskoeffizient r misst Stärke und Richtung des linearen Zusammenhangs zwischen zwei Variablen. Er reicht von −1 (perfekte negative lineare Korrelation) bis +1 (perfekte positive lineare Korrelation). Ein Wert von 0 bedeutet, dass kein linearer Zusammenhang besteht, auch wenn durchaus ein nicht linearer Zusammenhang vorhanden sein kann.
Was ist R² und wie interpretiere ich es?
R² (das Bestimmtheitsmaß) ist gleich r² und gibt an, welcher Anteil der Varianz in Y durch die lineare Regression auf X erklärt wird. Ein R² von 0.85 bedeutet, dass 85% der Streuung der Y-Werte durch das lineare Modell erklärt werden. Die restlichen 15% entfallen auf andere Faktoren oder zufällige Schwankungen.
Was bedeutet die Steigung der Regressionsgeraden?
Die Steigung m in y = mx + b beschreibt die durchschnittliche Änderung von Y bei jedem Anstieg von X um eine Einheit. Eine Steigung von 2 bedeutet, dass Y im Durchschnitt um 2 Einheiten steigt, wenn X um 1 Einheit steigt. Eine negative Steigung bedeutet, dass Y mit zunehmendem X abnimmt.
Bedeutet Korrelation Kausalität?
Nein. Ein hoher Korrelationskoeffizient zeigt nur, dass zwei Variablen linear zusammen auftreten; er erklärt nicht warum. Eine Variable könnte die andere verursachen, beide könnten von einer dritten Variable beeinflusst werden (Konfundierung), oder die Korrelation könnte zufällig sein. Kausalität erfordert kontrollierte Experimente oder Methoden der kausalen Inferenz.
Wie viele Datenpunkte brauche ich für eine lineare Regression?
Zum Anpassen einer Geraden brauchen Sie mindestens 2 Punkte, aber das ergibt per Definition immer r = ±1 und liefert keine sinnvollen Informationen über den tatsächlichen Zusammenhang. In der Praxis sind mindestens 10–20 Punkte für eine aussagekräftige Regression nötig, und je mehr Daten Sie haben, desto verlässlicher sind die Schätzungen von m, b und r.
Was, wenn mein Korrelationskoeffizient nahe null liegt?
Ein Wert nahe null bedeutet, dass zwischen X und Y nur wenig oder kein linearer Zusammenhang besteht. Das heißt aber nicht, dass die Variablen unabhängig sind — sie könnten einen starken nicht linearen Zusammenhang haben, etwa quadratisch oder sinusförmig. Prüfen Sie Ihre Daten per Diagramm, bevor Sie auf Unabhängigkeit schließen.