散點圖計算器 - 相關性與線性回歸

為任兩組資料點計算相關係數 (r)、R² 與最佳擬合直線——即時查看散點圖統計。

輸入以逗號分隔的 X 值與 Y 值,即可計算線性回歸、皮爾森相關係數與關鍵描述統計。

散點圖計算器 - 相關性與線性回歸
為任兩組資料點計算相關係數 (r)、R² 與最佳擬合直線——即時查看散點圖統計。

關於散點圖計算器

散點圖是一種資料視覺化方式,會將兩個數值變數顯示為笛卡兒平面上的點。每個點代表一筆觀測值:水平位置對應 X 值,垂直位置對應 Y 值。透過觀察點的分布模式,你可以判斷兩個變數之間是否存在關係、關係強弱,以及它是線性或非線性。 這個散點圖計算器會計算三組統計量。第一組是描述性統計:資料點數量 n、X 的平均值 (x̄) 與 Y 的平均值 (ȳ)。第二組是線性回歸直線——使每個點到直線的垂直距離平方和最小的直線。它由方程式 y = mx + b 表示,其中 m 是斜率,b 是 y 截距。斜率 m 的計算公式為 Σ[(xᵢ − x̄)(yᵢ − ȳ)] / Σ[(xᵢ − x̄)²],截距 b = ȳ − m·x̄。 第三組是相關統計。皮爾森相關係數 r = Σ[(xᵢ − x̄)(yᵢ − ȳ)] / √[Σ(xᵢ − x̄)² · Σ(yᵢ − ȳ)²],用來衡量 X 與 Y 之間線性關係的強度與方向。其範圍為 −1 到 +1。接近 +1 表示強正相關(X 增加時 Y 也增加),接近 −1 表示強負相關,接近 0 則表示幾乎沒有線性關係。R²(決定係數)等於 r²,代表 Y 的變異中有多少比例可由 X 上的線性回歸解釋。例如,R² 為 0.90 表示 Y 的 90% 變異可由與 X 的線性關係解釋。 常見用途包括經濟學(價格與需求的關係)、生物學(研究身高與體重的關係)、教育(學習時間與測驗成績的相關性)、工程學(根據輸入變數預測輸出)以及商業分析(廣告支出與銷售營收的關係)。 解讀結果時請記住,相關不等於因果。較高的 r 只代表兩個變數在線性上一起變動,並不表示其中一個會導致另一個。線性回歸也假設真實關係本身就是線性的。如果散點圖顯示曲線趨勢,不論你提供多少點,線性模型都不是好的擬合。務必查看殘差或將資料與直線一起繪圖,以驗證模型。

散點圖計算器範例

三組具代表性的資料集,附上計算出的相關係數與回歸直線。

X 值,Y 值重點結果解讀
X: 1,2,3,4,5 — Y: 2,4,5,4,5m≈0.7, b≈2.0, r≈0.8165, R²≈0.6667中度正線性關係。X 可解釋 67% 的 Y 變異。
X: 1,2,3,4,5 — Y: 5,4,3,2,1m=−1, b=6, r=−1, R²=1完全負線性關係。X 每增加 1 個單位,Y 會精確減少 1。
X: 2,4,6,8,10 — Y: 3,7,8,13,15m≈1.5, b≈−0.2, r≈0.9918, R²≈0.9837非常強的正相關。直線 y = 1.5x − 0.2 可解釋 Y 98.4% 的變異。

如何使用散點圖計算器

  1. 在「X 軸數值」欄位輸入以逗號分隔的 X 軸資料,例如:1, 2, 3, 4, 5。
  2. 在「Y 軸數值」欄位輸入對應的 Y 軸資料。數值數量必須與 X 欄位一致。
  3. 按一下「計算」。工具會計算回歸斜率 m、截距 b、相關係數 r 與 R²。
  4. 閱讀回歸方程式 y = mx + b,以預測任意新的 X 值對應的 Y 值。
  5. 解讀 r:接近 ±1 的值表示強線性關係;接近 0 的值表示線性相關較弱或幾乎沒有。

散點圖計算器常見問題

什麼是皮爾森相關係數 r?
皮爾森相關係數 r 用來衡量兩個變數之間線性關係的強度與方向。其範圍從 −1(完全負線性相關)到 +1(完全正線性相關)。值為 0 代表不存在線性關係,但仍可能存在非線性關係。
什麼是 R²,該如何解讀?
R²(決定係數)等於 r²,用來說明 Y 的變異中有多少比例可由 X 上的線性回歸解釋。R² 為 0.85 表示 Y 值的 85% 離散程度可由線性模型解釋,剩餘 15% 則來自其他因素或隨機波動。
回歸直線的斜率是什麼意思?
y = mx + b 中的斜率 m 代表 X 每增加 1 個單位時,Y 的平均變化量。斜率為 2 表示 X 每增加 1 個單位,Y 平均增加 2 個單位。負斜率則表示 X 增加時 Y 會下降。
相關性是否代表因果關係?
不代表。較高的相關係數只能說明兩個變數在線性上一起變動,卻無法解釋原因。它們可能彼此因果、都受第三個變數影響(干擾變數),或只是巧合。要建立因果關係,需要受控實驗或因果推論方法。
做線性回歸至少需要多少資料點?
擬合一條直線至少需要 2 個點,但依定義這會得到 r = ±1,無法提供關於真實關係的有用資訊。實務上至少需要 10–20 個點才有意義;資料越多,m、b 與 r 的估計就越可靠。
如果相關係數接近 0 怎麼辦?
接近 0 表示 X 與 Y 之間幾乎沒有線性關係。不過這不代表變數彼此無關——它們可能存在很強的非線性關係,例如二次或正弦關係。在下結論之前,先畫圖檢查是否有非線性模式。