多項式迴歸計算器
將資料擬合到多項式曲線並預測新值
輸入資料點(每行一組 x,y)和所需的多項式次數,即可計算最佳擬合方程、R²與預測值。
多項式迴歸計算器
將資料擬合到多項式曲線並預測新值
快速載入範例
關於多項式迴歸計算器
多項式迴歸是線性迴歸的強大延伸,它將自變數 x 與依變數 y 之間的關係建模為 n 次多項式。不同於擬合直線的簡單線性迴歸,多項式迴歸可以捕捉曲線、彎折以及更複雜的資料模式,因此適用於現實世界中明顯非線性的關係。
其數學模型形式為:y = β₀ + β₁x + β₂x² + … + βₙxⁿ,其中係數 β₀ 到 βₙ 透過最小平方法由資料估計。儘管擬合的是曲線而非直線,多項式迴歸仍被歸類為線性模型,因為它對係數而言是線性的。
最小平方法會最小化殘差平方和,也就是觀測 y 值與多項式預測值之間差異的平方和。這是透過求解正規方程 (XᵀX)β = Xᵀy 完成,其中 X 是由 x 值建構的范德蒙矩陣。本計算器使用高斯消去法求解這些方程,這是一種穩健的數值方法,適合最高 10 次的多項式。
R 平方(R²)即決定係數,用於衡量擬合多項式對 y 總變異性的解釋程度。R² 為 1.0 表示曲線精確通過所有資料點;0.0 表示模型完全無法解釋變異。雖然 R² 總會隨著多項式次數增加而上升,但高次數多項式搭配極高 R² 可能表示過度擬合——模型記住了訓練資料,而不是捕捉真正的底層趨勢。
選擇合適的次數至關重要。1 次給出直線(等同於簡單線性迴歸)。2 次(二次)可捕捉 U 形或倒 U 形模式。3 次(三次)可建模 S 形趨勢或更複雜的成長曲線。對大多數實務資料集而言,2 次或 3 次已經足夠,超過 5 次或 6 次往往會引入數值不穩定與過度擬合。
多項式迴歸的應用遍及許多領域。工程師用二次模型描述應力-應變關係和拋體運動。經濟學家用三次曲線擬合成本函數和生產模型。生物學家將多項式迴歸用於成長曲線和劑量反應研究。資料科學家也會把它作為機器學習流程中的前處理步驟。
使用本計算器時,請注意外推風險——多項式曲線在觀測資料範圍之外可能表現得非常不穩定。務必結合領域知識驗證預測結果,並在提高多項式次數之前先考慮更簡單的模型。
範例
這些範例展示常見資料模式下的多項式迴歸。
| 資料與次數 | 方程 / R² | 使用情境 |
|---|---|---|
| 點:(0,1),(1,2.5),(2,5),(3,8.5),(4,13) 次數:2 | y ≈ 0.5x² + x + 1,R²≈1.00 | 類似拋體運動的二次成長 |
| 點:(1,2),(2,4.1),(3,5.9),(4,8.2),(5,10) 次數:1 | y ≈ 2x,R²≈0.9997 | 線性趨勢,近乎完美擬合 |
| 點:(-2,-10),(-1,0),(0,2),(1,4),(2,18) 次數:3 | y ≈ 3x³−2x²+x+2,R²≈1.00 | 三次應力-應變模型 |
| 點:(1,3),(2,5),(3,4),(4,6),(5,8),(6,7) 次數:4 | 高次數擬合,R²>0.99 | 波動資料的高次數平滑 |
如何使用此計算器
- 在文字區中輸入資料點,每行一組,格式為「x, y」(可用逗號或空格分隔)。
- 設定多項式次數——輸入 1 表示線性,2 表示二次,3 表示三次,依此類推。
- 可選擇在「預測 Y」欄位中輸入一個 X 值,以預測該點的輸出。
- 點選「計算」查看迴歸方程、R²值和預測 Y。
- 使用快速載入按鈕探索預設範例,或點選「重設」清空所有欄位。
常見問題
什麼是多項式迴歸?
多項式迴歸是一種迴歸分析方法,它將依變數 y 與自變數 x 之間的關係建模為 n 次多項式。不同於簡單線性迴歸,它可以擬合彎曲關係。該模型對係數仍然是線性的,並使用最小平方法求解。
如何選擇多項式次數?
從較低次數(1 或 2)開始,只有在擬合效果不佳時再提高次數。更高次數可能導致過度擬合,產生一條通過所有點但對新值預測很差的曲線。R²值會隨次數提高而改善,但應判斷這種改善是否有意義,還是過度擬合的跡象。
R 平方是什麼意思?
R 平方(決定係數)衡量迴歸曲線解釋資料變異性的程度。1.0 表示完美擬合;0.0 表示模型完全無法解釋變異。通常高於 0.9 表示擬合很強,但仍需結合情境和資料點數量判斷。
為什麼計算器要求資料點數量多於次數?
d 次多項式有 d+1 個係數需要估計。至少需要 d+1 個資料點才能求解正規方程。當剛好有 d+1 個點時,曲線會精確通過所有點(R²=1),但這可能代表過度擬合,而不是真實的資料關係。
可以用於時間序列預測嗎?
可以將時間作為 x 變數,把多項式迴歸應用於時間序列資料。不過,多項式模型在觀測資料範圍之外的外推效果可能很差,尤其是高次數多項式。若要進行穩健的時間序列預測,除了多項式迴歸,也可考慮指數平滑或 ARIMA 模型。
多項式迴歸與其他曲線擬合方法有何不同?
多項式迴歸將特定代數形式(多項式)擬合到資料。其他曲線擬合方法包括指數迴歸(y = ae^bx)、對數迴歸(y = a + b ln x)和冪次迴歸(y = ax^b)。應根據資料的底層模式以及解釋該關係的理論來選擇方法。