Калькулятор полиномиальной регрессии
Подгоняйте данные под полиномиальную кривую и прогнозируйте новые значения
Введите точки данных (одна пара x,y в строке) и нужную степень полинома, чтобы вычислить наилучшее уравнение, R² и прогнозы.
Калькулятор полиномиальной регрессии
Подгоняйте данные под полиномиальную кривую и прогнозируйте новые значения
Быстрая загрузка примеров
О калькуляторе полиномиальной регрессии
Полиномиальная регрессия — это мощное расширение линейной регрессии, которое моделирует связь между независимой переменной x и зависимой переменной y как полином степени n. В отличие от простой линейной регрессии, которая подгоняет прямую, полиномиальная регрессия может описывать кривые, изгибы и более сложные закономерности в данных — поэтому она полезна, когда реальные зависимости явно нелинейны.
Математическая модель имеет вид: y = β₀ + β₁x + β₂x² + … + βₙxⁿ, где коэффициенты β₀–βₙ оцениваются по данным методом наименьших квадратов. Хотя подгоняется кривая, а не линия, полиномиальная регрессия всё равно считается линейной моделью, потому что она линейна по коэффициентам.
Метод наименьших квадратов минимизирует сумму квадратов остатков — разниц между наблюдаемыми значениями y и значениями, предсказанными полиномом. Это делается путём решения нормальных уравнений: (XᵀX)β = Xᵀy, где X — матрица Вандермонда, построенная из значений x. Этот калькулятор решает их методом Гаусса, надёжным численным методом, подходящим для полиномов до 10-й степени.
R² (коэффициент детерминации) показывает, насколько хорошо подогнанный полином объясняет общую изменчивость y. R² = 1.0 означает, что кривая проходит точно через все точки; 0.0 означает, что модель не объясняет дисперсию вовсе. Хотя R² всегда растёт с увеличением степени, очень высокий R² у полинома высокой степени может указывать на переобучение — модель запомнила обучающие данные вместо того, чтобы уловить реальную тенденцию.
Правильный выбор степени критически важен. Степень 1 даёт прямую (эквивалент простой линейной регрессии). Степень 2 (квадратичная) описывает U-образные или перевёрнутые U-образные закономерности. Степень 3 (кубическая) может моделировать S-образные тренды или более сложные кривые роста. Для большинства практических наборов данных степени 2 или 3 достаточно, а выход за 5–6 степень часто приводит к численной нестабильности и переобучению.
Полиномиальная регрессия применяется во многих областях. Инженеры используют квадратичные модели для связей напряжение-деформация и движения снаряда. Экономисты подгоняют кубические кривые под функции затрат и модели производства. Биологи применяют её к кривым роста и исследованиям доза-реакция. Специалисты по данным используют её как этап предварительной обработки в конвейерах машинного обучения.
При использовании этого калькулятора помните о риске экстраполяции — полиномиальные кривые могут вести себя крайне резко вне диапазона наблюдаемых данных. Всегда проверяйте прогнозы с учётом предметной области и сначала рассматривайте более простые модели, прежде чем повышать степень полинома.
Примеры
Эти примеры показывают полиномиальную регрессию для распространённых типов данных.
| Данные и степень | Уравнение / R² | Сценарий использования |
|---|---|---|
| Points: (0,1),(1,2.5),(2,5),(3,8.5),(4,13) Degree: 2 | y ≈ 0.5x² + x + 1, R²≈1.00 | Квадратичный рост, похожий на траекторию |
| Points: (1,2),(2,4.1),(3,5.9),(4,8.2),(5,10) Degree: 1 | y ≈ 2x, R²≈0.9997 | Линейный тренд, почти идеальная подгонка |
| Points: (-2,-10),(-1,0),(0,2),(1,4),(2,18) Degree: 3 | y ≈ 3x³−2x²+x+2, R²≈1.00 | Кубическая модель напряжение-деформация |
| Points: (1,3),(2,5),(3,4),(4,6),(5,8),(6,7) Degree: 4 | Подгонка высокой степени, R²>0.99 | Нестабильные данные, сглаживание высокой степени |
Как пользоваться калькулятором
- Введите точки данных в текстовое поле: одна пара в строке, формат 'x, y' (через запятую или пробел).
- Задайте степень полинома — 1 для линейной, 2 для квадратичной, 3 для кубической и так далее.
- При желании введите значение X в поле 'Предсказать Y', чтобы спрогнозировать результат в этой точке.
- Нажмите 'Вычислить', чтобы увидеть уравнение регрессии, значение R-squared и предсказанное Y.
- Используйте кнопки быстрой загрузки для готовых примеров или нажмите 'Сбросить', чтобы очистить все поля.
Часто задаваемые вопросы
Что такое полиномиальная регрессия?
Полиномиальная регрессия — это форма регрессионного анализа, которая моделирует связь между зависимой переменной y и независимой переменной x как полином степени n. В отличие от простой линейной регрессии, она может описывать криволинейные зависимости. Модель остаётся линейной по коэффициентам и решается методом наименьших квадратов.
Как выбрать степень полинома?
Начните с низкой степени (1 или 2) и увеличивайте её только если подгонка плохая. Более высокая степень может привести к переобучению, создавая кривую, которая проходит через все точки, но плохо предсказывает новые значения. Значение R-squared растёт с увеличением степени, но проверьте, является ли улучшение значимым или это признак переобучения.
Что означает R-squared?
R-squared (коэффициент детерминации) показывает, насколько хорошо кривая регрессии объясняет изменчивость ваших данных. Значение 1.0 означает идеальную подгонку; 0.0 — что модель не объясняет дисперсию вовсе. Значения выше 0.9 обычно указывают на сильную подгонку, но всегда учитывайте контекст и количество точек.
Почему калькулятор требует больше точек, чем степень?
У полинома степени d есть d+1 коэффициент, которые нужно оценить. Чтобы решить нормальные уравнения, вам нужно как минимум d+1 точек данных. При ровно d+1 точках кривая проходит через все них точно (R²=1), но это может означать переобучение, а не реальную зависимость.
Можно ли использовать это для прогнозирования временных рядов?
Полиномиальную регрессию можно применять к временным рядам, если рассматривать время как переменную x. Однако полиномиальные модели плохо экстраполируют за пределы наблюдаемого диапазона, особенно высоких степеней. Для более надёжного прогноза временных рядов дополнительно рассмотрите экспоненциальное сглаживание или модели ARIMA.
Чем полиномиальная регрессия отличается от других методов аппроксимации кривых?
Полиномиальная регрессия подгоняет к данным конкретную алгебраическую форму — полином. Другие методы включают экспоненциальную регрессию (y = ae^bx), логарифмическую регрессию (y = a + b ln x) и степенную регрессию (y = ax^b). Выбирайте метод по лежащему в основе шаблону данных и теории, объясняющей связь.