잔차 계산기 - 선형 회귀 잔차

가설 검정과 통계적 추론

이 도구는 단순 선형 회귀 모델의 잔차를 계산합니다. X와 Y 데이터 포인트를 입력해 회귀선을 구하고 예측 오차를 분석하세요.

잔차 계산기 - 선형 회귀 잔차
가설 검정과 통계적 추론

잔차 계산기에 대하여

잔차는 관측값과 통계 모델이 예측한 값의 차이입니다. 단순 선형 회귀에서 i번째 관측의 잔차는 e_i = y_i − ŷ_i로 정의되며, 여기서 y_i는 실제 관측값이고 ŷ_i는 최소제곱 회귀선 ŷ = b₀ + b₁x가 예측한 값입니다. 최소제곱법(OLS)은 잔차 제곱합을 최소화하는 회귀선을 찾습니다(SSE = Σe_i²). 이 도구는 표준 공식 b₁ = Σ(xᵢ − x̄)(yᵢ − ȳ) / Σ(xᵢ − x̄)²와 b₀ = ȳ − b₁x̄를 사용해 기울기(b₁)와 절편(b₀)을 계산합니다. 잔차 분석은 회귀 진단의 기본 단계입니다. 모델을 적합한 뒤에는 잔차를 확인해 주요 가정을 검증해야 합니다. 선형성(잔차를 x에 대해 그렸을 때 체계적인 패턴이 없어야 함), 등분산성(잔차 분산이 대체로 일정해야 함), 독립성(잔차에 자기상관이 없어야 함), 정규성(잔차가 대략 정규분포를 따라야 함)입니다. 잔차 플롯——잔차를 예측값 또는 독립 변수에 대해 그린 산점도——은 가장 중요한 진단 도구입니다. 잔차가 0 주변에 무작위로 퍼져 있고 패턴이 없으면 선형 모델이 적절하다는 뜻입니다. U자형 같은 체계적 패턴은 비선형성, 부채꼴 모양은 이분산성, 군집은 영향력 있는 관측값이나 이상치를 시사합니다. 결정계수 R²는 y의 분산 중 x가 설명하는 비율을 나타냅니다. R²는 0(모델이 분산을 전혀 설명하지 못함)에서 1(완벽한 적합)까지입니다. 계산식은 1 − SSE/SST이며, SST = Σ(yᵢ − ȳ)²입니다. 이 계산기는 회귀를 배우는 학생, 빠르게 데이터 품질을 점검하려는 분석가, 더 복잡한 모델링 전에 적합도를 검증하려는 연구자에게 적합합니다. 결과에는 전체 회귀식, 각 점의 잔차 표, 총 SSE, R² 값이 포함되어 바로 해석할 수 있습니다.

잔차 계산 예시

이 예시는 X와 Y 데이터 쌍으로 잔차를 계산하는 방법을 보여줍니다.

X → Y 데이터회귀선
X: 1,2,3,4,5 / Y: 2,4,5,4,5ŷ = 0.6x + 2.2R² = 0.60
X: 1,2,3,4 / Y: 2,4,6,8ŷ = 2x + 0R² = 1.00(완벽한 적합)
X: 1,2,3,4,5 / Y: 5,3,4,2,1ŷ = -0.9x + 5.7R² = 0.81

사용 방법

  1. 첫 번째 텍스트 영역에 독립 변수(X) 값을 쉼표 또는 공백으로 구분하여 입력하세요.
  2. 두 번째 텍스트 영역에 X와 같은 순서로 대응하는 관측값(Y)을 입력하세요.
  3. ‘계산’을 클릭해 최소제곱 회귀선을 적합하고 모든 잔차를 계산하세요.
  4. 잔차 표를 확인해 회귀선에서 멀리 떨어진 관측값을 찾으세요.
  5. R²를 확인해 선형 모델이 데이터를 얼마나 잘 설명하는지 평가하세요.

자주 묻는 질문

잔차가 크다는 것은 무엇을 의미하나요?
큰 잔차는 관측값이 회귀 모델의 예측값에서 많이 벗어났다는 뜻입니다. 큰 잔차는 이상치, 영향력 있는 관측값, 또는 선형 모델이 데이터에 가장 적합하지 않음을 나타낼 수 있습니다. 결론을 내리기 전에 이런 점들을 확인하세요.
OLS 회귀에서 잔차의 합이 왜 0인가요?
OLS 회귀에 절편 항이 포함되면 잔차의 합은 항상 정확히 0이 됩니다. 이는 최소제곱 추정량의 수학적 성질로, 회귀선이 점 (x̄, ȳ)을 지나야 하므로 양의 편차와 음의 편차가 서로 상쇄되기 때문입니다.
잔차와 오차의 차이는 무엇인가요?
오차는 관측값과 실제 모집단 회귀선 사이의 직접 관측할 수 없는 차이입니다. 잔차는 관측값과 추정 회귀선 사이의 관측 가능한 차이입니다. 실무에서는 잔차를 이용해 오차를 추정하고 분석합니다.
R²는 잔차에 대해 무엇을 알려주나요?
R²(결정계수)는 선형 회귀 모델이 설명하는 Y의 총 분산 비율입니다. R²가 높을수록 모델 적합이 좋고, 잔차는 Y의 전체 변동에 비해 작습니다. 하지만 R²가 높다고 해서 모델 가정이 충족된다는 보장은 없습니다.
잔차에서 이분산성을 어떻게 찾나요?
잔차를 적합값에 대해 그려 보세요. 잔차의 퍼짐이 적합값에 따라 체계적으로 커지거나 작아지면(부채꼴 패턴) 이분산성이 있습니다. Breusch-Pagan 검정이나 White 검정 같은 공식 검정으로도 확인할 수 있습니다.
이 계산기는 다중 선형 회귀를 지원하나요?
아니요. 이 계산기는 독립 변수(X) 하나와 종속 변수(Y) 하나를 사용하는 단순 선형 회귀만 처리합니다. 두 개 이상의 예측 변수를 사용하는 다중 회귀에는 R, Python(statsmodels), Excel, SPSS 같은 통계 소프트웨어를 사용하세요.