Statistical & Machine Learning Regression 비교

Posted Mar 4, 2024 Updated Mar 4, 2024

By Jiheon Choi 3 min read

수학적 회귀와 기계학습 회귀는 데이터를 기반으로 예측 모델을 만드는 과정에서 개념은 유사할 수 있지만, 접근 방식과 활용 목적에 차이가 있다.

Statistical Regression

목적: 변수 간의 관계를 설명하고, 한 변수의 변화가 다른 변수에 어떤 영향을 미치는지 이해하는 데 중점을 둡니다. 예를 들어, 광고 비용이 판매량에 어떻게 영향을 미치는지 분석할 수 있다.
방법: 전통적인 통계학 기반의 접근 방식을 사용한다. 선형 회귀(Linear Regression), 로지스틱 회귀(Logistic Regression) 등이 포함된다.
분석: 결과의 statistical significance, coefficient 해석, 모델의 적합도 등을 평가한다. 변수 간의 관계를 정량화하고, 예측보다는 설명에 더 중점을 둔다.

목적: 주어진 데이터로부터 패턴을 학습하여 미래의 값을 예측하는 데 중점을 둔다. 즉, 핵심 목표는 예측 정확도와 모델의 성능 향상이다.
방법: 다양한 알고리즘과 복잡한 모델을 사용하여 데이터로부터 학습한다. 선형 회귀부터 더 복잡한 모델인 random forest, gradient boosting, neural net 등이 포함됩니다. 단순한 regression보다 더 복잡한 패턴을 학습에 활용할 수 있다.
분석: 모델의 예측 성능을 중요시하며, 정확도, 오차율, ROC 곡선 같은 성능 지표로 모델을 평가한다. 때로는 모델의 해석성보다 예측 성능이 더 중요시되는 경우가 많다.

수학적 회귀는 변수 간의 관계를 설명하고 이해하는 데 중점을 둔다. 즉, 통계적 유의성과 모델의 해석 가능성이 중요하다. 기계학습 회귀는 데이터로부터 패턴을 학습하여 미래 값을 예측하는 데 초점을 맞춘다. 즉, 예측 정확도와 모델의 성능이 핵심 요소이다.

This post is licensed under CC BY 4.0 by the author.