회귀 분석 방법 중 하나로, 데이터를 분석하고 예측하는 데 매우 유용함, 특히 모델을 간단하게 만들고 중요한 특징(변수)만 선택할 수 있도록 도와주는 특징이 있음
1. 라쏘 회귀 기본 개념
![]() |
- MSE(Mean Squared Error): 일반적인 회귀 분석의 오차(실제값과 예측값의 차이) - λ: 규제 강도를 조절하는 하이퍼파라미터 (값이 크면 규제가 강해저 더 많은 변수를 0으로 만들고 작으면 일반 선형 회귀와 비슷해짐) : 각 변수의 계수(중요도를 나타냄) |
① 좌표 하강법 (Coordinate Descent)
② 확률적 경사 하강법 (Stochastic Gradient Descent, SGD)
2.라쏘 회귀의 특징
1) 불필요한 변수 제거
2) 규제(Regularization)
3) 복잡성 감소
3.라쏘 회귀의 장단점
1) 장점
2) 단점
4.라쏘 회귀의 학습 방법
1) 초기화
2) 손실 함수 계산
3) 규제 적용
4) 손실 함수 최적화
5) 수렴확인
Python의 Scikit-learn 라이브러리를 사용하여 간단하게 라쏘 회귀 모델을 구현하는 방법
from sklearn.linear_model import Lasso
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
# 데이터 생성
X, y = make_regression(n_samples=100, n_features=10, noise=0.1, random_state=42)
# 훈련/테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 라쏘 모델 훈련
lasso = Lasso(alpha=0.1)
lasso.fit(X_train, y_train)
# 결과 출력
print("회귀 계수:", lasso.coef_)
print("제거된 변수 수:", sum(lasso.coef_ == 0))
분류(Classification) (0) | 2024.11.26 |
---|---|
회귀분석-Elastic Net (1) | 2024.11.20 |
회귀분석-릿지 회귀(Ridge Regression) (0) | 2024.10.30 |
회귀분석-다항 회귀(Polynomial Regression) (0) | 2024.10.28 |
회귀분석-선형 회귀(Linear Regression) (0) | 2024.10.18 |