머신러닝 로지스틱 회귀(Logistic Regression)
1. 로지스틱 회귀
- 선형 모델 방식을 기반으로 이진 분류를 수행하는 모델
- 이름은 회귀(Regression)이지만 숫자 0과 1로 구분하는 분류 모델
※ 선형 모델 방식을 분류에 사용하는 이유
선형 모델은 간단한 함수식을 사용하기 때문에 학습 및 예측 속도가 빠름
매우 큰 데이터 세트에서도 잘 동작
일반적으로 특성이 많을수록 더 잘 동작 (특성이 적은 데이터에서는 다른 모델이 더 좋은 경우가 많음)
- 선형회귀 직선을 사용하여 두 집단을 분류할 수 있다는 점에서 착안

ex) 선형회귀 직선을 사용하여 분류하면 20시간을 공부했을 경우 y값이 1보다 커지게 되어 특별한 의미가 없어져버리고 합격 판단의 기준이 어려워짐

- 주요 매개변수(Hyperparameter)
LogisticRegression(C, max_iter) (※scikit-learn)
C : 규제 강도의 역수 (값이 작을수록 규제가 강해짐)
max_iter : 최대 반복 횟수 (값을 크게 잡아 주어야 학습이 제대로 됨)
※ 기본적으로 L2 규제를 사용, 중요 특성이 몇개 없다면 L1 규제를 사용해도 무방
(주요 특성을 알고 싶을 때 L1 규제를 사용하기도 함)
'Machine Learning' 카테고리의 다른 글
머신러닝 선형 회귀 (0) | 2023.03.24 |
---|---|
머신러닝 앙상블(Ensemble) (0) | 2023.03.20 |
머신러닝 Decision Tree, 교차 검증, 특성 선택 (0) | 2023.03.20 |
머신러닝 분류 평가 지표 (0) | 2023.03.12 |
머신러닝 기초 3, KNN모델을 이용한 붓꽃 품종 분류 실습 (0) | 2023.03.12 |
댓글