본문 바로가기
Machine Learning

머신러닝 로지스틱 회귀(Logistic Regression)

by wanttosleep1111 2023. 3. 24.

머신러닝 로지스틱 회귀(Logistic Regression)

 

1. 로지스틱 회귀

  • 선형 모델 방식을 기반으로 이진 분류를 수행하는 모델
  • 이름은 회귀(Regression)이지만 숫자 0과 1로 구분하는 분류 모델

※ 선형 모델 방식을 분류에 사용하는 이유

선형 모델은 간단한 함수식을 사용하기 때문에 학습 및 예측 속도가 빠름

매우 큰 데이터 세트에서도 잘 동작

일반적으로 특성이 많을수록 더 잘 동작 (특성이 적은 데이터에서는 다른 모델이 더 좋은 경우가 많음)

 

  • 선형회귀 직선을 사용하여 두 집단을 분류할 수 있다는 점에서 착안

 

ex) 선형회귀 직선을 사용하여 분류하면 20시간을 공부했을 경우 y값이 1보다 커지게 되어 특별한 의미가 없어져버리고 합격 판단의 기준이 어려워짐

 

  • 주요 매개변수(Hyperparameter)
    LogisticRegression(C, max_iter) (※scikit-learn)
    C : 규제 강도의 역수 (값이 작을수록 규제가 강해짐)
    max_iter : 최대 반복 횟수 (값을 크게 잡아 주어야 학습이 제대로 됨)
    ※ 기본적으로 L2 규제를 사용, 중요 특성이 몇개 없다면 L1 규제를 사용해도 무방
    (주요 특성을 알고 싶을 때 L1 규제를 사용하기도 함)

댓글