-
분류 알고리즘 - 로지스틱 회귀분석데이터 분석/MachineLearning 2021. 5. 16. 22:49
로지스틱 회귀는 종속변수(Y)에 로짓 변환을 실시하여 로지스틱 회귀분석이라고 한다. 위 로지스틱 모형식은 독립변수(X)의 값에 관계 없이 종속변수(Y)의 값이 항상 0 - 1 사이에 있도록 한다.
결과가 이진형 변수(0 or 1) 라는 것을 빼면 다중선형회귀와 마찬가지로 독립변수와 종속변수를 선형관계로 가정한다. 종속변수(Y)의 결과가 범주형으로 분류 분석에 해당되는 지도 학습 유형 알고리즘이다.
즉, 연속형 자료(또는 범주형 자료)가 범주형 자료에 미치는 영향을 분류한다.
예) 타이타닉 생존자 예측 -> 나이, fare, pclass이 생존 여부(종속변수)에 미치는 영향
성별, 탑승등급 같은 종속변수도 -> 숫자로 바꿔서 로지스틱 회귀 분석이 가능하다.
분류 알고리즘 모형은 KNN, SVM, Decision Tree, Logistic Regression 등의 알고리즘이 존재한다.
* 통계예측모형
1) 수치예측 평가방법 : MSE, MAE, RMSE
2) 분류예측 평가방법 : Accuracy(정확도), Precision(정밀도), Recall(재현율, 민감도)개념 참고
https://nittaku.tistory.com/478
https://lucy-the-marketer.kr/ko/growth/logistic-regression/
로지스틱 회귀계수 설명 참고
https://m.blog.naver.com/jaehong7719/221911585205
반응형'데이터 분석 > MachineLearning' 카테고리의 다른 글
계절요소 추가한 시계열 선형 모델 SARIMAX 파이썬 (python) (0) 2021.05.31 ARIMA 모형 알고리즘(시계열 데이터 분석), python 파이썬 (0) 2021.05.30