-
[회귀] 회귀모델_실습Machine Learning/분류&회귀 2022. 9. 20. 18:02
회귀분석 : 예측값이 숫자값(연속값)
- 단순선형회귀: 독립변수 하나, 종속변수 하나인 선형회귀
- ex) 주택가격이 주택의 크기로만 결정
- 다중회귀: 독립변수 여러개, 종속변수 하나
- ex) 주택가격이 주택의 크기, 위치, 등등..여러가지 변수 존재
독립변수
- RIM: 지역별 범죄 발생률
- ZN: 25,000평방피트를 초과하는 거주 지역의 비율
- NDUS: 비상업 지역 넓이 비율
- CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
- NOX: 일산화질소 농도
- RM: 거주할 수 있는 방 개수
- AGE: 1940년 이전에 건축된 소유 주택의 비율
- DIS: 5개 주요 고용센터까지의 가중 거리
- RAD: 고속도로 접근 용이도
- TAX: 10,000달러당 재산세율
- PTRATIO: 지역의 교사와 학생 수 비율
- B: 지역의 흑인 거주 비율
- LSTAT: 하위 계층의 비율
- PRICE: 본인 소유의 주택 가격(중앙값) - 종속변수 (위의 건 독립변수)
Null값이 없으며 모두 Float형식 RM 과 LSTAT, PRICE 영향도가 가장 큼
RM(방개수) 양 방향의 선형성이 가장 큼. 즉, 크기가 클수록 가격이 증가
LSTAT(하위 계층의 비율) 음 방향의 선형성이 가장 큼. 즉, 하위계층이 적을수록 주택 가격 증가
r의 제곱 값은 0.757 RM이 양의 값으로 회귀 계수가 가장 크며, NOX의 - 회귀계수 값도 큼 출저: 파이썬머신러닝완벽가이드 도서 참조
반응형'Machine Learning > 분류&회귀' 카테고리의 다른 글
[회귀] 로지스틱 회귀 (0) 2022.08.17 [회귀] 회귀모델 (0) 2022.08.12 [분류] 데이터 가공 후 결과 분석 (0) 2022.08.12 [분류] 분류기 정리 (0) 2022.08.12 [분류] 부스팅기법 (0) 2022.03.28 - 단순선형회귀: 독립변수 하나, 종속변수 하나인 선형회귀