ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [회귀] 회귀모델_실습
    Machine Learning/분류&회귀 2022. 9. 20. 18:02

    회귀분석 : 예측값이 숫자값(연속값)

    • 단순선형회귀: 독립변수 하나, 종속변수 하나인 선형회귀
      • ex) 주택가격이 주택의 크기로만 결정
    • 다중회귀: 독립변수 여러개, 종속변수 하나
      • ex) 주택가격이 주택의 크기, 위치, 등등..여러가지 변수 존재

     

    독립변수

    • RIM: 지역별 범죄 발생률
    • ZN: 25,000평방피트를 초과하는 거주 지역의 비율
    • NDUS: 비상업 지역 넓이 비율
    • CHAS: 찰스강에 대한 더미 변수(강의 경계에 위치한 경우는 1, 아니면 0)
    • NOX: 일산화질소 농도
    • RM: 거주할 수 있는 방 개수
    • AGE: 1940년 이전에 건축된 소유 주택의 비율
    • DIS: 5개 주요 고용센터까지의 가중 거리
    • RAD: 고속도로 접근 용이도
    • TAX: 10,000달러당 재산세율
    • PTRATIO: 지역의 교사와 학생 수 비율
    • B: 지역의 흑인 거주 비율
    • LSTAT: 하위 계층의 비율
    • PRICE: 본인 소유의 주택 가격(중앙값) - 종속변수 (위의 건 독립변수)

    Null값이 없으며 모두 Float형식

    RM 과 LSTAT, PRICE 영향도가 가장 큼

    RM(방개수) 양 방향의 선형성이 가장 큼. 즉, 크기가 클수록 가격이 증가

    LSTAT(하위 계층의 비율) 음 방향의 선형성이 가장 큼. 즉, 하위계층이 적을수록 주택 가격 증가

    r의 제곱 값은 0.757
    RM이 양의 값으로 회귀 계수가 가장 크며, NOX의 - 회귀계수 값도 큼

     

    출저: 파이썬머신러닝완벽가이드 도서 참조
    반응형

    'Machine Learning > 분류&회귀' 카테고리의 다른 글

    [회귀] 로지스틱 회귀  (0) 2022.08.17
    [회귀] 회귀모델  (0) 2022.08.12
    [분류] 데이터 가공 후 결과 분석  (0) 2022.08.12
    [분류] 분류기 정리  (0) 2022.08.12
    [분류] 부스팅기법  (0) 2022.03.28
Designed by Tistory.