본 포스팅은 고려대학교 산업경영공학부 김성범 교수님의 유튜브 강의를 정리한 내용입니다.

유튜브 - 김성범[ 교수 / 산업경영공학부 ]

 

변수 사이의 관계

  • 확정적 관계 : X 변수만으로 Y를 100% 표현 가능(오차항 없음)

       예) 힘 = f(질량, 가속도), 주행거리 = f(속도, 시간)

  • 확률적 관계 : X 변수와 오차항이 Y를 표현(오차항 있음)

        예) 반도체 수율 = f(설비 파라미터들의 상태, 온도, 습도) + ε

              포도주 가격 = f(강우량, 온도, 포도품종) + ε

              위조카드 여부 = f(사용시간, 사용액, 사용장소) + ε

 

선형회귀모델

선형회귀모델 : 출력변수 Y를 입력변수 X들의 선형결합으로 표현한 모델

선형결합 : 변수들을 (상수배와) 덧셈, 뺼셈 연산을 통해 결합

 

선형회귀모델링의 목적

  • X 변수와 Y 변수 사이의 관계를 수치로 설명
  • 미래의 반응변수(Y) 값을 예측

 

선형회귀모델의 분류

  • X 변수의 수에 따라 : 단순회귀모델, 다중회귀모델
  • X 변수와 Y변수의 선형성 여부에 따라 : 선형회귀모델, 비선형회귀모델

 

선형회귀모델 가정

(i= 1,…,n)

모든 i에 대해서 오차항은 평균이 0, 분산이 σ^2 인 정규분포를 따름.

 

선형회귀모델이란?

입력변수(X)와 출력변수(Y) 평균과의 관계를 설명하는 선형식을 찾는 것

  • 위 선형식에서 β 를 파라미터 (parameter)라 하고 파라미터를 찾는 것을 통계적으로 추정이라고 함.

+ Recent posts