다중 선형 회귀-개요, 공식, 작동 방식

다중 선형 회귀는 둘 이상의 변수 값을 기반으로 변수의 결과를 예측하는 데 사용되는 통계 기법을 말합니다. 간단히 다중 회귀라고도하며 선형 회귀의 확장입니다. 예측하고자하는 변수를 종속 변수라고하며 종속 변수의 값을 예측하는 데 사용하는 변수 종속 변수 종속 변수는 독립 변수라고하는 다른 변수의 값에 따라 변경되는 변수입니다. 독립 또는 설명 변수로 알려져 있습니다.

다중 선형 회귀그림 1 : 개별 관찰에 대한 다중 선형 회귀 모델 예측 (출처)

요약

  • 다중 선형 회귀는 두 개 이상의 독립 변수를 사용하여 종속 변수의 결과를 예측하는 통계 기법을 말합니다.
  • 이 기법을 사용하면 분석가가 모델의 변동과 총 분산에서 각 독립 변수의 상대적 기여도를 확인할 수 있습니다.
  • 다중 회귀는 선형 회귀와 비선형 회귀의 두 가지 형태를 취할 수 있습니다.

다중 선형 회귀 공식

다중 선형 회귀-공식

어디:

  • 이순신 종속 또는 예측 변수
  • β0 은 y 절편, 즉 xi와 x2가 모두 0 일 때 y의 값입니다.
  • β1β2는 의 한 단위 변화에 대해 Y 변화 나타내는 회귀 계수이다 xi1xi2을 각각.
  • βp 는 각 독립 변수에 대한 기울기 계수입니다.
  • ϵ 는 모델의 랜덤 오차 (잔차) 항입니다.

다중 선형 회귀 이해

단순 선형 회귀를 사용하면 통계학자가 다른 변수에 대한 사용 가능한 정보를 사용하여 한 변수의 값을 예측할 수 있습니다. 선형 회귀는 직선을 따라 두 변수 간의 관계를 설정하려고합니다.

다중 회귀는 종속 변수 가 두 개 이상의 독립 변수와 의 선형 관계를 나타내는 회귀 유형입니다 . 또한 비선형 일 수 있습니다 . 여기서 종속 및 독립 변수 독립 변수 독립 변수는 종속 변수 (결과)에 미치는 영향을 평가하기 위해 변경되는 입력, 가정 또는 동인입니다. 직선을 따르지 마십시오.

선형 및 비선형 회귀는 둘 이상의 변수를 그래픽으로 사용하여 특정 반응을 추적합니다. 그러나 비선형 회귀는 시행 착오에서 파생 된 가정에서 생성되기 때문에 일반적으로 실행하기가 어렵습니다.

다중 선형 회귀의 가정

다중 선형 회귀는 다음 가정을 기반으로합니다.

1. 종속 변수와 독립 변수 간의 선형 관계

다중 선형 회귀의 첫 번째 가정은 종속 변수와 각 독립 변수간에 선형 관계가 있다는 것입니다. 선형 관계를 확인하는 가장 좋은 방법은 산점도를 만든 다음 산점도의 선형성을 시각적으로 검사하는 것입니다. 산점도에 표시된 관계가 선형이 아닌 경우 분석가는 비선형 회귀를 실행하거나 SPSS와 같은 통계 소프트웨어를 사용하여 데이터를 변환해야합니다.

2. 독립 변수는 서로 높은 상관 관계가 없습니다.

데이터는 독립 변수 (설명 변수)가 서로 높은 상관 관계가있을 때 발생하는 다중 공선 성을 보여서는 안됩니다. 독립 변수가 다중 공선 성을 나타낼 때 종속 변수의 분산에 기여하는 특정 변수를 파악하는 데 문제가 있습니다. 가정을 테스트하는 가장 좋은 방법은 분산 팽창 계수 방법입니다.

3. 잔차의 분산은 일정합니다.

다중 선형 회귀는 잔차의 오 차량이 선형 모델의 각 점에서 유사하다고 가정합니다. 이 시나리오를 동분 산성이라고합니다. 데이터를 분석 할 때 분석가는 예측 된 값에 대해 표준화 된 잔차를 플로팅하여 점이 모든 독립 변수 값에 대해 공정하게 분포되어 있는지 확인해야합니다. 가정을 테스트하기 위해 데이터를 산점도에 표시하거나 통계 소프트웨어를 사용하여 전체 모델을 포함하는 산점도를 생성 할 수 있습니다.

4. 관찰의 독립성

모델은 관측 값이 서로 독립적이어야한다고 가정합니다. 간단히 말해, 모델은 잔차 값이 독립적이라고 가정합니다. 이 가정을 테스트하기 위해 Durbin Watson 통계를 사용합니다.

테스트는 0에서 4까지의 값을 표시합니다. 여기서 0에서 2 사이의 값은 양의 자기 상관을 나타내고 2에서 4의 값은 음의 자기 상관을 나타냅니다. 중간 점, 즉 2의 값은 자기 상관이 없음을 나타냅니다.

5. 다변량 정규성

다변량 정규성은 잔차가 정규 분포를 따르는 경우 발생합니다. 이 가정을 테스트하려면 잔차 값이 어떻게 분포되어 있는지 살펴보십시오. 또한 두 가지 주요 방법, 즉 중첩 된 정규 곡선이있는 히스토그램 또는 정규 확률도 방법을 사용하여 테스트 할 수 있습니다.

더 많은 리소스

금융은 CBCA (Certified Banking & Credit Analyst) ™ CBCA ™ 인증을 제공합니다. CBCA (Certified Banking & Credit Analyst) ™ 인증은 금융, 회계, 신용 분석, 현금 흐름 분석, 약정 모델링, 대출을 다루는 신용 분석가를위한 글로벌 표준입니다. 상환 등. 경력을 다음 단계로 끌어 올리려는 사람들을위한 인증 프로그램입니다. 지식 기반을 계속 배우고 개발하려면 아래의 추가 관련 재무 리소스를 살펴보세요.

  • 예측 방법 예측 방법 최고 예측 방법. 이 기사에서는 재무 분석가가 미래 수익을 예측하는 데 사용하는 네 가지 유형의 수익 예측 방법을 설명합니다.
  • 포아송 분포 포아송 분포
  • 랜덤 변수 랜덤 변수 랜덤 변수 (확률 적 변수)는 특정 랜덤 현상의 결과에 따라 가능한 값이 달라지는 통계 변수의 한 유형입니다.
  • 회귀 분석 회귀 분석 회귀 분석은 종속 변수와 하나 이상의 독립 변수 간의 관계를 추정하는 데 사용되는 통계 방법 세트입니다. 변수 간 ​​관계의 강도를 평가하고 변수 간의 미래 관계를 모델링하는 데 사용할 수 있습니다.

최근 게시물