Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog

SPSS 통계분석

SPSS 회귀분석 및 해석 방법 (SPSS 다중회귀분석)

SPSS 회귀분석 (Linear Regression Analysis) 방법을 살펴보겠습니다. 

회귀분석이란, 

정량적 변수(점수화 할 수 있는 변수)가 정량적 변수에 미치는 영향을 

검증하고자 할 때 사용하는 분석입니다. 

단순회귀분석은 독립변수가 한 개가 종속변수에 미치는 영향을 검증하는거고, 

다중회귀분석은 독립변수 여러 개가 종속변수에 미치는 영향을 검증하는거에요. 

단순회귀분석이나 다중회귀분석이나, 

방법에서는 동일하기 때문에, 다중회귀분석 예시로 볼게요. 

예를 들면, 휴대폰의 디자인 만족도와 기능 만족도가 

전반적 만족도에 미치는 영향에 대해 분석을 하겠습니다. 

1. [분석] - [회귀분석] - [선형] 을 선택합니다. 

2. 독립변수에는 '디자인 만족도'와 '기능 만족도'를, 

   종속변수에는 '전반적 만족도'를 넣어줍니다. 

   그리고 "통계량" 메뉴에 들어갑니다. 

3. 독립변수의 다중공선성 여부를 파악하기 위해 "공선성 진단"을 체크하고, 

   잔차의 독립성 여부를 검증하기 위해 "Durbin-Watson"을 체크합니다. 

   그리고 "계속", "확인"을 클릭해주면 됩니다. 

그러면 결과가 나타나는데요. 

먼저 모형 요약에서는 

R제곱과 수정된 R제곱, 그리고 Durbin-Watson 값이 나왔네요. 

R제곱독립변수가 종속변수를 얼마나 설명하는지를 의미하는 통계량입니다. 

여기서는 .459로 나타났기 때문에, 약 45.9%를 설명한다고 할 수 있습니다. 

수정된 R제곱은 변수가 많아지면 무조건 높아지는 R제곱의 단점을 보완한 R제곱입니다. 

여기서 수정된 R제곱은 .457로 나타났네요. 

R제곱과 큰 차이가 나지 않을수록 좋은 모형이라고 할 수 있습니다. 

요즘은 논문에서 R제곱과 수정된 R제곱을 모두 표기하는 게 일반적입니다. 

한편 Durbin-Watson1에서 3 사이의 값을 보이면, 

잔차의 독립성에 큰 문제가 없다고 할 수 있는데, 

여기선 1.874로 나타나 잔차의 독립성이 충족된 것으로 판단됩니다. 

다음으로 분산분석에서는, 

F값에 대한 유의확률을 확인해야 하는데, 

유의확률(p값)이 0.05보다 작으면, 

회귀모형이 적합하다고 할 수 있습니다. 

마지막으로 계수에서는, 

VIF값을 먼저 봐야 하는데, VIF가 10 미만이면, 다중공선성에는 문제가 없다고 합니다. 

다중공선성이란, 너무 비슷한 변수가 독립변수에 포함된 경우를 말하는데, 

여기서는 VIF값이 모두 1점대로 작으므로, 다중공선성 문제는 없는 것으로 나타났네요. 

다음으로 변수의 유의성을 확인하기 위해 유의확률을 볼게요. 

유의확률이 0.05보다 작으면, 그 변수가 종속변수에 유의한 영향을 미친다고 할 수 있어요. 

디자인 만족도와 기능 만족도의 유의확률이 모두 0.05보다 훨씬 작게 나타났네요. 

즉, 디자인 만족도와 기능 만족도는 전반적 만족도에 유의한 영향을 미치는 것으로 판단됐네요. 

베타값을 볼까요? 

디자인 만족도는 .129, 기능 만족도는 .596으로 나타났습니다. 

둘 다 플러스 값이기 때문에, 

디자인 만족도와 기능 만족도는 전반적 만족도에 정(+)의 영향을 미친다고 할 수 있습니다. 

그리고 베타 값이 기능 만족도가 훨씬 크기 때문에, 

기능 만족도가 디자인 만족도 보다는 전반적 만족도에 더 큰 영향을 미친다고 할 수 있겠네요. 

결과적으로 휴대폰 회사에서는, 고객들의 전반적인 만족도를 높이기 위해서는, 

디자인보다는 기능에 중점적인 개선을 해야한다고 결론을 낼 수 있겠네요. 

아래는 논문에서 주로 표현하는 표의 형태입니다. 

참고하시구요. 

이상 SPSS로 회귀분석을 하는 방법 소개였습니다. 


Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog

Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog

참고.  카이제곱 검정​   독립표본 t-검정​   대응표본 t-검정​ ​  일원배치분산분석

        상관관계 분석

① Durbin- Watson :  수치는 0~4까지 있으며, 2에 가까워야 한다.  2에 가까울수록 다중회귀분석에 사용된 변수들이 회귀모형에 적합하다고 해석한다.


② 유의확률 : 유의확률이 0.05보다 적다면, 독립변수 중에 한가지 이상은 종속변수에 영향을 미친다는 가설이 채택 될 것이라는 것을 알려주는 것이다.


Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog



③R : 상관관계이다. 상관관게분석에서는 소문자(r)로 표시를 해서 해석을 하지만, 여기에서는 대문자로 표시가 된다. 상관관계는 '너와 나'의 관계로써, 서로 간 얼마나 관계가 높으냐 낮으냐를 따지는 것이다.
가장 높은 숫자는 +1, 가장 낮은 숫자는 -1이다. 따라서 숫자가 절대값 1에 가까워질수록 상관관계가
높다고 할 수 있다.

④ 공선성 통계량에서 공차와 VIF : 공차는 0.1이상, VIF 10 미만이면 다중공선성에 문제가 없다고 해석한다.
   여기에서 다중공선성이란
'이게 콩인지 메주인지.헷갈린다...'라는 말이다

즉, 연구모형에 사용된 변수가 콩에 대해서 물어본 것인지, 메주에 대해서 물어본 것인지 모르겠다고 할때 다중공선성이 있다라고 표현을 한다.

Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog


⑤ *(별표) : *가 있으면 유의하다. 즉, 가설이 채택되었다는 의미, *가 없으면 가설이 기각되었다는 의미임
    1개(* )면 유의수준 95% 수준에서 채택되었다고 하고 기호로 이렇게 표현한다. p<.05 
   2개(** )면 유의수준 99% 수준에서 채택되었다고 하고 기호로 이렇게 표현한다. p<.01 
   3개(*** )면 유의수준 99.9% 수준에서 채택되었다고 하고 기호로 이렇게 표현한다. p<.001

⑥ B : 비표준화 계수로써 만약 기호가 (+)이고 ** 가 붙어 있다면
   "사회자발성이 높아질수록 기질은 향상된다라는 것이 유의하다"라고 해석한다.
  만약, 비표준화 계수가 (-)이고 *가 붙어있다면
  " 사회자발성이 낮아질수록 기질은 향상된다라는 것이 유의하다"라고 해석한다.

Spss 다중회귀분석 해석 - spss dajunghoegwibunseog haeseog



⑦ 표준화 베타 : 비표준화를 표준화 시킨 것이다.
 - 예를 들어서 다음과 같은 연구모형이라고 하자