본문 바로가기

doctoral course / research methodology

구조방정식 모형에 대한 설명과 주요 통계 패키지

구조 방정식 모형의 절차는 다음과 같습니다. 

* 모형 개발 -> 자료 수집 -> 모형 분석 -> 모형 평가 -> 모형 수정 -> 모형 비교 


1. 모형 개발

구조 방정식 모형을 적용하는 데 있어 첫 번째 단계는 통계적으로 검증할 이론 모형을 개발하는 것입니다. 어떤 변수가 잠재 변수(latent variable)가 될 것인지, 어떤 표시 변수(indicator)를 이용해서 잠재 변수를 간접적으로 측정할 것인지 등을 결정해야 합니다. 보통 한 잠재 변수에 약 2~4개 정도의 표시 변수를 사용하는 것이 적당합니다. 

2. 자료 수집

검증하려는 이론 모형의 복잡성을 고려하여 충분한 표본으로부터 자료를 수집하여야 합니다. 표본 수가 너무 작으면 추정 오차(estimation error)가 커지므로 추정된 미지수의 값을 신뢰할 수 없게 됩니다. 표본 크기에 대한 절대적인 기준은 없지만 일반적인 기준은 1) 추정하는 미지수 숫자의 5~10배 정도의 표본을 사용하는 것(Bentler & Chou, 1987), 2) 최소 150명 이상의 표본을 사용하는 것(Anderson & Gerbing, 1988) 등이 있습니다. 그 밖에 MacCallum, Browne & Sugawara(1996) 등이 제안한 power analysis 방법을 이용해서 power 수준이 0.8이 되는데 필요한 표본 수를 사용하는 방법도 있습니다. 

3. 모형 분석

이론 모형을 개발하고 모형 검증을 위한 충분한 자료가 수집되면 모형을 분석하게 됩니다. 이때 구조 방정식 모형 분석 프로그램을 사용하여 개발한 모형에서 자유 미지수 값을 추정하게 됩니다. 추정 방법으로는 ML(maximum likelihood) estimation이 가장 많이 사용되는데 이는 수집된 자료의 공변량 행렬과 추정된 자유 미지수 값을 이용해 재생한 공변량 행렬 사이의 차이를 최소화하는 방법입니다. 모형의 적합도가 완벽하면 ML 방법으로 구해지는 F값(sample discrepancy function value)이 0이 되며 적합도가 나빠질수록 F값은 커집니다. 

ML은 자료에 결측치(missing value)가 없다는 것을 전제로 하기 때문에 만약 결측치가 있으면 FIML(full-information maximum likelihood)를 이용합니다. FIML은 한 변수의 결측치가 무선적으로 발생했거나(missing completely at random, MCAR), 한 변수의 결측 여부가 다른 변수의 값에 의해 결정되는 경우(missing at random, MAR)에 listwise 또는 pairwise와 같은 전통적인 방법보다 정확하게 미지수 추정을 합니다(Arbuckle, 1996). 

ML은 다변량 정규분포를 가정한 방법이므로 자료 수집 후 우선 다변량 정규분포 가정에 위배되지 않는지 검토해야 합니다. 가장 쉽게 사용할 수 있는 방법은 여러 통계 프로그램이 제공하는 Mardia 지수를 이용해서 검증하는 것인데 이 지수는 표본 크기에 민감하다는 사실에 유념해야 합니다. 다변량 정규분포에 대한 가정이 위배되었을 경우, ML대신 Robust ML(Satorra & Bentler, 1994)을 이용할 수 있는데, Robust ML은 EQS에서 제공하고 있습니다. Robust ML은 최근 결측치 자료에도 적용이 가능해졌습니다(Yuan & Bentler, 1998).

 
* 구조 방정식 모형 분석을 위한 프로그램들

1. LISREL(Joreskog & Sorbom, 1993)
1970년대 중반에 가장 먼저 개발된 프로그램입니다. 연구자가 직접 행렬표를 작성하여 프로그램을 짜야 한다는 어려움이 있었지만 회귀 분석을 바탕으로 한 SIMPLIS를 발표하면서 여전히 많이 사용되고 있습니다. LISREL의 장점은 잠재 변수 사이에 비선형 관계를 다룰 수 있어 잠재 변수 간의 상호작용 모형을 처리하는 데 있어 가장 강력합니다. 

2. EQS(Bentler, 1995)
회귀 분석을 바탕으로 한 프로그램입니다. EQS는 모형에 사용되는 측정 변수의 분포가 정규 분포로부터 심하게 벗어나 있을 때에도 사용할 수 있는 Robust ML 방법을 제공하며, 모형의 특정 미지수에 동일화 제약을 하였을 때, 그 제약이 타당한지 LM(Lagrange Multiplier) 검사를 이용해서 검증할 수 있도록 해 줍니다. 따라서 동일화 제약이 많이 사용되는 다집단 분석(multi-group analysis)에 유용합니다.

3. AMOS(Arbuckle, 1999)
분석을 위해 프로그램을 짤 필요가 없고, 검증할 모형을 경로도로 직접 그려서 분석하는 그래픽 기법의 도입으로 엄청난 반향을 불러일으킨 프로그램입니다. 사용하기가 매우 쉽다는 장점이 있으며 잠재 변수의 평균을 추정해야 하는 LGM같은 복잡한 모형도 쉽게 분석할 수가 있습니다. 

4. Mplus(Muthen & Muthen, 2001)
최근 주목받고 있는 프로그램입니다. AMOS에 비해 사용하기는 어려우나 다른 프로그램에서는 찾아볼 수 없는 강력한 기능을 많이 가지고 있어 주목받고 있는 프로그램입니다. Mplus는 구조 방정식 모형에서 비연속 변수를 종속 변수로 이용할 수 있으며 latent class model을 회귀 분석이나 LGM 등에 결합한 mixture model을 검증하거나 GGMM, Event history analysis 등 다양한 종단 모형과, 다층 모형과 구조 방정식 모형을 결합한 다층 구조 방정식 모형(multi-level SEM)도 검증할 수 있습니다.