본문 바로가기

doctoral course / research methodology

탐색요인분석 (1) - 강의 필기

탐색요인분석 (2013.5.25)                                      


초기에는 브랜드 속성으로 차별화한다. 제품의 본연의 속성을 가지고 차별화를 한다. 그러나 제품경쟁이 성숙되면, 제품 자체가 가지고 있는 속성은 거의 유사한 수준까지 올라가게 된다. 따라서 그 이후에는 그 이외의 수단으로 차별화를 하는데 그것이 brand personality(브랜드 개성)라고 한다. .


동 논문에서 제시한 접근방법에 대해서 검토를 하면서 이해하자. (조직행동론에서도 많이 쓰는 방법이다.)


Aaker BPS 개발과정


42개의 단어(형용사)를 추려 내어, 5개 카테고리로 나누었다. 설문지에 사용하는 질문들, 브랜드개성척도 (brand personality scale: BPS)를 개발


36개 브랜드로 4개의 브랜드 그룹을 만들고 “1개의 중심브랜드(Levi’s jean)는 각 그룹에 포함시켰는데 그 이유는 응답자가 대답하는 부하가 많지 않도록 하기 위함임. 각 응답자는 brand group에 각각 배치된다. 따라서 그 응답자가 간 대답차이가 있는지 보려면 리바이스 진 항목으로 체크할 수 있도록 하였다.


주성분분석은 탐색요인분석의 부속품으로 이해하면 된다. (어느 사람은 주성분분석이 탐색요인분석의 한 종류라고 이해하는 사람도 있긴 하다.)


P개의 변수에 대하여 주성분을 만드는 것이다. (주성분을 p개 만든다는 것이다.) 주성분이라는 것을 설명하기 위해서


1.     자료를 표준화 시킨다.

2.     가중치를 구한다.

3.     가중 합계를 구한다. 가중총점. 이것이 주성분이다.

4.     변수 개수는 주성분 수와 같다.

5.     1주성분은 분산이 제일 큰 것, 2주성분은 두 번째 큰 분산, 그리고 제1주성분과 상관관계가 없는 것


주성분(요인)과 관측변수 간의 상관계수를 loading를 의미한다.


주성분분석은 관측변수 p개가 있을 때, 주성분 p개를 찾아내는 것이다. 주성분은 가중총점이고 따라서 가중치가 있어야 한다. 당연히 p개의 주성분을 구하려면 p셋트의 가중치가 있어야 한다.


가중치를 구하려면 아래 설명 보세요!!!


상관계수 행렬 ------------------à 상관계수 행렬의 eigenvalue / eigen vector 를 얻는다

Eigenvalue p (이것이 주성분의 분산)

Eigen vector p셋트 (이것이 가중치 셋트)

 

(다시 강의자료로 가서)

아커는 주성분을 114개 만들었다. 그리고 주성분분석은 끝났고 114개에서 몇 개를 골라내야 한다. 여기서부터는 탐색요인분석에 해당한다. 연구자가 결정해야 하는 중요한 사항이 2가지가 있다. (주성분=요인)


n  요인의 수

n  각각의 요인의 명칭

 


선택하는 방법은,


n  표준화시킨 변수는 1 이다. 변수라는 것은 변동량인데, 분산이 1 이라는 뜻은 관측변수 1개의 역할을 한다는 것이다. 1보다 크다는 의미는 관측변수 1개보다는 역할을 더 하는 가중총점을 골랐다는 뜻이다.


n  카이저 방식(Scree plot)요인수를 x, eigenvalue y, 1주성분부터 그래프에 점을 찍는다. 이 그래프에서 선 하나를 찾는다. 어떤 선을 찾냐? 수평선에 제일 근접한 선을 찾는다. 그래서 수평선에 근접한 두선을 잇는 점의 왼쪽에 있는 점을 고른다. (대개 탐색요인분석을 했다는 설명을 하기 위해서 이정도 검토를 해야 한다.)


n  Varimax rotation – loading을 바꾼다. ? 그냥 주성분결과에서 요인수와 각 요인 명칭을 정하려고 하면 잘 안되는 경우가 있다. 즉 잘 묶이도록 하는 것이다.


고유값(eigenvalue)의 숫자는 관측변수 약 몇 개의 설명을 할 수 있다. 설명분산은 전체변동량(변수 만큼의 변동량, 변수가 18개면 전체 변동량은 18)분에 해당 요인의 분산값이다.


요인분석의 구분


n  탐색요인분석(Exploratory)은 요인구조에 대한 틀이 없어서 찾아나가는 것이다.

n  확인요인분석(Confirmatory)은 내가 갖고 있는 구조가 맞는지 확인해 가는 것이다. (SPSS에서는 확인요인분석을 할 수 없다. AMOS에서 쓸 수 있다.)

 




상관계수 행렬: 역할을 하는 개수는 즉, {n(n-1)}÷2


 

X1

X2

X3

X4

X5

X1

1

 

 

 

 

X2

 

1

 

 

 

X3

 

 

1

 

 

X4

 

 

 

1

 

X5

 

 

 

 

1

 


n  요인분석을 하기 위한 상관관계가 있어야 한다. 완벽하게 상관계수가 없는 행렬(, 단위행렬)에서 거리가 멀면 멀수록 상관관계가 높은 것이다.


n  그럼 상관관계를 검토하는데 사용할 수 있는 방법이 있는데 그것은,


1) Bartlett’s test of sphericity (
바트렛의 구형성검정)
2) Kaiser-Meyer-Olkin (KMO) measure of sampling adequacy (KMO
의 표본적합도)

 


※참고: Common factor(공통요인) / Specific factor(고유요인)
λ(변수번호, 요인번호) : 요인이 변수에 영향을 준다.