본문 바로가기

doctoral course / research methodology

구조방정식 모형에 대한 설명과 주요 통계 패키지 구조 방정식 모형의 절차는 다음과 같습니다. * 모형 개발 -> 자료 수집 -> 모형 분석 -> 모형 평가 -> 모형 수정 -> 모형 비교 1. 모형 개발 구조 방정식 모형을 적용하는 데 있어 첫 번째 단계는 통계적으로 검증할 이론 모형을 개발하는 것입니다. 어떤 변수가 잠재 변수(latent variable)가 될 것인지, 어떤 표시 변수(indicator)를 이용해서 잠재 변수를 간접적으로 측정할 것인지 등을 결정해야 합니다. 보통 한 잠재 변수에 약 2~4개 정도의 표시 변수를 사용하는 것이 적당합니다. 2. 자료 수집 검증하려는 이론 모형의 복잡성을 고려하여 충분한 표본으로부터 자료를 수집하여야 합니다. 표본 수가 너무 작으면 추정 오차(estimation error)가 커지므로 추정된 미지수의 .. 더보기
측정의 타당도와 신뢰도 인터넷에서 가져옴. (http://cafe.daum.net/haksa369/5aFo/698?q=social%20desirability%20%C0%C7%B9%CC&re=1) 측정의 타당도와 신뢰도측정의 타당도와 신뢰도는 측정의 오류 문제를 극복하기 위한 노력 1. 측정의 오류측정의 오류는 크게 체계적 오류와 무작위 오류로 나눠서 살펴볼 수 있음1)체계적 오류측정의 체계적 오류(systematic error)는 자료수집 방법이나 자료가 제공되는 역학에 의해 발생하는 것• 우연한 실수 등으로 측정이 잘못되는 것이 아님• 잘못된 측정 방법을 채택함으로써 지속적이고 체계적으로 오류가 발생하는 것• 체계적 오류가 발생하면 측정하려는 개념이 아닌 다른 개념이 지속적으로 측정되는 결과 유발 -체계적 오류의 대표적인 경.. 더보기
외부 데이터 및 설문항목 검색해서 활용하는 법 학술연구를 진행할 때 어려움이 있을 수 있다. 그 중 외부 최신 데이터를 활용하고자 할 때, 어디에서 그러한 데이터를 찾을 수 있는지 몰라서 헤매는 경우와 설문항목을 작성하고자 할 때, 어떤 표현으로 어떻게 작성하는지 확인이 필요한 경우가 있다. 1. 경험적 근거없이 이론적으로 설명을 하면 연구내용의 설득력이 떨어진다. (개념적 고찰을 하는 연구도 근거자료는 최대한 제시해야 한다.)2. 그렇다면 자료를 어디서 어떻게 찾아야 하는지, 그것도 능력이다.3. 자료를 찾아서 온라인 상에서 그대로 분석이 되면 편리할 수 있겠다. (SPSS와 같은 패키지를 설치하고 활용하기 이전에 간단한 것은 그대로 사용하면 편리할 것이다.)4. 설문조사는 온라인에서 바로 설문을 작성해서 취합하여 기본적인 분석을 하면 편할 수 있.. 더보기
내생성(endogeneity) 문제의 해결방법 여기서는 내생성 문제에 대해서 좀 더 체계적으로 정리해 보려 한다. (앞에 포스팅이 일부 되어 있지만 정리하는 차원에서 재포스팅 되는 내용도 있다.) 내생성이란? Y = αX1 + αX2 + ε 에서 모든 설명변수와 잔차 간에 상관관계가 없어야 한다. OLS는 이러한 상관관계가 없다고 보고 가장 기본적인 회귀분석을 하는 것이다. 예를 들어, x가 y를 설명하고 남은 부분이 잔차(ε)이다. 그런데 변수와 잔차가 유의한 상관관계를 가지면 ‘계량경제학’적인 문제가 발생한다. 따라서 이 상태에서 추정된 설명변수의 계수 값에 대한 p값은 과대추정될 수 밖에 없다. 그렇다면 이러한 상관관계를 없애줘야 한다. 우선 가장 쉽게 생각할 수 있는 방법으로, omitted variable이 있다면 이를 포함시켜 해결할 수 .. 더보기
논문에서 보여주는 '표'를 이해하려면, 기술통계량에 대해서는 이미 포스팅 되어 있다. 그러면 일반적으로 실증분석 논문에서는 기술통계량 다음에 어떠한 내용(표)가 나오는가, 다음과 같다. 기술통계량 그 이후...... 2. 두번째 테이블: correlation matrix를 보여준다. - 왜 이것을 보여주는가? 변수간의 상관계수를 보여주는 이유는 두 변수의 관계가 어떻다… 라고 말해 주는 필요성 정도, 그리고 독립변수들 간의 상관계수가 지나치게 높은지 체크하는 의미가 있다. 즉 다중공선성 여부를 체크하는 것이다. (예를 들어 0.8이라는 상관계수가 나왔다면 대부분은 높지 않으나 c와 d간의 상관관계가 0.8이 넘기 때문에 다중공선성이 우려된다…. 고 말하게 된다.) - 따라서 뒤에 회귀분석을 하면서 v.i.f. 계산을 했더니 별 문제 없더라… .. 더보기
통제변수, 다중공선성, 내생성 통제변수 통제변수가 유의한 값으로 나오면 통제변수가 유의한 역할을 했다는 것을 확인하는 정도로 이해하면 된다.당연히 통제되어야 할 변수를 빼먹어서 생기는 bias를 omitted variable problem 이라고 한다. 통제변수는 가설을 세우지 않는다. 다중공선성 독립변수간의 상관관계가 어느 정도는 있을 수 밖에 없으며 요약하면, 이를 다중공선성 문제라고 한다. 다중공선성은 통계적으로 기준을 갖고 판단해야 한다. 회귀분석을 하면 V.I.F 값을 볼 수 있는데 이를 분산팽창계수가 한다. 통상 이 값이 8 혹은 10보다 작으면 괜찮다고 해석한다. 즉 다중공선성 문제가 없다고 한다. 내생성 내생성이라는 개념은 독립변수간에 인과관계가 형성되어 있는 것을 의미한다. (참고로 상관관계는 A와 B가 같이 움직이는.. 더보기
descriptive analysis에 대한 기본 개념 기술통계량에 대한 이야기 보통 논문을 읽다보면 정량분석에 대한 내용이 나온다. (통계조사방법론을 사용한 논문)그러면 첫번째 나오는 [표]는 연구에 사용된 sample 혹은 [descriptive analysis]의 내용이다. descriptive analysis (기술통계량 분석) - 모든 개별변수에 대한 통계적 속성, 평균, 중위수, 분산 등을 보여준다. 이는 변수간의 관계를 보여주는 것이 아니라 하나의 변수가 갖는 통계적 속성을 보여주는 것이기 때문에 univariate analysis(단변수 변량)이라고 표현하기도 한다. - 왜 기술통계량을 보여주는가? 이는 분포의 특성을 보여주기 위해서이다. (예, 평균을 보여주는 경우) 그렇다면 왜 분포를 보여주어야 할까? 대부분의 통계는 정규분포(t분포)를 가.. 더보기
탐색요인분석 (1) - 강의 필기 탐색요인분석 (2013.5.25) 초기에는 브랜드 속성으로 차별화한다. 제품의 본연의 속성을 가지고 차별화를 한다. 그러나 제품경쟁이 성숙되면, 제품 자체가 가지고 있는 속성은 거의 유사한 수준까지 올라가게 된다. 따라서 그 이후에는 그 이외의 수단으로 차별화를 하는데 그것이 brand personality(브랜드 개성)라고 한다. . 동 논문에서 제시한 접근방법에 대해서 검토를 하면서 이해하자. (조직행동론에서도 많이 쓰는 방법이다.) Aaker의 BPS 개발과정 42개의 단어(형용사)를 추려 내어, 5개 카테고리로 나누었다. 설문지에 사용하는 질문들, 브랜드개성척도 (brand personality scale: BPS)를 개발 36개 브랜드로 4개의 브랜드 그룹을 만들고 “1개의 중심브랜드(Levi’.. 더보기
ACTION RESEARCH 란? 현장연구는 "현장교사나 동료교사나 대학연구자의 도움을 받아 자신의 교육실천을 스스로 체계적, 반성적으로 탐구하여 개선하는 것"을 근본적 특징으로 한다(강신복, 최의창, 1994; 최의창, 1993). 교육학자들은 다음과 같은 정의를 하고 있다. Oberg 와 McCutcheon(1987)는 자신들이 하는 일을 보다 잘 이해하고 보다 효과적이거나 나은 상태로 개선시키려는 목적으로 자신이 하는 일들에 초점을 맞추는 전문가들에 의한 모든 형태의 체계적 연구(p. 117)라고 하며, McKernan(1987)는 교사로 하여금 어떤 상황속에서 발생한 문제를 보다 잘 이해하고 해결하도록 하는 일정의 자기반성적 문제해결방법(p. 6)이라 했다. Kemmis와 McTaggart(1988)는 어떤 상황내에서 자신들이 하.. 더보기