기술통계량에 대해서는 이미 포스팅 되어 있다. 그러면 일반적으로 실증분석 논문에서는 기술통계량 다음에 어떠한 내용(표)가 나오는가, 다음과 같다.
기술통계량 그 이후......
2. 두번째 테이블: correlation matrix를 보여준다.
- 왜 이것을 보여주는가? 변수간의 상관계수를 보여주는 이유는 두 변수의 관계가 어떻다… 라고 말해 주는 필요성 정도, 그리고 독립변수들 간의 상관계수가 지나치게 높은지 체크하는 의미가 있다. 즉 다중공선성 여부를 체크하는 것이다. (예를 들어 0.8이라는 상관계수가 나왔다면 대부분은 높지 않으나 c와 d간의 상관관계가 0.8이 넘기 때문에 다중공선성이 우려된다…. 고 말하게 된다.)
- 따라서 뒤에 회귀분석을 하면서 v.i.f. 계산을 했더니 별 문제 없더라… 고 논문에서 언급한다. 그러나 v.i.f.가 높게 나오면 뭔가 조치를 해야 한다.
3. 세번째 테이블: main table이 된다. 이 안에 포함되는 요소들은 다음과 같은 것들이 있다.
R-square (원래는 adj. R-square를 써야 한다.)
- 설명변수가 종속변수를 설명하는 정도를 의미한다. 즉 종속변수가 설명되야 하는 전체 중에 설명변수(독립변수)가 설명하는 부분(비율)을 의미한다. 보통 사회과학에서는 자연과학에 비해 이 값이 매우 낮다. 만약 47% 설명된다면 매우 좋은 수준이다. 30% 설명력이 나오면 받아들일 수 있다. 일반적인 재무, 회계 등의 경영학에서 7% 정도 나와도 충분하다고 판단한다.
- 증분 R-square는 해도 되고 안해도 된다.
F값
- 이 연구모형이 예를 들어, A모형, B모형, C모형을 쓴 것이 유효한 모형인가를 설명하는 것이다.
- Global F라고 하는데, 논문에서 보면, 여러개 변수 중에 최소한 하나는 유의한 변수라는 뜻이다. 이것을 먼저 테스트 해 보고 유의하면 테스트를 진행하는 것으로 이해하면 된다.
- 하지만 이것은 당연한 얘기라서 생략하는 경우도 있다.
메인분석을 설명한 이후에 보통 나오는 내용
- 첫째는 추가분석: main result에 대한 variation이다.
- 둘째는 민감도 분석: 결과를 도출했더니 변수 정의나 샘플이나 수행한 방법론 상의 어떤 조건들에 민감하게 반응하는가를 확인하는 절차이다. (예를 들어, 독립변수 조작적 정의에 대해 자본비용을 잉여자산의 대용으로 사용했다면, 다른 변수정의를 활용해 보자. 그래서 바뀌지 않다. 를 설명하는 것 즉, robust 하다는 것을 보여주는 수단이 나온다.)
'doctoral course > research methodology ' 카테고리의 다른 글
외부 데이터 및 설문항목 검색해서 활용하는 법 (0) | 2013.11.21 |
---|---|
내생성(endogeneity) 문제의 해결방법 (0) | 2013.06.22 |
통제변수, 다중공선성, 내생성 (0) | 2013.06.22 |
descriptive analysis에 대한 기본 개념 (0) | 2013.06.11 |
탐색요인분석 (1) - 강의 필기 (0) | 2013.06.01 |