지난 회차에서 저희는 2가지 데이터 검사 방법을 배웠습니다. cross-sectional dependence test, unit root test 였답니다.
그래서 데이터에 CSD가 있을 경우를 가정하여 Panel unit root test를 진행했고, 이때 데이터가 유효한 데이터와 아닌 데이터로 나뉘게 되는데요.
[Diagnostic Test] About Panel unit root test (CADF, CIPS)
그럼 유효하지 않은 데이터는 버려야 할까요?
이 유효하지 않은 데이터 사이에 어떠한 관계가 있다면 회귀분석에 사용할 수 있답니다!
그래서 cointegration test를 통해 관계성을 확인하는 과정을 거치게 됩니다.
자세히 알아보도록 하죠.
▶️ Cointegration test 란?
1. Cointegration(공적분)이란?
비정상(단위근 有)인 시계열 변수들이 특정 조합을 만들면 장기적으로 안정적인 관계를 가지게 되어, 회귀분석 할 수 있는 현상을 말합니다.
2. Cointegration test의 목적
그래서 앞서 간략히 말씀드렸듯이, Panel Unit Root test에서 정상성이 있는 데이터는 바로 회귀분석이 가능하지만, 비정상 데이터(단위근이 존재하는 데이터)는 회귀분석 시 spurious regression의 리스크를 가지고 있기 때문에, 단위근이 있는 데이터끼리 묶어 공적분 관계가 있는지를 한 번 더 규명해본답니다. 이때, 공적분 관계가 있다면 장기 분석이 가능해지므로 회귀가 가능하게 됩니다.
이를 Cointegration test를 통해서 확인할 수 있답니다.
▶️ Panel Cointegration test process
1. 변수의 단위근 검정
Panel Unit Root test의 CADF, CIPS 등의 검사결과를 바탕으로 정상성 변수와 비정상(단위근이 있는) 변수를 구분하여, 비정상 변수를 공적분 후보로 선정합니다.
2. 장기 관계식(cointegration regression) 추정
두 개의 변수가 장기적으로 같은 방향으로 움직이는지를 확인합니다.

여기서 가장 중요하게 봐야할 것은 e(잔차) 변수입니다.
이 변수가 두 개의 변수 사이의 간격을 나타내거든요.
3. 잔차 추출 및 단위근 재검정

해당 공식을 통해 잔차를 산출하고, 이 잔차에 대해 또다시 단위근 검정(unit root test)를 수행합니다.
여기서 단위근이 없다면, 잔차가 안정적이라는 것이고 최종적으로 공적분 관계가 있음을 알 수 있습니다.
하지만 여기서도 단위근이 발생한다면, 잔차가 불안정함으로 공적분 관계가 없다고 판단됩니다.
4. p-value 판단
마지막으로 p-value를 통해서 해당 결과가 우연으로 발생했는지 안했는지를 점검해줘야 합니다.
p값이 5% 초과라면, 공적분 관계 있음이 유의미하다는 것이고, 이상이라면 공적분 관계가 없다는 것으로 판단할 수 있습니다.
▶️ Panel Cointegration test 방법론

CSD가 없을 경우 Pedroni, Kao가 가능하고, CSD가 있을 경우에는 Westerlund를 권장합니다. 현실 데이터는 대부분 여기에 해당합니다. 변수가 많은 경우에는 Johnsen Fisher Panel을 사용하고, 단순한 경우 Kao를 많이 사용한답니다.