텍스트 마이닝(text mining)으로 한국은행 금융통화위원회 의사록을 분석한 결과 기준금리 변동에 대한 예측력이 높은 것으로 나타났다. 텍스트 마이닝은 대규모 텍스트 자료에서 육안으로 읽고 분석하기 힘든 정보를 추출하고 이를 분석하는 기법이다.
6일 한국은행이 발간한 BOK경제연구 '텍스트 마이닝을 활용한 금융통화위원회 의사록 분석' 보고서에 따르면 금통위 의사록에서 추출한 지수는 여타 변수에 비해 기준금리에 대한 설명력과 예측력이 높은 것으로 나타났다.
보고서는 텍스트 마이닝을 활용해 금통위 의사록에 담긴 어조를 추출해 지수로 편제하고 기준금리 변동에 대한 설명력과 예측력을 추정했다.
분석은 지난 2005년 5월부터 2017년 12월 중 신문기사 약 23만건과 채권 애널리스트 보고서, 금통위 의사록을 대상으로 형태소 조합 분석을 통해 감성사전을 구축하는 방식으로 이뤄졌다. 감성사전은 예를 들어 '금통위 금리인상'을 매파적 성격으로 규정하고 등장 여부나 횟수로 극성(polarity)을 규정한 사전이다.
분석 결과 금통위 의사록에서 텍스트 마이닝으로 추출한 지수는 기존에 활용되고 있는 EPU(Economic Policy Uncertainty) 또는 UI(Uncertainty Index)의 불확실성지수 등에 비해 기준금리에 대한 설명력과 예측력이 높은 것으로 나타났다. 경제정책 불확실성 지수는 한국, 미국, 중국, 일본, 러시아 등 세계 20개국에서 경제, 정책, 불확실성 등 세 가지 용어가 포함된 기사가 얼마나 자주 등장하느냐를 기준으로 측정한 지표다.
보고서는 "텍스트 마이닝이 금융시장에서 중앙은행 의도를 파악하는 도구로 활용될 수 있다"며 "중앙은행이 자체적으로 통화정책 관련 소통이 어떻게 이뤄지고 있는지 진단하는 도구로도 활용할 수 있다"고 설명했다.
이어 "텍스트 마이닝으로 중앙은행 커뮤니케이션을 지수화하면 해당 커뮤니케이션의 어조나 강도가 중앙은행이 의도하는 바와 일치하는지 여부를 점검할 수 있을 것"이라며 "금통위 전후 기사의 어조 변화를 통해 통화정책 충격을 측정하고 금융시장과 실물경기에 미치는 영향도 분석할 수 있다"고 말했다.