금융위, 금융 특화 한글 말뭉치 제공…은행AI 최신 법률도 신속 반영
앞으로는 은행 등 금융기관의 인공지능(AI) 서비스가 보다 전문화될 전망이다. 금융위원회는 오는 31일부터 금융 특화 한글 말뭉치를 제공한다고 30일 밝혔다. 금융 특화 한글 말뭉치는 금융 분야의 다양한 전문 지식을 AI 모델이 가공·처리·분석할 수 있는 형태로 모은 대규모 한국어 언어자료로, 국내 금융권에 특화된 AI 서비스를 개발하기 위해서는 필수적인 요소이다. 지금까지 금융회사들은 해외에서 일반 사용자들을 위해 개발된 상용 AI와 오픈소스 AI를 활용해 챗봇, 뉴스 요약, 번역 등 일반화된 서비스를 제공했다. 그러나 한국어로 된 금융 용어, 우리나라 금융 법규 등의 데이터는 부족해 금융에 특화된 업무를 AI로 활용하기 어려웠다. 이에 따라 금융위는 AI모델이 금융 전문 지식을 습득할 수 있도록 학습용 말뭉치를 지원한다. 학습용 말뭉치는 금융감독원, 은행연합회, 금융연수원 등의 금융 용어 사전과 금융 일반지식 자료를 활용한다 추가 학습용 말뭉치는 국내 금융정책·제도 설명자료, 금융 법규·가이드라인과 보험연수원의 기초 연수자료를 더했다. 또 AI모델이 외부의 최신 정보와 전문 데이터를 참조해 정확한 답변을 도출할 수 있도록 검색증강생성(RAG)용 말뭉치를 지원한다. 금융권에 활용되는 AI가 변경된 제도나 법규를 반영할 수 있도록 금융소비자보호법과 관련 자료, 전자금융거래법 등의 조문을 활용했다. 아울러 생성형 AI가 허구의 정보를 생성하거나 편향된 답을 내지 않도록 평가 지원용 말뭉치를 지원한다. 예컨대 평가 지원용 말뭉치는 질문에 대한 답을 내리면 편견 여부를 확인할 수 있다. 이번에 제공하는 금융 공통 분야 말뭉치는 총 1만2600건, 약 45기가바이트(GB) 이상 규모이며 ▲사전 학습용 6700건 ▲추가 학습(Fine-tuning)용 1100건 ▲검색증강생성(RAG)용 3800건 ▲평가 지원용 1000건으로 구성한다. 금융 공통 분야 말뭉치 이용을 희망하는 금융회사는 금융결제원 데이터 공유 플랫폼을 통해 신청하고 말뭉치를 다운로드 받을 수 있다. 시범 사업 기간은 오는 6월말까지 이며, 무료로 제공한다. 금융위 관계자는 "이번 시범 사업 과정에서 제기되는 금융회사의 추가 수요와 의견을 반영해 하반기에는 금융 공통 분야 말뭉치의 유형과 규모를 확대할 계획"이라며 "내년부터는 금융 업권별로 특화 말뭉치를 지원할 수 있도록 데이터 보유기관, 유관기관과 지속적으로 협의해 나가겠다"고 말했다. /나유리기자 yul115@metroseoul.co.kr