공공·기업용 시각 지능 AI 통합 솔루션 기업인 한국딥러닝은 시각 언어 모델(VLM) 기반 광학 문자 인식(OCR) 솔루션인 'DEEP OCR+(딥 오씨알 플러스)'를 출시했다고 10일 밝혔다.
DEEP OCR+는 종전 광학 문자 인식 기능을 넘어 문서의 의미와 구조를 자동으로 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 한국딥러닝이 지난 5년간 4억장 이상의 텍스트·이미지 문서를 학습시킨 VLM을 기반으로 개발됐다. 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리 가능해 초기 도입 부담이 적고, 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다.
기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 것이 주 목적이어서 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데 제약이 있었다. 특히 계약서나 청구서처럼 포맷이 일정하지 않은 경우 문서마다 추가 설계와 라벨링이 필요해 도입 및 유지 비용이 높았다.
DEEP OCR+는 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있어 비정형화된 문서도 즉시 처리 가능하다. 이미지와 텍스트를 동시에 처리하는 VLM 기술을 바탕으로, 사용자가 문서를 업로드하면 별도 학습 없이도 주요 정보를 구조화된 형태로 정리해준다.
예컨대 계약서를 입력하면 날짜·금액·주요 조항 등을 추출하고, 리스크가 될 수 있는 항목을 요약해 표시하는 식이다. 문서 검토·입력에 드는 시간이 줄며, 다양한 양식의 문서를 추가 커스터마이징 없이 처리할 수 있게 돼 업무 자동화 효율이 높아진다고 회사 측은 설명했다.
구축형 외에도 서비스형 소프트웨어(SaaS), 응용 프로그래밍 인터페이스(API) 형태로도 제공된다. 고객사는 자사 환경에 맞게 유연하게 적용할 수 있으며, 평균 도입 기간은 2주 내외다.
다국어가 혼합된 문서나 정형화되지 않은 양식인 경우에도 사용 가능하다. 한국어, 영어, 숫자, 특수문자가 혼합된 문서나 복잡한 표·문단 구조를 포함한 문서도 문제없이 처리할 수 있으며, 출력 포맷 역시 엑셀 등 다양한 형태로 지원돼 전사 자원 관리(ERP) 시스템과의 연동도 수월하다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성