메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

한국딥러닝, VLM 기반 OCR 솔루션 출시...표·조항 등도 쉽게 인식

한국딥러닝이 'DEEP OCR+'를 출시했다./ 한국딥러닝

공공·기업용 시각 지능 AI 통합 솔루션 기업인 한국딥러닝은 시각 언어 모델(VLM) 기반 광학 문자 인식(OCR) 솔루션인 'DEEP OCR+(딥 오씨알 플러스)'를 출시했다고 10일 밝혔다.

 

DEEP OCR+는 종전 광학 문자 인식 기능을 넘어 문서의 의미와 구조를 자동으로 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 한국딥러닝이 지난 5년간 4억장 이상의 텍스트·이미지 문서를 학습시킨 VLM을 기반으로 개발됐다. 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리 가능해 초기 도입 부담이 적고, 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다.

 

기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 것이 주 목적이어서 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데 제약이 있었다. 특히 계약서나 청구서처럼 포맷이 일정하지 않은 경우 문서마다 추가 설계와 라벨링이 필요해 도입 및 유지 비용이 높았다.

 

DEEP OCR+는 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있어 비정형화된 문서도 즉시 처리 가능하다. 이미지와 텍스트를 동시에 처리하는 VLM 기술을 바탕으로, 사용자가 문서를 업로드하면 별도 학습 없이도 주요 정보를 구조화된 형태로 정리해준다.

 

예컨대 계약서를 입력하면 날짜·금액·주요 조항 등을 추출하고, 리스크가 될 수 있는 항목을 요약해 표시하는 식이다. 문서 검토·입력에 드는 시간이 줄며, 다양한 양식의 문서를 추가 커스터마이징 없이 처리할 수 있게 돼 업무 자동화 효율이 높아진다고 회사 측은 설명했다.

 

구축형 외에도 서비스형 소프트웨어(SaaS), 응용 프로그래밍 인터페이스(API) 형태로도 제공된다. 고객사는 자사 환경에 맞게 유연하게 적용할 수 있으며, 평균 도입 기간은 2주 내외다.

 

다국어가 혼합된 문서나 정형화되지 않은 양식인 경우에도 사용 가능하다. 한국어, 영어, 숫자, 특수문자가 혼합된 문서나 복잡한 표·문단 구조를 포함한 문서도 문제없이 처리할 수 있으며, 출력 포맷 역시 엑셀 등 다양한 형태로 지원돼 전사 자원 관리(ERP) 시스템과의 연동도 수월하다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr