스타트업

한국딥러닝, VLM 기반 OCR 솔루션 ‘DEEP OCR+’ 론칭

공공·기업용 시각지능 AI 통합 솔루션 기업 한국딥러닝이 VLM 기반 OCR 솔루션인 ‘DEEP OCR+’을 출시했다.

DEEP OCR+은 기존 광학문자인식(OCR)의 기능을 넘어, 문서의 의미와 구조를 자동으로 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 한국딥러닝이 지난 5년간 4억 장 이상의 텍스트·이미지 문서를 학습한 VLM(Vision-Language Model) 모델을 기반으로 개발됐다. 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리할 수 있어 초기 도입 부담이 거의 없다. 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다.

기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 데 중점을 뒀다. 하지만 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데는 제약이 있었다. 특히 계약서나 청구서처럼 포맷이 일정하지 않은 문서의 경우, 문서마다 별도 설계와 라벨링이 필요해 도입 및 유지 비용이 높았다.

DEEP OCR+는 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있어 비정형화된 문서도 즉시 처리 가능하다. 이미지와 텍스트를 동시에 처리할 수 있는 VLM 기술을 바탕으로, 사용자가 문서를 업로드하면 별도 학습 없이도 주요 정보를 구조화된 형태로 정리해준다. 일례로 계약서를 입력하면 날짜, 금액, 주요 조항 등을 추출하고, 리스크가 될 수 있는 항목을 요약해 표시하는 식이다. 이를 통해 문서 검토 및 입력에 소요되는 시간을 줄일 수 있으며, 다양한 양식의 문서를 별도 커스터마이징 없이 처리할 수 있기 때문에 업무 자동화에 실질적인 기여가 가능하다.

구축형 외에도 SaaS 및 API 형태로도 제공된다. 고객사는 자사 환경에 맞게 유연하게 도입할 수 있으며, 평균 도입 기간은 2주 내외다. 기존 OCR 솔루션의 경우 수억 원 규모의 프로젝트와 수개월의 개발 기간이 필요했던 것과 비교하면, 비용과 시간 측면에서의 진입 장벽을 낮췄다.

다국어가 혼합된 문서나, 정형화되지 않은 양식에도 대응할 수 있다. 한국어, 영어, 숫자, 특수문자가 혼합된 문서나 복잡한 표·문단 구조를 포함한 문서도 문제없이 처리 가능하며, 출력 포맷 역시 JSON, Excel 등 다양한 형태로 지원돼 RPA나 ERP 시스템과의 연동도 수월하다.

한국딥러닝 김지현 대표는 “DEEP OCR+은 금융, 법률, 공공 등 다양한 분야에서 도입 가능성이 검토되고 있으며, 일부 대형 프로젝트에서는 이미 시범 적용이 진행 중이다”며, “최근 단순한 인식 기술을 넘어 문서 내 의미와 맥락까지 파악할 수 있는 AI 기술에 대한 관심이 함께 높아지고 있다. 이번 신제품은 이러한 흐름 속에서 문서 처리 기술의 진화를 보여주는 사례가 될 것”이라고 설명했다.

새롭게 등장하고 변화하는 스타트업 비즈니스의 현장을 생생하게 전달합니다.

댓글

Leave a Comment


관련 기사

이벤트

[현장] 학생창업기업 발굴 이벤트 ‘Y.E.S. 데모데이’ 우승팀은 ‘한국딥러닝’