[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] 시각지능 AI(인공지능) 솔루션을 개발하는 한국딥러닝이 비전언어모델(VLM) 기반 광학문자인식(OCR) 솔루션 'DEEP OCR+'를 출시했다고 11일 밝혔다. 이 솔루션은 기존 OCR의 문자 인식 기능을 넘어 문서의 의미와 구조를 자동 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 지난 5년간 4억장 이상의 텍스트·이미지 문서를 학습한 자체 VLM 모델을 기반으로 개발됐다. 한국딥러닝 관계자는 "기업들은 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리할 수 있다. 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다"고 했다. 기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 데 그쳐 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데 한계가 있었다. 계약서나 청구서처럼 포맷이 일정하지 않은(비정형) 문서의 경우 문서마다 별도 설계
최태범 기자 2025.04.11 19:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] 공공·기업용 시각지능 AI(인공지능) 통합 솔루션 기업 한국딥러닝이 과학기술정보통신부가 주관하는 '2024년 초거대 AI 데이터 구축사업'의 일환인 '인체 및 객체 3D 데이터 구축' 사업 수행기관으로 선정됐다고 26일 밝혔다. 이에 따라 한국딥러닝은 약 1000시간에 해당하는 24만건의 발화 동영상 및 음성 데이터, 2만4000건의 표정·포즈 모션 데이터, 72만건의 표정·포즈 3D 스캐닝 데이터를 구축하게 된다. 그밖에 오디오 스크립트 및 음성 해설 등 데이터셋, 실생활 속 중대형 객체의 2D이미지 및 3D 데이터 관련 데이터셋 등도 구축하게 된다. 구축된 데이터의 품질 검증을 위한 3D 얼굴 및 포즈 생성 모델과 3D 객체 생성 모델도 개발한다. 2D 이미지를 활용해 3D 객체를 생성하고, 3D 스캐닝 데이터에 대한 오류를 보정해주는 AI 모델이다. 김지현
고석용 기자 2024.11.26 20:30:00