"한국 비즈니스 특화된 AI 언어모델"…크라우드웍스, 웍스원 개발

최태범 기자 기사 입력 2024.04.26 07:00

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
[스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

인공지능(AI) 학습 데이터 플랫폼 기업 크라우드웍스 (29,550원 ▼750 -2.48%)가 기업의 비즈니스 환경에 특화된 소형 언어모델(SLM) '웍스원(WorksOne)'을 개발했다고 25일 밝혔다.

웍스원은 한국의 비즈니스 환경에 최적화된 모델이다. 기존 거대언어모델(LLM)은 영어 중심으로 학습돼 한국어 및 한국의 비즈니스 용어를 원활히 이해하지 못하고 이로 인해 취약점이 자주 발생한다는 판단이다.

크라우드웍스 관계자는 "웍스원은 70억 매개변수를 가진 오픈소스 모델과 1만개의 고품질 데이터셋으로 구현됐으며, 기업에서 선호하는 비즈니스 친화적인 답변을 제공한다"고 강조했다.

크라우드웍스는 비즈니스 맞춤형 데이터셋을 직접 구축해 모델을 최적화했다. 비즈니스 맞춤형 데이터셋은 금융, 유통, 공공기관 등 기업별 데이터 특징을 분석해 비즈니스 특화 용어, 문체, 보고 유형 등을 분석해 만들었다는 설명이다.

특히 고품질 데이터셋을 구축하기 위해 60만 데이터 작업자 풀을 기반으로 전문 역량을 가진 고급 데이터 작업자를 선발하고 비즈니스 언어 활용과 표현력, 문서 구조화 능력 등 자체 검증을 실시했다.

검증에 통과한 평균 경력 15년 이상의 대기업 기획 업무 경험을 가진 전문가들이 데이터셋 구축에 참여해 고품질 데이터를 직접 완성했다.

웍스원은 기업 내부 시스템과 연동도 원활하다. 사내 시스템과 쉽게 통합하고 확장하는 것이 용이해 시스템 간 데이터 교환과 상호운용성을 향상시킬 수 있다는 얘기다.

이형주 크라우드웍스 최고기술책임자(CTO)는 "웍스원은 전문가가 직접 만든 한국어 데이터로 학습시킨 비즈니스 특화 모델"이라며 "고품질 데이터로 학습한 모델은 현재 유일하다. AI 데이터부터 LLM까지 기업 혁신에 필요한 모든 것을 제공하겠다"고 말했다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'크라우드웍스' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사