국회 법규 데이터셋 고도화…무하유 "공공 데이터셋 분야 진출"

최태범 기자 기사 입력 2024.02.15 20:30

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

인공지능(AI) 표절검사 서비스 '카피킬러'를 운영하는 무하유가 국회도서관과 진행한 융복합서비스 데이터셋 구축 사업을 완료했다고 15일 밝혔다.

무하유는 이번 사업을 통해 국회도서관에서 제공하는 AI 의정분석 서비스 '아르고스'에 법률 관련 질의응답(Q&A) 데이터셋을 구축했다. 이를 바탕으로 이용자는 국회나 공공 관련 법규의 질의 사항에 대한 답변을 대화형 문답 방식으로 간편히 얻을 수 있다.

무하유 관계자는 "법률 지식을 보유한 전문가들로 데이터셋 구축인력을 꾸렸다"며 "법률 관련 이슈와 제개정일·의안·회의록·주요 사건, 인물에 대한 정보는 물론 통계표 제목과 매칭 키워드 등 광범위한 영역을 포함하는 고품질 데이터셋을 구축했다"고 말했다.

표와 이미지 데이터 구축은 표절검사 서비스에 적용된 이미지 인식 기술을 활용해 자동으로 해당 데이터를 추출한 후 품질 검수를 실시하는 식으로 진행했다.

일반적인 데이터 구축·라벨링의 경우 납품까지의 역할을 업체가 수행해 저작권 문제나 품질 관리 문제가 불거질 수 있는 반면, 무하유는 납품 이후 실제 데이터셋 활용 영역까지 고려해 이 같은 잠재적 문제를 해소할 수 있다는 설명이다.

신동호 무하유 대표는 "기술로 공정을 효율화하고 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다"며 "검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 속도를 내겠다"고 했다.

무하유  
  • 사업분야IT∙정보통신
  • 활용기술인공지능, 빅데이터
  • 업력***
  • 투자단계***
  • 대표상품***


[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

'무하유' 기업 주요 기사

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사