음원서 싱크가사 뽑아내는 국산 AI 기술, 세계 첫 상용화

최태범 기자 기사 입력 2022.09.22 17:02

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
오디오 기술 기업인 가우디오랩이 인공지능(AI)을 활용해 가사와 음원을 자동으로 동기화하며 실시간 가사보기 기능을 제공하는 솔루션 'GTS(Gaudio Text Sync)'를 출시했다고 27일 밝혔다.

GTS는 국내외 유일하게 상용화된 AI 기반 가사 동기화 솔루션이다. 가우디오랩은 GTS를 국내 대표 음원 스트리밍 서비스 중 하나인 벅스를 통해 상용화했다.

그동안 음원의 가사는 '타임 코더'라 불리는 인력이 직접 투입돼 매 곡마다 일일이 음원의 시점(Time sync)과 가사를 맞춰가며 작업했다.

하루에 새롭게 발매되는 음반의 수가 수만 장, 트랙 수로는 수십만 곡에 이르는 음원시장에서 수작업으로 모든 곡에 싱크 가사를 생성하는 것은 사실상 불가능하다.

GTS 솔루션은 싱크된 가사를 빠르고 정확하게 생성해 서비스할 수 있다. GTS 엔진이 장착된 서버 1대면 1곡당 5초, 하루 약 7만 곡을 처리할 수 있다.

현재 음원 스트리밍 서비스사가 보유한 곡은 각 사 별로 약 4000만에서 7000만곡 정도로 추산된다. 실시간 가사가 제공되는 곡은 수십만 곡에 그친다. 실시간 가사 입력을 위해 소요되는 수작업 인력과 시간 비용 문제 때문이다.

하지만 가우디오랩의 GTS 솔루션 상용화를 통해 음원 서비스사가 제공하는 사실상 모든 곡에 대해 실시간 가사 보기가 가능해졌다. 특히 음원뿐만 아니라 영화 자막 생성 등에도 활용할 수 있어 확장성이 넓다는 평가다.

전상배 가우디오랩 최고과학책임자(CSO)는 "음원 스트리밍 서비스를 이용할 때 동기화에 오류가 있는 가사를 제공하거나 싱크 가사가 아닌 일반 가사를 제공하는 경우가 많다"며 "GTS를 통해 빠르고 정확하게 싱크 가사를 제공할 수 있다"고 했다.

가우디오랩  
  • 사업분야엔터∙라이프스타일, IT∙정보통신
  • 활용기술메타버스, 인공지능
  • 업력***
  • 투자단계***
  • 대표상품***


이어 "잘못된 가사의 오류를 검출하는 기능을 탑재해 가사의 품질 관리도 가능하다"며 "한국어, 영어, 중국어 등 다양한 언어를 지원하는 만큼 전 세계 음원 서비스에 적용돼 사용자들의 음악을 듣는 경험을 더욱 향상시킬 수 있을 것"이라고 덧붙였다.

'가우디오랩' 기업 주요 기사

이 기사 어땠나요?

이 시각 많이 보는 기사