'막귀→황금귀' 만드는 AI 오디오 기술자, IITP 우수 연구자 수상

최태범 기자 기사 입력 2022.09.22 17:04

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기
전상배 가우디오랩 최고과학책임자(CSO) /사진=김휘선 기자 hwijpg@
전상배 가우디오랩 최고과학책임자(CSO) /사진=김휘선 기자 hwijpg@
오디오 기술 전문기업 가우디오랩의 전상배 최고과학책임자(CSO)가 정보통신기획평가원(IITP)이 개최한 'IITP 우수과제·연구자 시상식 및 성과 교류회'에서 우수 연구자로 선정됐다.

26일 가우디오랩에 따르면 올해 첫 개최된 이번 교류회는 4차 산업혁명과 디지털 전환 등 급격한 변화와 발전 속에서도 ICT 연구개발(R&D) 원천 기술 확보를 위해 헌신한 연구자들을 격려하고 우수 성과 과제를 공유하기 위해 마련됐다.

전상배 CSO가 이끄는 가우디오랩 AI 그룹은 '스트리밍 미디어 서비스를 위한 오디오 AI 기술 개발'을 연구해 고성능 AI 음원 분리기술 GSEP(Gaudio Source SEParation)을 만들었다.

GSEP의 파생 기술로 △GTS(Gaudio Text Synchronization) △GCV(Gaudio Clear Voice) △GSing 등을 상품화했다. 2년 미만의 짧은 수행 기간에도 불구하고 5건의 사업 계약을 체결하며 시장성을 증명했다.

전 CSO는 "학계에서 사용하는 분리도 지표인 SDR(Signal to Distortion Ratio)을 세계 대형 경쟁사들과 비교하면 GSEP은 가장 높은 8.03dB의 성능을 보였다"며 "압도적인 분리력, 현저히 적은 연산량, 월등한 음질 등 3가지 강점을 갖고 있다"고 했다.

이어 "연산량이 적어 일반적인 GPU 환경에서 노래 한 곡의 목소리를 추출하는데 1.5초 정도면 충분하다. 이는 경쟁 기술 대비 2~16배 빠른 수준"이라며 "빠른 속도에도 국제 표준음질 평가기법에서 확연히 좋은 음질로 확인됐다"고 덧붙였다.

GTS는 노래와 가사를 자동으로 동기화해 실시간 가사보기 기능을 제공하는 솔루션이다. 현재 벅스에서 상용화됐다. 그동안 음원의 싱크 가사는 인력이 직접 투입돼 매 곡마다 일일이 음원 시점과 가사를 맞춰가며 작업해야했다.

하루에 발매되는 음반 수가 수만 장, 트랙 수는 수십만 곡에 이르는 음원시장에서 수작업으로 모든 곡에 싱크 가사를 생성하는 것은 불가능에 가깝다. 하지만 GTS를 사용하면 서버 1대로 1곡당 5초, 하루 약 7만 곡을 처리할 수 있다.

전 CSO는 "글로벌 콘텐츠 시장에서 음성과 자막, 노래와 가사의 빠르고 정확한 동기화로 언어의 제약을 없애는 것은 서비스의 필수 요소"라며 "가우디오랩의 AI 오디오 기술로 고객들에게 더 나은 소리 경험을 제공하겠다"고 말했다.

가우디오랩  
  • 사업분야엔터∙라이프스타일, IT∙정보통신
  • 활용기술메타버스, 인공지능
  • 업력***
  • 투자단계***
  • 대표상품***


[머니투데이 미디어 액셀러레이팅 플랫폼 '유니콘팩토리']

'가우디오랩' 기업 주요 기사

이 기사 어땠나요?

이 시각 많이 보는 기사