하이브 박지원 대표 아니었어?...컨퍼런스콜 그 목소리 알고보니

김건우 기자 기사 입력 2024.02.27 13:42

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

수퍼톤 TTS 기술로 컨퍼런스콜 발표...음악·영화· 등 각종 콘텐츠 적용 기대

엔터테인먼트 기업 최초로 연매출 2조원 시대를 연 하이브가 음성합성(Text To Speech·TTS) 기술을 활용한 컨퍼런스콜을 진행해 주목받고 있다. 지난해 450억원을 투자해 인수한 인공지능(AI) 오디오 기업 수퍼톤과 본격적인 신사업 행보가 기대된다.

지난 26일 하이브는 국내 엔터 기업 최초로 연매출 2조원(연결 기준) 시대를 열었다고 발표했다. 발표자인 박지원 대표는 육성이 아니라 수퍼톤의 TTS 기술로 약 20여분간 2023년 재무 실적과 사업 현황 등을 설명했다.

진행자는 "오늘 실적 발표는 박지원 대표가 직접 말씀한 게 아니라 슈퍼톤의 AI 음성합성 기술인 TTS를 활용해 발표했다"고 전했다. 컨퍼런스콜 참여자들은 진행자의 발언 이후에야 지금까지 청취한 것이 박 대표의 육성이 아니라 AI가 만들어낸 목소리임을 인지하고 놀랐다는 후문이다.

컨퍼런스콜은 애널리스트와 국내외 주요 기관투자자들을 대상으로 경영현황과 미래전략 등을 발표하는 중요한 자리다. 이런 자리에서 TTS로 선보이는 것은 매우 이례적인 일이다. 이는 수퍼톤의 기술력이 뛰어나고 안정적인 서비스가 가능함을 투자자들에게 보여주기 위한 자신감이었다는 평가를 받고 있다. 이런 결정은 박지원 대표의 아이디어라는 후문이다.

수퍼톤은 하이브가 지난해 1월 450억원을 투자해 인수한 AI 오디오 기업이다. 수퍼톤은 다양한 방송프로그램을 통해 고(故) 김현식, 김광석, 터틀맨, 임윤택, 유재하 등의 음성을 AI 기술로 재현해 주목받았다. 또 디즈니플러스 오리지널 시리즈 '카지노'에서는 주인공 최민식의 젊은 시절 목소리를 구현해 몰입감 있는 장면을 연출했다.

수퍼톤 인수 당시 박 대표는 "극사실적인 연기와 가창을 가능케 하는 수퍼톤의 AI 음성 합성기술에 하이브의 제작 역량을 접목해 선보이게 될 콘텐츠에 대한 기대가 크다"고 밝힌 바 있다.

아티스트의 육성과 TTS 기술을 결합한 시도는 AI 스피커가 도입된 2018년부터 꾸준히 있었다. KT, SK텔레콤과 네이버 등이 AI 스피커에, 삼성전자는 AI 비서 서비스인 빅스비에 아티스트 목소리를 추가한 서비스를 선보였지만 큰 인기를 끌지 못했다. 이는 TTS 음성을 구현하기 위해서는 아티스트가 10시간 가까운 시간을 녹음해야 하는 번거로움이 컸고, 자연스러운 대화가 어려웠기 때문이다.

하지만 슈퍼톤은 녹음 시간을 획기적으로 줄이는데 성공했다. 컨퍼런스콜을 위해 박 대표는 슈퍼톤의 스튜디오에서 10여분간 목소리를 녹음했고, 이를 학습한 AI가 사전에 입력된 스크립트 텍스트를 읽었다.

하이브는 "투자자들에게 수퍼톤의 기술 수준을 선보일 좋은 기회라고 생각돼 이를 진행했다"며 "음성 합성기술의 가능성을 무한히 확장하는 수퍼톤의 향후 행보에 많은 관심을 부탁드린다"고 말했다.

업계는 하이브와 수퍼톤이 펼칠 신사업에 관심을 나타내고 있다. 입대로 방탄소년단의 활동이 중단된 상황에서 TTS 기술로 새로운 비즈니스를 개척하지 않겠냐는 것이다.

이교구 대표는 과거 하이브에 합류하면서 "AI 오디오 기술은 기획 단계에서부터 제작, 편집, 후처리, 배급, 유통 등 콘텐츠 제작의 모든 단계에 적용할 수 있다"고 밝혔다. 또 사업 가능 영역으로 음악, 영화, 애니메이션, 오디오북, 게임 등 다양한 콘텐츠에 활용될 수 있다고 제시했다.

방시혁 하이브 의장도 지난해 4월 미국 음악 전문지 빌보드와 인터뷰에서 슈퍼톤과 프로젝트를 진행 중이라고 설명한 바 있다. 방 의장은 "목소리 톤뿐만 아니라 억양도 완전히 복제할 수 있다"며 슈퍼톤의 기술력을 강조했다.

이 기사 어땠나요?

이 시각 많이 보는 기사