혼성 듀엣곡인데 男보컬 어디에?...AI가 만들고, AI가 불렀다

박기영 기자 기사 입력 2025.05.14 13:46

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

하이브 자회사 수퍼톤, AWS서밋서 'AI보이스' 선봬

AWS서밋에서 여성 보컬이 노래를 부르고 있다./사진=박기영 기자
AWS서밋에서 여성 보컬이 노래를 부르고 있다./사진=박기영 기자
AI(인공지능)가 만든 남녀 혼성 듀엣곡을 사람과 AI가 한 무대에서 불렀다.

하이브 (275,000원 ▲8,000 +3.00%) 자회사 수퍼톤이 14일 아마존웹서비스(AWS)가 추최한 'AWS서밋'에서 일반인과 듀엣곡을 부르는 'AI보이스'를 선보였다. 듀엣무대는 기조연설 직전 수분간 진행됐으며 AWS서밋 행사 중 가장 첫 무대였다. 이 무대에는 여성 보컬이 6명의 백댄서와 함께 올라 AI가 작사·작곡한 '컨트롤 유'(Ctrl+U)를 열창했다.

이 곡의 남성 파트는 수퍼톤의 가창 합성 기술(Singing Voice Synthesis)로 만들어낸 AI보이스가 맡았다. 여성보컬은 AWS와 딩고뮤직이 기획한 'AI 뮤직 챌린지'를 통해 선정한 일반인이다.

눈길이 가는 점은 AI가 사람과 주고받는 듯한 방식으로 듀엣곡을 소화했다는 점이다. AI보이스 특유의 부자연스러움도 거의 없어 마치 두 사람이 듀엣곡을 부르는 것처럼 느껴졌다. 이번 무대는 수퍼톤이 AWS·포자랩스와 준비한 'AI 음악 프로젝트'의 결과다. 포자랩스는 AI를 통한 작사·작곡을 맡았다.

수퍼톤은 지난 2월 글자를 원하는 음성으로 바꿔주는 '수퍼톤 플레이'를 출시해 약 3개월만에 20만명의 사용자를 모은 스타트업이다. 수퍼톤 플레이는 원하는 케릭터의 목소리를 뉘앙스와 버릇까지 재현하는 것이 특징이다.

수퍼톤 관계자는 "AWS 행사의 안내방송도 수퍼톤 플레이를 활용한 것"이라며 "자연스러운 발성과 텍스트를 입력하면 1초안에 소리가 재생되는 빠른 인식 속도가 강점"이라고 설명했다.
수퍼톤 부스에 '수퍼톤 플레이'를 경험하려는 참가자들이 몰려있다. /사진=박기영 기자
수퍼톤 부스에 '수퍼톤 플레이'를 경험하려는 참가자들이 몰려있다. /사진=박기영 기자
수퍼톤 부스에서는 수퍼톤 플레이를 직접 경험할 수 있는 체험장도 마련됐다. 마이크에 대고 10초 가량 글을 읽으면 AI가 이를 분석해 같은 목소리로 원하는 전혀 다른 대사를 재생하는 방식이다. 한국어뿐만 아니라 영어와 일본어로도 재생이 가능했다. 자신의 목소리를 입력하기 싫다면 200여종의 기존 목소리 중에 고를 수도 있다.

행사 부스는 엘스컬레이터 바로 옆에 위치에 유동인구가 많고 주변 소음도 심했지만 소음제거 기술을 통해 원하는 소리만 인식 시킬 수 있었다. 인식한 음성은 발음기호로 변형돼 빠른 인식이 가능하도록 했다는 설명이다.

아울러 수퍼톤 플레이의 일부 기능과 대화형 AI 서비스가 애플리케이션 프로그래밍 인터페이스(API) 형태로 통합한 '캐릭터 챗'을 데모 버전도 처음으로 선보였다.

수퍼톤 관계자는 "다른 TTS(글자 음성 변환) 서비스와 다른 점은 음원에서 목소리만 가져오는 것이 아니라 언어학적인 정보와 발음 습관 등을 모두 고려한다는 것"이라며 "워터마크 기술을 적용했기 때문에 AI로 만든 목소리인지 실제 목소리인지 구분도 가능하다"고 말했다.

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

'수퍼톤' 기업 주요 기사

이 기사 어땠나요?

이 시각 많이 보는 기사