24개 언어 이해하는 '천재' 있다? 그 주인공 정체는 바로…

김인한 기자 기사 입력 2022.11.03 11:23

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

한국전자통신연구원(ETRI) '대화형 인공지능' 개발
평창동계올림픽선 '자동통역 기술' 제공한 연구기관

한국전자통신연구원(ETRI)이 세계 주요 24개 언어를 인식할 수 있는 인공지능(AI) 기술을 개발했다. / 사진=게티이미지뱅크
한국전자통신연구원(ETRI)이 세계 주요 24개 언어를 인식할 수 있는 인공지능(AI) 기술을 개발했다. / 사진=게티이미지뱅크

국내 연구진이 한국어를 포함한 세계 주요 24개 언어를 인식할 수 있는 '음성인식 인공지능(AI)' 기술을 개발했다. 특히 기술 성능은 구글 등 글로벌 기업과 비교해 한국어는 우위를 나타냈고, 타 언어에선 대등한 수준이다.

한국전자통신연구원(ETRI)은 24개 언어를 음성으로 인식, 문자로 변환할 수 있는 대화형 AI 기술을 개발했다고 밝혔다. ETRI는 2018년 평창 동계올림픽 공식 자동통역 서비스에 핵심 원천기술을 제공한 연구기관이다.

기존 음성인식 기술을 개발하기 위해선 대규모 학습데이터가 필요해 다국어 확장과 음성인식 성능 확보가 쉽지 않았다. 또 기존에 흔히 활용되던 종단형(End-to-End) 음성인식 기술은 AI 학습에 따라 응답속도가 느리고 특정 분야에 적용하기 어려운 한계가 있었다.

이에 ETRI 연구팀은 △자기 지도학습 △의사 레이블(AI 학습 기술) 적용 △대용량 다국어 사전 학습 모델 △음성 데이터의 오디오 데이터 생성(TTS) 증강 기술 등을 통해 언어 확장의 어려움을 해결했다.

ETRI는 종단형 음성인식 기술의 느린 응답속도는 추론 기술을 개발해 실시간 처리가 가능하도록 개선했다. 의료와 법률, 과학기술 등 전문 분야에 대한 음성인식 특화가 쉽도록 기술을 만들었다.

한국전자통신연구원(ETRI)이 개발한 종단형 음성인식 기술 성능. / 사진=한국전자통신연구원(ETRI)
한국전자통신연구원(ETRI)이 개발한 종단형 음성인식 기술 성능. / 사진=한국전자통신연구원(ETRI)

ETRI는 기술 검증 결과 한국어에선 구글보다 우위를 나타냈고, 나머지 언어에선 대등한 결과가 나타났다고 밝혔다. 연구팀은 다국어 확대와 응답 속도 지연 해결 등 신기술을 적용한 음성인식 기술을 사업화할 예정이다. ETRI는 2020년 종단형 음성인식 기술 개발 후 국내외 30여개 기업에 음성인식 기술을 이전했다.

김상훈 ETRI 복합지능연구실 박사는 "국내 기술만으로 글로벌 선도기업과 대등한 수준의 음성인식 기술을 개발했다"며 "이 기술이 우리나라 AI 분야의 글로벌 경쟁력 강화와 기술 자주권을 확보하는 계기가 되길 바란다"고 말했다.

ETRI는 현재 AI 오픈 포털(aiopen.etri.re.kr)을 통해 제공하는 음성인식 서비스를 11개에서 24개로 확대한다. 이를 통해 기업 개발자는 물론 대학·연구소·중소기업 등에 관련 기술을 공유할 예정이다.

음성인식 기술개발 과정. / 사진제공=한국전자통신연구원(ETRI)
음성인식 기술개발 과정. / 사진제공=한국전자통신연구원(ETRI)
  • 기자 사진 김인한 기자

이 기사 어땠나요?

이 시각 많이 보는 기사