소버린AI, '내수용' 꼬리표 떼려면…"데이터 풀고 글로벌화 필요"

고석용 기자, 남미래 기자 기사 입력 2025.07.21 17:23

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

[MT리포트-닻 올린 AI 국가대표 선발전] ④

[편집자주] 한국형 '소버린AI'의 방향을 가늠할 AI 개발 프로젝트 '독자 AI 파운데이션 모델' 사업이 첫 발을 뗐다. 대기업부터 스타트업, 학계와 연구계가 몰려든 가운데 누가 소버린AI 시대를 이끌 '국가대표 AI 기업'이 될지를 두고 시선이 쏠린다.
AI사업 운영상 느끼는 애로사항/그래픽=이지혜
AI사업 운영상 느끼는 애로사항/그래픽=이지혜
정부의 소버린 AI(인공지능) 구축 지원 사업이 시작되면서 업계 안팎에선 기대와 우려가 동시에 제기된다. 국내 AI 모델이 경쟁력을 갖출 기회이지만 이렇게 만들어진 AI 모델이 '내수용'에 그치지 않고 글로벌 시장에서도 경쟁력을 갖추려면 넘어야 할 산도 많다는 지적이다.

21일 과학기술정보통신부에 따르면 이번 '독자 AI 파운데이션 모델 프로젝트'의 지원 분야는 GPU(그래픽처리장치) △데이터 △인재 등 3가지다. 기업이 필요한 1~3가지를 선택해 지원받을 수 있도록 했다. 통상 거론되는 AI 모델 개발을 위해 필요한 3대 자원을 모두 포함시켰다는 평가다.

다만 이번에 지원받는 독자 AI 모델이 글로벌 경쟁력을 갖추기 위해선 제도 개선 등 추가 지원이 필요하단 지적이 나온다. 특히 업계는 데이터 분야의 지원 확대를 강조한다. 정부가 이번 사업에서 저작물 데이터 공동구매 등으로 기업을 지원해주고 있지만 고품질 데이터를 확보할 수 있도록 지원해주지 않고선 근본적으로 경쟁력을 강화하기 어렵다는 지적이다.

실제 소프트웨어정책연구소의 '2024년 인공지능산업 실태조사'에 따르면 AI 기업의 애로사항에 대한 5점 척도에서 '데이터 확보 및 품질 문제'는 3.59점으로, 투자유치(4.21)나 사업 불확실성(3.77) 같은 경영 부문을 제외하면 가장 큰 애로사항으로 꼽혔다.

반면 중국과 미국의 빅테크 기업들은 데이터 확보에 거침이 없다. 최근 미국에서는 메타와 앤트로픽이 수백만권의 책을 저작권자와 합의 없이 AI에 학습한 사실이 드러났지만, 재판부에서 무죄 판결을 받기도 했다. AI 학습이 '공정 이용'에 해당해 경우에 따라서 저작권에 우선할 수 있다는 판결이다.
AI사업 운영 상 느끼는 애로사항 중 '데이터 확보 및 품질 문제'에 동의한다/그래픽=이지혜
AI사업 운영 상 느끼는 애로사항 중 '데이터 확보 및 품질 문제'에 동의한다/그래픽=이지혜
한 AI 스타트업 대표는 "미·중처럼 AI 학습을 최우선시하는 게 무조건 옳다곤 할 수 없지만 그 덕에 AI 모델이 빠르게 고도화된 것은 사실"이라며 "정부가 데이터를 어디까지 어떻게 수집할 수 있는지 사회적 합의를 마련해줘야 한다"고 말했다.

개발된 AI 모델이 단순히 '한국어 잘하는 챗GPT'에서 그치지 않기 위해선 글로벌 경쟁력을 갖추기 위한 고민을 병행해야 한다는 지적도 있다. 한 벤처캐피탈 심사역은 "오픈AI의 GPT가 강력한 것은 미국에서 만들어져서가 아니라 전 세계 사용자들이 사용하며 피드백을 줬기 때문"이라며 "독자 AI 모델도 민간 생태계와 글로벌 피드백을 받을 수 있는 구조를 고민해야 한다"고 했다.

이번 사업에 참여한 AI 기업 대표도 "독자 AI 모델 구축 기업들이 내수용에 그치지 않고 일본이나 동남아시아 등에서 미·중의 AI 모델보다 경쟁력이 있는 AI 모델이 될 수 있도록 고도화하는 방안을 고민해야 한다"며 "정부도 이를 세일즈할 수 있는 방법 등을 함께 모색해야 할 것"이라고 말했다.

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

'소버린AI' 기업 주요 기사

이 기사 어땠나요?

이 시각 많이 보는 기사