국어 1등은 SKT, 수학 1등은 LG...국대 AI 선발전 성적표

윤지혜 기자 기사 입력 2026.01.13 08:45

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

[국대 AI 톺아보기] ①LG AI연구원 '우등생'…SKT '한국어'·업스테이지 '효율성' 강점

[편집자주] 대한민국의 'AI 3대 강국' 도약을 견인할 독자 AI 파운데이션 모델 프로젝트가 첫 평가전에 돌입한다. 정부의 GPU·데이터 투자와 민간의 기술력이 결합돼 약 4개월 만에 대규모 AI 모델을 개발하자, 글로벌 AI 시장에서 한국의 존재감도 커지고 있다. 5개 정예팀이 개발한 한국형 '소버린 AI'를 분석해 2027년 탄생할 국민 AI 윤곽을 그려본다.
독파모 5개 정예팀 AI 모델 성능 비교/그래픽=김지영
독파모 5개 정예팀 AI 모델 성능 비교/그래픽=김지영
국내 대표 ICT(정보통신기술) 산·학·연이 도전장을 낸 '국가대표 AI' 선발전 1차 평가가 눈앞으로 다가왔다. 과학기술정보통신부는 오는 15일까지 전문가 평가를 진행해 5개 정예팀 중 1개를 탈락시킨다. 이에 머니투데이가 5개 정예팀의 AI 모델을 쉽게 이해할 수 있도록 심층 분석했다.

13일 머니투데이가 5개 정예팀의 기술 보고서(테크 리포트)를 바탕으로 8개 주요 벤치마크 성적을 비교한 결과 LG (80,100원 ▲100 +0.13%) AI연구원의 'K-엑사원'의 성능이 전반적으로 우수하게 나타났다. K-엑사원은 8개 중 6개 벤치마크에서 최고점을 받았다. K-엑사원은 글로벌 AI 성능 평가 기관인 '아티피셜 어낼리시스'(Artificial Analysis)의 인텔리전스 지수 평가에서 32점을 받아 가중치를 공개하는 오픈 웨이트 모델 기준 세계 7위, 국내 1위에 오른 바 있다.

SK텔레콤 (54,100원 ▲1,100 +2.08%)의 '에이닷엑스 K1'(A.X K1)은 한국어 지식에 강점을 나타냈다. △한국 문화·언어 이해 능력을 평가하는 CLIcK △변호사·의사·회계사 등 14개 국가 전문자격시험 문제로 구성된 KMMLU-PRO에서 각각 84.9점, 68.1점을 받아 5개 모델 중 최고점을 받았다. 에이닷엑스 K1은 매개변수가 5190억개로 5개 정예팀 중 규모가 가장 크다. 일반적으로 AI 모델은 규모가 클수록 성능이 높다. 다만 업스테이지의 '솔라 오픈 100B'는 매개변수(1020억개)가 에이닷엑스 K1의 5분의 1수준이지만 뒤처지지 않는 성능을 나타냈다.

네이버클라우드는 고성능 추론모델인 '하이퍼클로바X 시드 32B 씽크'를 기준으로 성능을 비교했다. 텍스트 위주로 학습한 추론모델에 멀티모달 성능을 결합했다. 8개 벤치마크 중 3개만 평가점수를 공개했는데, 시청각 자료를 이해하는 멀티모달·에이전트 성능을 강조하려는 전략으로 풀이된다. 네이버클라우드 관계자는 "기술 보고서엔 당사 기준에 따라 선정한 벤치마크를 명시했다"며 "과학기술정보통신부가 제시한 13개 공통 벤치마크 성적은 따로 전달한 상태"라고 설명했다.

NC AI는 시간 부족으로 수학·코딩 역량을 평가하지 않았다.

과기정통부는 이번 1차 평가 이후 6개월마다 1팀씩 탈락시켜 2027년 상반기 최종 2팀을 선발한다. 세계 10위권 이내의 소버린 AI를 구축해 오픈소스로 공개한다는 목표다. 이를 기반으로 부처 AX(AI 전환)를 추진하고 국방·제조·문화 등 다양한 특화 서비스를 개발해 '모두의 AI'를 실현할 계획이다.

다만 심사 과정에서 '프롬 스크래치'(AI 모델의 가중치를 무작위로 초기화해 처음부터 학습시키는 방식) 등 평가 기준을 명확히 공개해야 한다는 지적이 잇따른다. 최근 업스테이지와 SKT는 AI 모델 뼈대인 아키텍처가 중국 AI와 유사하고, 네이버(NAVER (260,000원 ▲4,500 +1.76%))는 AI의 눈과 귀 역할을 하는 모듈로 중국 인코더를 차용해 '어디까지 독자적으로 구축해야 소버린 AI에 부합하는지' 논란이 일었다.

'국대AI톺아보기' 기업 주요 기사

  • 기자 사진 윤지혜 기자

이 기사 어땠나요?

이 시각 많이 보는 기사