업스테이지 '솔라프로2', 글로벌 LLM평가 12위…"한국 모델 최초"

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

스타트업 업스테이지가 개발한 차세대 거대언어모델(LLM) '솔라 프로2'가 글로벌 AI(인공지능) 모델 성능 평가에서 오픈AI, 구글, 메타 등과 함께 상위 20대 프런티어 모델로 이름을 올렸다고 21일 밝혔다.

이번 평가는 독립 LLM 성능 분석기관 아티피셜 애널리시스의 '지능 지표'를 기반으로 진행됐다. 추론, 종합지식, 수학, 코딩 등 7개 대표 벤치마크를 바탕으로 LLM을 평가하는 지표로, 높은 투명성과 객관성으로 글로벌 빅테크 기업들이 활발하게 인용하고 있다.

업스테이지는 이번 평가에서 58점으로 12위를 기록했다. 한국 LLM 중에서는 유일하게 이름을 올렸다. 한국의 LLM이 해당 평가에서 이름을 올린 것은 이번이 처음이다.

1위는 xAI의 '그록4'(73점), 2위는 오픈AI의 'o3-pro'(71점), 3위는 구글의 '제미나이 2.5 프로'(70점)이었다. 중국의 '딥시크 R1'은 6위(68점), '미니맥스 M1 80k'는 9위(63점)를 기록했다. 문샷AI의 '키미 K2'는 솔라 프로2보다 한 단계 낮은 13위를 기록했다.

업스테이지 측은 "주요 프런티어 모델 대부분은 1000억~2000억 매개변수(파라미터)를 탑재한 대형 모델로, 1위를 차지한 '그록-4'는 1조7000억(1.7T) 매개변수에 달한다"며 "반면 솔라 프로 2는 단 310억 매개변수로 어깨를 나란히 해 소형 언어모델의 경쟁력과 효율성을 보여줬다"고 강조했다.

회사 측은 또 "GPT-4.1은 현재 기업 환경에서 가장 널리 쓰이는 범용 모델이지만, 솔라 프로2가 이를 넘어서면서 고난도 추론 능력에서 확실한 우위를 차지했다"며 "비용 대비 성능 평가에서도 '클로드 4 소넷', '마지스트랄 스몰' 등 주요 모델보다 효율적인 것으로 평가됐다"고 덧붙였다.

김성훈 업스테이지 대표는 "앞으로도 독자적인 기술력으로 자체 모델을 더욱 고도화해 대한민국이 AI 3강을 넘어 글로벌 시장에서 기술 주도권을 차지할 수 있도록 기여하겠다"고 밝혔다.