2025 엔젤투자리스트 최고위 과정 모집

AI에 스타크래프트 가르쳤더니...돌발상황에도 드론 알아서 협력

울산=류준영 기자 기사 입력 2025.09.24 05:00

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

[2025 테크마켓]한승열 울산과학기술원(UNIST) 인공지능대학원 조교수

[편집자주] 카이스트(KAIST·한국과학기술원)를 비롯한 4대 과학기술원이 보유한 딥테크를 한자리에서 모두 만나볼 수 있는 사업화 유망기술 공동 설명회가 코엑스에서 열린다. 머니투데이 스타트업 전문 미디어 플랫폼 '유니콘팩토리'는 오는 16일 서울 삼성동 코엑스 A홀에서 개막하는 '스마트 에너지 플러스'(SMART ENERGY PLUS·SEP) 2025'의 특별 부대행사로 '2025 테크마켓'을 개최한다. 과학기술정보통신부와 카이스트, 대구경북과학기술원(DGIST), 울산과학기술원(UNIST), 광주과학기술원(GIST) 등 4대 과기원이 공동 개최하는 이 행사는 우수 R&D(연구개발) 성과를 국내 대·중견·중소기업, 벤처·스타트업에 소개·이전해 기존 제품 및 서비스를 고도화하고 글로벌 경쟁력을 강화하기 위해 마련됐다. 무대에 오를 신기술을 개발한 과기원 교수들에게 직접 핵심 기술력과 산업적 가치를 들어봤다.
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

한승열 울산과학기술원(UNIST) 인공지능대학원 조교수/사진=류준영 기자
한승열 울산과학기술원(UNIST) 인공지능대학원 조교수/사진=류준영 기자

하늘을 나는 드론(무인기)이 연합해 적을 포위하거나, 공장에서 여러 대의 로봇이 '팀'을 이뤄 상황에 맞춰 유연하게 협력하는 모습은 더 이상 공상과학(SF) 영화 속 이야기가 아니다.

인공지능(AI)을 훈련시키는 기법을 주로 연구해온 울산과학기술원(UNIST) 인공지능대학원의 한승열 조교수가 이 같은 미래를 현실로 만들 '멀티 AI 에이전트 학습 기술'(다중 에이전트 강화학습 정책 훈련 장치 및 방법)을 개발했다.

이는 간단히 말해 개별 드론, 로봇에 탑재된 AI 에이전트 간의 협동력을 높이는 훈련법이다. 예상치 못한 변수나 돌발 상황에서도 로봇이 협력 능력을 유지할 수 있도록 돕는 AI 알고리즘을 개발한 것이 핵심이다.

여기서 'AI 에이전트'란 주어진 목표를 달성하기 위해 환경을 인식하고 스스로 판단해 행동하는 AI 시스템, 강화 학습은 AI가 다양한 상황을 경험하며 스스로 행동 전략을 익히는 학습 방식을 말한다.

한 조교수는 "지금까지는 로봇 한 대를 개별적으로 제어하는 데 초점을 맞췄지만 앞으로는 여러 로봇이 함께 협력하며 임무를 수행하는 시대가 올 것"이라며 "예상치 못한 변수를 이겨낼 수 있는 강인한 학습 기술이 핵심기술이 될 것"이라고 강조했다. 한 조교수의 연구성과는 오는 10월16일 서울 코엑스에서 열리는 '4대 과학기술원 공동 2025 테크마켓'에서 소개될 예정이다.


'울프팩 공격'으로 강인한 협력 전략 훈련


한 조교수 연구실은 드론과 로봇 등 여러 개체가 협력하는 복잡한 상황을 가상으로 재현해 알고리즘을 훈련한다. 흥미로운 점은 '어택(attack)' 개념을 도입한 것이다. 이는 일부 에이전트를 의도적으로 교란하거나 공격해 다른 로봇들이 어떤 방식으로 협력하며 문제를 해결하는지 관찰하고 이를 학습에 반영하는 방식이다. 이 전략은 늑대 무리가 협력해 사냥하는 모습과 닮아 '울프팩 공격'이라는 이름으로 불린다.

예를 들어 여러 대의 드론이 협력 임무를 수행한다고 가정하고 한 대를 의도적으로 망가뜨린다. 그러면 이 협력 구조가 쉽게 무너질 수 있는데, 나머지 드론들이 그 상황을 수습하려고 협력 전략을 세우게 된다. 이 과정에서 취약한 지점을 찾아내 예습시켜 실전에서도 견고한 협력 체계 유지하는 기술을 만드는 것이 이 기술의 목표다.

한 조교수는 "이전에는 정해진 상황에서 AI가 얼마나 잘 작동하는지를 점검하는 정도였지만 이 공격 전략은 실제처럼 상황이 계속 바뀌고 예측하기 어려운 위기상황을 만들어 AI가 그 안에서 얼마나 잘 대응하는지를 평가할 수 있다"고 했다.


스타크래프트에서 배우는 강인한 AI


연구팀이 멀티 에이전트 학습에 활용하는 건 나온 지 20년이 넘은 실시간 전략( RTS ) 게임 '스타크래프트'였다. 이 같은 전략 게임과 가상환경 시뮬레이터를 활용해 멀티 에이전트 학습을 반복 실험하고 있는데 AI가 더 빠르게 시행착오를 경험하고 학습할 수 있는 기반으로 이것만 한 것이 없다는 설명이다.

한 조교수는 "알파고가 바둑이라는 게임 환경에서 학습해 인간을 뛰어넘었듯, 로봇도 가상의 게임 같은 환경에서 수천 번, 수만 번 시뮬레이션을 반복하며 예측 불가능한 상황에 대비하는 것"이라며 "이렇게 학습한 알고리즘은 실제 드론이나 로봇 제어에 적용할 수 있다"고 말했다.

한승열 울산과학기술원(UNIST) 인공지능대학원 조교수/사진=류준영 기자
한승열 울산과학기술원(UNIST) 인공지능대학원 조교수/사진=류준영 기자


자율드론부터 스마트팩토리까지…활용 가능성 무궁무진


멀티 에이전트 학습의 대표적 활용 분야가 '자율 드론'이다. 한 조교수는 "군사 작전이나 재난 구조 현장처럼 여러 대의 드론이 동시에 움직여야 하는 상황이 많다"며 "앞으로 민간 물류나 스마트팩토리 자동화 등 산업 현장에서도 멀티 에이전트 수요가 늘어날 것"이라고 전망했다.

현재 연구팀은 시뮬레이션에서 검증한 알고리즘을 실제 드론 실험으로 확장하고 있다. 한 조교수는 "드론뿐 아니라 공장에서 일하는 협업로봇, 스마트팩토리의 자동화 라인에서도 멀티 에이전트 학습은 핵심기술이 될 것"이라며 "아직 시장 수요는 제한적이지만 피지컬 AI와 에이전트 기반 기술이 빠르게 부상하면서 관련 산업도 급성장할 것"이라고 내다봤다.

현재 한 조교수팀은 두 가지 핵심 프로젝트를 진행 중이다. 하나는 드론 자율제어 기술로 내년 중 시제품 테스트를 목표로 하고 있으며 다른 하나는 2028년까지 대규모 언어모델(LLM)을 활용한 멀티 에이전트 효율화 연구다.

그는 "멀티 에이전트 학습은 단순한 로봇 제어 기술을 넘어 협업과 상호작용 방식을 완전히 새롭게 바꿀 것"이라며 "국내 기술력도 빠르게 성장하고 있어 산업계와 연결할 새로운 응용 분야를 지속적으로 발굴하고 있다"고 말했다.


[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

관련기사

이 기사 어땠나요?

이 시각 많이 보는 기사