중국에서 제조업 생산 현장에 투입돼 스스로 숙련도를 끌어올리는 이른바 '견습공 로봇'이 등장했다. 현지 언론에선 로봇이 생산현장의 '보조 장비'에서 '자율 작업자'로 진화하는 전환점이 됐단 평가가 나온다.
모바일 기기 생산라인에서 실기 강화학습 기술이 적용된 애지봇의 로봇이 작업을 진행중인 모습/사진=비리비리(Bilibili) 갈무리 4일 중국 경제매체 디이차이징에 따르면 최근 중국 로봇 스타트업 애지봇(AGIBot, 智元机器人)은 회사가 개발한 '실기 강화학습(?機?化學習, real-machine reinforcement learning)' 기술이 스마트폰·태블릿PC ODM(제조자개발생산)업체 룽치커지의 생산라인에 실제 적용됐다고 발표했다.
'실기 강화학습'은 AI(인공지능)를 통해 로봇이 작업 현장에서 반복 동작과 피드백을 거쳐 스스로 동작을 최적화하는 훈련 방식이다. 통제된 가상 시뮬레이션 환경에서 로봇 학습을 진행한 뒤 현장에 투입하는 기존 방식에서 한 단계 진화한 셈이다.
애지봇과 룽치커지는 해당 기술이 적용된 작업현장을 공개했다. 디이차이징은 휴머노이드(인간형) 로봇이 생산라인에서 아이패드를 집어 기능 테스트 스테이션에 옮겨 넣은 뒤 몇 초 후 검사가 완료되면 다시 아이패드를 안정적으로 꺼내 다음 공정으로 옮겨넣는 과정이 안정적으로 진행되고 있었다고 전했다.
기존 방식대로 가상 시뮬레이션 환경에서 휴머노이드 로봇을 학습시킨 뒤 현장에 투입할 경우 작업 숙련도가 궤도에 오르기 전 후속 최적화 작업이 필수였다. 이 과정엔 수개월이 소요돼 막대한 추가 비용이 발생했다. 또 로봇의 배치와 조정을 도울 유지 인력까지 투입돼야 했다. 디이차이징은 기존 훈련 방식이 적용된 화동 지역의 한 공장 생산라인에선 두 대의 로봇 최적화 작업에 조정·유지인력만 수십명이 달라붙어 차라리 사람이 생산라인 운용을 맡는 게 효율적으로 보였다고 전했다.
뤄젠란 애지봇 공동창업자 겸 수석과학자는 "실기 강화학습을 실제 생산라인 단계에 직접 적용하면 로봇의 학습 목표를 실제 생산성과 연계할 수 있다"며 "이를 통해 현장 인력과 자원 투입을 대폭 줄일 수 있다"고 말했다. 생산 통과율과 작업 주기, 양품률 등이 곧바로 로봇의 학습 목표로 설정돼 로봇의 배치 시간도 분 단위로 단축이 된다. 이른바 '로봇 보모' 없이도 로봇의 현장 최적화를 관리할 수 있단 설명이다.
실기 강화학습의 다음 과제는 생산현장에서 최적화된 로봇을 어떻게 대량으로 복제할 것이냐다. 현재 애지봇은 로컬 프라이빗 클라우드(Local Private Cloud)와 OTA(Over the Air, 무선 업데이트) 매커니즘을 통해 서로 다른 공정 간의 실기 강화학습 경험을 공유하고 업데이트하는 과정을 연구중이다. 뤄젠란은 "통신 기술부터 데이터 인터페이스까지 실제 환경에서 단계적으로 연결돼야 한다"고 말했다.
애지봇은 2023년 상하이에서 설립된 기업으로 2020년 화웨이의 '천재소년 선발대회' 출신 펑즈후이가 창업한 회사로 화제를 모았다. 회사 설립 후 중국 핵심 기업들로부터 빠르게 투자금을 유치했다. 텐센트의 투자 비중이 가장 높으며 BYD, 징동탓컴, 상하이자동차, 린강그룹 등이 애지봇에 투자했다. 한국에선 LG전자와 미래에셋이 최근 진행된 애지봇의 자금 조달 라운드에 공동으로 참여했다. 중국 증권시보와 시나차이징 등은 애지봇의 기업 가치를 150억위안(약 3조300억원) 이상으로 추정한다.