"비디오 만들어주는 챗GPT? 다음주 더 강력한 GPT-4 나온다"

황국상 기자 기사 입력 2023.03.10 17:30

URL이 복사되었습니다. 원하는 곳에 붙여넣기 해주세요.

공유하기
글자크기

독일매체 '하이세', 마이크로소프트 독일법인 CTO 언급 인용 보도
"영상물 같은, 멀티모달 기능 갖춘 GPT-4 다음주 공개"

/사진제공=이미지투데이
/사진제공=이미지투데이
챗GPT의 열풍이 전 세계를 휩쓴지 불과 4개월여 지난 상태에서 더 강력한 GPT-4가 이달 중, 이르면 다음 주 내에 발표될 것이라는 외신 보도가 나왔다.

10일 독일 매체 하이세온라인(Heise Online)에 따르면 MS(마이크로소프트) 독일 법인의 안드레아스 브라운(Andreas Braun) CTO(최고기술책임자)는 지난 9일(현지시간) 열린 'AI 인 포커스 - 디지털 킥오프' 행사에서 GPT-4의 출시가 임박했다고 밝혔다.

이번 행사에는 4명의 MS 독일 법인 관계자가 GPT 시리즈 등 LLM(대형 언어 모델)에 대해 소개했다. GPT 시리즈 등 LLM 모델은 MS의 클라우드 서비스인 '애저 오픈 AI'에 결합돼 제공된다.

오픈AI는 GPT 시리즈 외에도 △이미지 생성형 AI인 달리(Dalle) 시리즈 △코딩 자동생성 기능을 갖춘 코덱스(Codex) 등을 잇따라 개발한 바 있다. MS는 앞서 2019년에 오픈AI에 10억달러(1조3225억원)을 투자한 데 이어 챗GPT 성공이 확인된 후 추가로 100억달러(약 13조2250억원)을 투자하기로 한 바 있다.

GPT는 '생성형(Generative) 선행학습(Pre-trained) 트랜스포머(Transformer)'의 약자다. 트랜스포머는 인공신경망을 이용한 딥러닝 시스템을 일컫는다.

AI모델을 대용량의 데이터로 사전학습을 시켜 나중에는 스스로 언어표현을 생성할 수 있도록 만들어진 게 특징이다. 기술 발전의 수준에 따라 GPT-1에서 GPT-2, GPT-3 등으로 발전된 후 현재 GPT-3.5까지 공개됐다. 이 GPT-3.5 기반으로 만들어진 게 챗GPT다.

이번에 공개될 GPT-4는 기존 시리즈보다 훨씬 강력한 기능을 갖춘 것으로 보인다. 브라운 CTO는 "예컨대 비디오와 같은, 지금까지와 완전히 다른 가능성을 제공하는, 멀티모달(Multi-modal) 기능을 갖춘 GPT-4를 다음 주 소개할 것"이라고 밝혔다.

멀티모달 AI는 다양한 모달리티(Modality, 의사소통의 채널)를 동시에 받아들이고 사고하는 AI 모델을 의미한다. 기존 초거대 AI가 주로 언어에 초점을 둔 언어 모델이었다면 멀티모달 AI는 텍스트(문자) 데이터 외에도 이미지, 음성, 제스쳐, 시선, 표정, 생체신호 등 여러 입력방식(모달리티)을 받아들이고 사고할 수 있다. 멀티모달 AI를 통해 인간과 AI가 더 자연스레 소통할 수 있게 됐다는 얘기다.

한편 MS는 오픈AI에 대규모 자금을 투자하는 대가로 해당 솔루션을 상업화할 우선권을 보유한 상태다. 이를 바탕으로 최근 쏟아져 나오는 오픈AI의 각종 성과들을 기존 MS 솔루션과 결합해 업그레이드된 솔루션들을 잇따라 내놓고 있다.

대표적으로는 △애저 오픈AI 서비스의 AI모델을 활용해 개발자가 AI페어 프로그래머로 코드개발을 가속화할 수 있도록 돕는 '깃허브 코파일럿' △개인과 팀 및 조직 생산성 향상을 위해 AI 기능을 결합한 '팀즈 프리미엄' △검색엔진에 AI를 결합한 MS 검색엔진 '빙'(BING) △데이터 기반 통찰력을 통해 영업팀이 고객에 대한 전략적 판매활동에 집중하도록 돕는 '비바 세일즈' 등이 있다.
  • 기자 사진 황국상 기자

이 기사 어땠나요?

이 시각 많이 보는 기사