ICT(정보통신기술) 분야 전문가들에 따르면 AI(인공지능) 서비스 개발 과정에서 '데이터 라벨링'에 드는 시간과 비용 비중이 약 85%에 달한다. 산업 전반에 AI가 보급되는 것을 막고 있는 주원인으로 꼽힌다. 인형 눈알 붙이듯 노동집약적 방식으로 데이터 라벨링이 이뤄지다 보니 시간적·금전적 비용 부담이 클 수밖에 없다. 김명철 드림투리얼 대표(28·카이스트 전기·전자공학부 박사과정)는 이런 어려움을 해결할 솔루션인 '오토데이터'를 개발해 창업했다. 오토데이터는 1개의 데이터당 120분 걸리던 고난도 라벨링 작업을 1분 내로 끝낼 수 있다. 그만큼 인력비를 줄일 수 있다는 이점도 따른다. 김 대표는 "오토데이터가 현실과 가장 유사한 시뮬레이션 가상환경에서 학습데이터를 추출한다. 단순히 학습데이터만 생성하는 게 아니라 고객사의 AI 서비스 개발부터 공급까지 학습데이터 문제를 함께 고민하며 풀어준다"고 말했다. 이달 14일 서울 삼성동 코엑스에서 열린 'K-테크 스타트업 왕중왕전'
류준영기자 2022.10.31 09:00:00인공지능(AI)이 전산업에 적용되며 혁신을 일으키는 가운데 '합성데이터(Synthetic Data)' 생성기술이 AI 확산을 위한 핵심기술로 주목받고 있다. 합성데이터가 AI 서비스를 개발하는데 드는 시간과 비용을 혁신적으로 절감할 수 있어서다. MIT 테크놀로지리뷰는 합성데이터를 '2022년 10대 혁신기술' 중 하나로 선정했다. 한국신용정보원에 따르면 글로벌 AI 시장은 매년 빠르게 성장해 2025년 1840억달러(약 262조5700억원)에 이르고, 글로벌 AI 학습데이터 시장은 연평균 38.4% 성장하며 2025년 39조4000억원에 달할 것으로 전망했다. ━AI 학습데이터는 대규모 수작업 필요...단순 부업 시장 형성━AI를 학습시키는데 필요한 실제 데이터(Real world Data) 수집·가공은 그동안 수작업으로 이뤄졌다. AI는 개발 과정에서 데이터를 학습하는 딥러닝을 거쳐야 정확도가 높아지는데 AI가 사진이나 문서, 음성, 영상 등의 데이터를 학습할 수 있도록 가공하
김유경기자 2022.10.31 10:09:13데이터 라벨링 효율화 기술 스타트업 드림투리얼이 14일 서울 코엑스에서 열린 'K테크 스타트업 왕중왕전' 학생팀 부문에서 우수상을 차지했다. 드림투리얼은 우수상 포상으로 상금 100만원과 함께 △기술·경영·해외진출 분야 전문가 컨설팅 △미디어 홍보 △공동투자 연결 △시너지업체 연결 △후속투자 연계 △국제컨퍼런스 '키플랫폼' 초대 등 스타트업 성장에 필요한 다양한 지원을 받을 수 있다. 드림투리얼은 인공지능(AI) 개발 과정에서 데이터 라벨링에 소요되는 시간과 비용을 줄여주는 솔루션 '오토데이터 스위트'를 개발했다. 현실과 유사한 시뮬레이션을 통해 '리얼데이터' 대신 '합성데이터'를 를 추출해 1개 데이터 당 120분이 걸리던 라벨링 작업을 1분 내로 끝낼 수 있도록 한다. 합성데이터는 별도의 라벨링이 필요치 않아 인력 비용도 줄인다. 한편 이번 대회는 국내 최대 민간주도 탄소중립 기술대전 '그린비즈니스위크 2022'(GBW 2022)의 특별 부대행사로 마련됐다. 머니투데이 스타트업
최태범기자 2022.10.14 16:40:19"AI기업들이 기존에 가진 데이터를 10%만 사용하고 저희가 제공한 데이터를 사용하면, 인공지능(AI)의 학습 정확도가 25% 상승했습니다. 90% 이상의 비용을 줄이는 셈입니다." 김명철 드림투리얼 대표는 14일 서울 코엑스에서 열린 '그린 비즈니스위크(GBW) 2022' 특별 부대행사인 'K테크 스타트업 왕중왕전'에서 이같이 말했다. 이번 대회는 유망 딥테크 스타트업의 성장을 위해 머니투데이 스타트업 미디어 플랫폼 유니콘팩토리가 주관하고, 과학기술정보통신부 후원으로 개최됐다. 카이스트 학생창업 기업인 드림투리얼은 학생창업 부문으로 결선에 진출했다. 드림투리얼은 인공지능(AI) 개발 과정에서 데이터 라벨링에 소요되는 시간과 비용을 줄여주는 솔루션 '오토데이터 스위트'를 개발한 스타트업이다. 현실과 유사한 시뮬레이션을 통해 '리얼데이터' 대신 '합성데이터'를 를 추출해 1개 데이터 당 120분이 걸리던 라벨링 작업을 1분 내로 끝낼 수 있도록 한다. 합성데이터는 별도의 라벨링이 필요
고석용기자 2022.10.14 13:07:24인공지능(AI) 서비스 개발의 핵심은 데이터다. 문제는 데이터 수집·가공 등 라벨링 작업이 만만치 않다는 것이다. 인형 눈알 붙이듯 노동집약적 방식으로 데이터 라벨링이 이뤄지다 보니 시간적, 금전적 비용 부담이 커지는 것은 물론 정확성도 떨어진다. 김명철 드림투리얼 대표(28·카이스트 전기·전자공학부 박사과정)도 이 같은 어려움을 겪다가 문제를 해결하고자 AI 및 시뮬레이션 분야의 전문가들과 함께 창업에 나섰다. 김 대표는 "AI 서비스 개발 과정에서 데이터 라벨링에 드는 시간과 비용의 비중이 85%에 달한다"며 "AI 개발과 모델 성능 향상에 데이터가 미치는 영향은 치명적"이라고 설명했다. 산업 전반에 인공지능이 보급되는 것을 막고 있는 주요 원인이 바로 데이터라는 것. 그는 "얼굴 인식을 제외하면 사실상 AI 서비스가 별로 없다"면서 "돈을 퍼붓고 있지만 학습데이터 부족 때문에 개발 속도는 느린 게 현실"이라고 지적했다. 실제 미국 AI 스타트업의 경우 평균 라벨링 비용이 230
김유경기자 2022.10.11 17:36:3410월 12~14일 삼성동 코엑스에서 열리는 '그린 비즈니스 위크 2022' 마지막날인 14일 특별 부대행사로 진행되는 'K-테크 스타트업 왕중왕전' 결선에 진출할 10개팀이 확정됐다. 머니투데이 스타트업 미디어 플랫폼 유니콘팩토리가 주관하고, 과학기술정보통신부가 후원한 이번 대회 본선에는 한국과학기술원(KAIST), 대구경북과학기술원(DGIST), 울산과학기술원(UNIST), 광주과학기술원(GIST), 포스텍(옛 포항공대) 등 국내 5대 과학기술특성화대학 기술사업화팀·산학협력팀·창업진흥센터 등이 추천한 교원·학생 창업기업 총 35개팀이 출전했다. AI(인공지능)반도체와 바이오헬스 등 10대 국가전략기술과 관련한 창업 아이디어가 주를 이뤘다. 이들은 지난 5일부터 2주간 IR(기업공개) 보고서 등을 토대로 심사를 받았다. 최종적으로 결선행 티켓을 거머쥔 팀은 △드림투리얼 △나니아랩스 △에이엠홀로 △타이로스코프 △엔서 △이노셉 △퍼플칩스 △디플에이치알 △아임시스템 △제핏 10곳이다.
류준영기자 2022.09.21 15:18:14