[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] "수도권에 사는 A씨" vs "경기 수원시 40대 남성 자영업자 홍길동씨" 두 가지 정보 중 어느 쪽이 데이터로 가치가 높을지는 분명하다. 더 구체적인 후자이다. 하지만 '홍길동'이라는 실제 인물의 정보를 무작정 사용할 수는 없다. 이름 주소 등은 중요한 개인정보이고 질병이력 등 의료 정보라면 극히 민감한 프라이버시 사안이다. 데이터 생성·분석이 AI(인공지능) 시대 핵심분야로 떠올랐지만 데이터산업이 빨리 성장하기 어려운 배경에 이 같은 한계가 있다. 이를 극복하는 대안이 합성데이터이다. 합성데이터는 시뮬레이션이나 알고리즘을 통해 만들어낸 가상의 데이터다. 새로 창조하는 생성형, 실제 데이터와 흡사한 구조를 갖도록 만든 재현형으로 나눌 수 있는데 '그레타'는 특히 재현형 데이터에 강점이 있는 스타트업이다. 김현태 그레타 대표는 최근 머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리'와 만나 "합성데이터는 실제와 비슷하게 신뢰도가 높고 개인정보 우려에서 안전하다"며 "금융, 헬스케어 등에 활용하면 AI 모델을 개발하거나 성능을 향상하는 데 시간과 비용을 획기적으로 개선할 것"라고 말했다.
김성휘기자 2025.12.07 10:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] 엔닷라이트는 에이로봇과 로봇 AI(인공지능) 학습을 위한 3D 합성데이터 분야에서 협력하는 업무협약(MOU)을 체결했다고 24일 밝혔다. 두 기업은 지난 10월 열린 '엔비디아 인셉션 스타트업 그랜드 챌린지'에서 나란히 파이널리스트로 선정되며, 기술 경쟁력을 인정받은 바 있다. 이번 협약은 양사가 휴머노이드 개발에 필요한 합성데이터 기반 AI 학습 생태계 구축이라는 공동 목표를 공식화했다는 점에서 주목된다. 엔닷라이트와 에이로봇은 이번 협력을 통해 휴머노이드와 산업용 로봇의 인지 능력 향상, 제어 정밀도 개선, 실제 산업 현장에서 적용 가능한 시뮬레이션 기술 고도화를 핵심 과제로 설정했다. 특히 물류·제조 라인, 산업 안전 구역 등 실제 환경에서 활용 가능한 로봇 AI 학습 파이프라인을 공동 개발해 산업지능화를 견인하겠다는 계획이다. 협력의 기반이 되는 핵심 기술은 엔닷라이트가 자체 개발한 '트리닉스(Trinix)' 3D 합성데이터 생성 엔진이다.
류준영기자 2025.11.24 10:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] AI(인공지능) 시대 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다. 큐빅은 차등정보보호 기술로 합성 데이터가 갖는 한계를 극복했다. 차등정보보호 기술은 원본 데이터 일부만 가려 활용하는 기존 비식별화 기술과는 근본적으로 다른 방식이다. 원본 데이터에 직접 접근하지 않고, 원본 데이터의 특성만으로 합성 데이터를 생성한다. 예를 들어 30대 여성의 폐암 합성 데이터를 만들 때 병원에서 직접 30대 여성의 폐암 CT(컴퓨터단층촬영) 사진을 받지 않고, 30대 여성의 폐
김태현기자 2024.09.18 16:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] "2026~2032년 AI(인공지능)을 교육시킬 데이터가 모두 고갈될 것이다." 미국 민간 연구단체 에포크 AI(EPOCH AI)는 최근 발표한 보고서를 통해 이같이 밝혔다. 생성형 AI 모델 간 경쟁이 치열해지면서 AI를 교육시킬 데이터가 빠르게 소진되고 있다. 생성형 AI 모델이 정교해질 수록 교육에 활용되는 데이터 수는 기하급수적으로 늘어난다. 이른바 '데이터 기근'이다. 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 최대한 살려 학습 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다. 큐빅은 차등정보보호 기
김태현기자 2024.09.03 11:30:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] 합성데이터 솔루션 스타트업 큐빅이 액셀러레이터(AI) 씨엔티테크와 DB그룹의 신기술 사업금융회사 DB 캐피탈이 결성한 씨엔티테크-디비드림빅 투자조합으로부터 프리시리즈A 투자를 유치했다고 19일 밝혔다. 큐빅은 차등정보보호 기술을 적용한 합성데이터 생성 알고리즘을 보유하고 있다. 원본 유추가 불가능해 안전하고, 누구나 코딩 지식 없이 손쉽게 생성할 수 있다는 점이 특징이다. 또 원본 데이터를 외부 클라우드에 올리지 않고도 내부 서버에서 안전하게 생성할 수 있다. 민감한 데이터를 보유하고 있는 금융, 의료를 비롯한 전 산업군에 활용될 수 있다. 합성데이터는 원본 데이터를 기반으로 가상의 상황을 설정한 데이터다. AI를 교육하는데 활용된다. 전화성 씨엔티테크 대표는 "AI 학습 데이터 수요가 급증하면서 전세계적으로 많은 국가에서 합성 데이터 시장이 성장하는 추세"라며
김태현기자 2024.08.19 18:00:00인공지능(AI)이 전산업에 적용되며 혁신을 일으키는 가운데 '합성데이터(Synthetic Data)' 생성기술이 AI 확산을 위한 핵심기술로 주목받고 있다. 합성데이터가 AI 서비스를 개발하는데 드는 시간과 비용을 혁신적으로 절감할 수 있어서다. MIT 테크놀로지리뷰는 합성데이터를 '2022년 10대 혁신기술' 중 하나로 선정했다. 한국신용정보원에 따르면 글로벌 AI 시장은 매년 빠르게 성장해 2025년 1840억달러(약 262조5700억원)에 이르고, 글로벌 AI 학습데이터 시장은 연평균 38.4% 성장하며 2025년 39조4000억원에 달할 것으로 전망했다. ━AI 학습데이터는 대규모 수작업 필요...단순 부업 시장 형성━AI를 학습시키는데 필요한 실제 데이터(Real world Data) 수집·가공은 그동안 수작업으로 이뤄졌다. AI는 개발 과정에서 데이터를 학습하는 딥러닝을 거쳐야 정확도가 높아지는데 AI가 사진이나 문서, 음성, 영상 등의 데이터를 학습할 수 있도록 가공하
김유경기자 2022.10.31 10:09:13