큐빅은 데이터 생성, 비식별화 기술을 가진 스타트업입니다. 차등 정보보호 기술을 개발합니다. 그 기술을 활용하여 AI 데이터 생성 솔루션을 제공합니다. 현재 여러 기업과 기관에서 협업 중이며 24년 초 데이터 전처리 및 후가공까지 자동화가 가능한 AI 데이터 공유 분석 플랫폼을 완성할 계획입니다.
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] 보안 합성데이터 스타트업 큐빅(Cubig)이 정부가 추진하는 'AI(인공지능)-레디 공공데이터' 구축 수요에 맞춰 자사의 합성데이터 솔루션 'DTS'의 공공 분야 공급을 본격화하겠다고 12일 밝혔다. 조달청에 등록과 정부 및 지방자치단체, 공공기관의 AI-레디 관련 시범사업에 본격적으로 참여하겠다는 설명이다. AI-레디는 공공데이터는 공공데이터를 AI가 별도 가공 과정 없이 즉시 학습하고 분석할 수 있도록 제공하는 개념이다. 10만건이 넘는 개방 데이터들을 표기나 코드 등을 통일시키고, 민감정보는 비식별화해 AI가 즉시 활용할 수 있도록 하는 것이 골자다. 업계에선 이같은 AI-레디 공공데이터 구축 방식으로 실제 데이터를 사용하지 않고도 구조적·통계적 특성을 재현하는 합성데이터 방식을 유망하게 보고있다. 개인정보보호위원회도 '합성데이터 생성·활용 안내서'를 통해 합성데이터를 통해 개인정보 보호와 AI-레디 형태의 전환을 동시에 달성할 수 있다고 강조했다.
2025.12.12 18:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] "기업들이 데이터는 쌓았는데 정작 활용하려고 하면 장벽에 막히는 경우가 있습니다. 민감 정보들이 포함돼 데이터를 함부로 쓰지 못하기 때문이죠. 데이터에 누락값·오류값·비정형값들이 섞여 있어 정제·보정 없이는 쓸 수 없는 경우도 많습니다. '신타이탄(SynTitan)'은 합성 데이터 기술로 이런 문제를 해결합니다. " 이화여자대학교 사이버보안학과 교수이기도 한 배호 큐빅(Cubig) 공동대표는 자사의 솔루션 '신타이탄'에 대해 이같이 설명했다. 신타이탄은 기업이 보유한 데이터에서 결측·편향·불균형 등의 문제를 사전에 교정해 AI 학습에 활용할 수 있도록 재구성하고 민감 정보들은 식별할 수 없는 가짜 합성데이터로 재설계하는 솔루션이다. 이를 통해 정보 유출 걱정 없이 기업이 통계적 유의미성 찾을 수 있도록 지원한다. ━데이터 유출 걱정 없는 합성기술…기업·기관 20여곳 PoC━예컨대 어떤 회사가 마케팅 전략을 짜기 위해 어떤 계층의 소비자가 많은지 조사하려고 한다.
2025.12.02 05:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] AI(인공지능) 보안 합성데이터 스타트업 큐빅이 영국의 아이오나스타(IonaStarLP)와 국내 벤처캐피탈(VC) 프렌드투자파트너스에서 투자를 유치했다고 밝혔다. 이번 투자유치로 큐빅의 누적 투자유치금은 90억원이 됐다. 큐빅은 민감정보에 접근하지 않고도 AI 학습 및 분석에 필요한 고품질의 합성데이터를 생성하는 기술을 개발하는 스타트업이다. 핵심 제품인 'X-PERT'는 차등정보보호 기술 기반의 노코드 AI 플랫폼으로 실데이터 없이도 다양한 산업 환경에서 활용 가능한 멀티모달 데이터를 생성 및 시뮬레이션할 수 있다. 큐빅은 교보생명, IBK기업은행, 강남구청 등 보안 요구 수준이 높은 국내 주요 금융기관 및 공공기관을 고객으로 확보한 상태다. 네이버 클라우드 플랫폼 입점을 통해 SaaS(서비스형 소프트웨어) 기반 확장도 준비 중이다. 큐빅은 아이오나스타 등 해외
2025.08.13 14:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] AI(인공지능) 시대 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다. 큐빅은 차등정보보호 기술로 합성 데이터가 갖는 한계를 극복했다. 차등정보보호 기술은 원본 데이터 일부만 가려 활용하는 기존 비식별화 기술과는 근본적으로 다른 방식이다. 원본 데이터에 직접 접근하지 않고, 원본 데이터의 특성만으로 합성 데이터를 생성한다. 예를 들어 30대 여성의 폐암 합성 데이터를 만들 때 병원에서 직접 30대 여성의 폐암 CT(컴퓨터단층촬영) 사진을 받지 않고, 30대 여성의 폐
2024.09.18 16:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] "2026~2032년 AI(인공지능)을 교육시킬 데이터가 모두 고갈될 것이다." 미국 민간 연구단체 에포크 AI(EPOCH AI)는 최근 발표한 보고서를 통해 이같이 밝혔다. 생성형 AI 모델 간 경쟁이 치열해지면서 AI를 교육시킬 데이터가 빠르게 소진되고 있다. 생성형 AI 모델이 정교해질 수록 교육에 활용되는 데이터 수는 기하급수적으로 늘어난다. 이른바 '데이터 기근'이다. 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 최대한 살려 학습 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다. 큐빅은 차등정보보호 기
2024.09.03 11:30:00