[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] 보안 합성데이터 스타트업 큐빅(Cubig)이 정부가 추진하는 'AI(인공지능)-레디 공공데이터' 구축 수요에 맞춰 자사의 합성데이터 솔루션 'DTS'의 공공 분야 공급을 본격화하겠다고 12일 밝혔다. 조달청에 등록과 정부 및 지방자치단체, 공공기관의 AI-레디 관련 시범사업에 본격적으로 참여하겠다는 설명이다. AI-레디는 공공데이터는 공공데이터를 AI가 별도 가공 과정 없이 즉시 학습하고 분석할 수 있도록 제공하는 개념이다. 10만건이 넘는 개방 데이터들을 표기나 코드 등을 통일시키고, 민감정보는 비식별화해 AI가 즉시 활용할 수 있도록 하는 것이 골자다. 업계에선 이같은 AI-레디 공공데이터 구축 방식으로 실제 데이터를 사용하지 않고도 구조적·통계적 특성을 재현하는 합성데이터 방식을 유망하게 보고있다. 개인정보보호위원회도 '합성데이터 생성·활용 안내서'를 통해 합성데이터를 통해 개인정보 보호와 AI-레디 형태의 전환을 동시에 달성할 수 있다고 강조했다.
고석용기자 2025.12.12 18:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] "기업들이 데이터는 쌓았는데 정작 활용하려고 하면 장벽에 막히는 경우가 있습니다. 민감 정보들이 포함돼 데이터를 함부로 쓰지 못하기 때문이죠. 데이터에 누락값·오류값·비정형값들이 섞여 있어 정제·보정 없이는 쓸 수 없는 경우도 많습니다. '신타이탄(SynTitan)'은 합성 데이터 기술로 이런 문제를 해결합니다. " 이화여자대학교 사이버보안학과 교수이기도 한 배호 큐빅(Cubig) 공동대표는 자사의 솔루션 '신타이탄'에 대해 이같이 설명했다. 신타이탄은 기업이 보유한 데이터에서 결측·편향·불균형 등의 문제를 사전에 교정해 AI 학습에 활용할 수 있도록 재구성하고 민감 정보들은 식별할 수 없는 가짜 합성데이터로 재설계하는 솔루션이다. 이를 통해 정보 유출 걱정 없이 기업이 통계적 유의미성 찾을 수 있도록 지원한다. ━데이터 유출 걱정 없는 합성기술…기업·기관 20여곳 PoC━예컨대 어떤 회사가 마케팅 전략을 짜기 위해 어떤 계층의 소비자가 많은지 조사하려고 한다.
고석용기자 2025.12.02 05:00:00[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] "2026~2032년 AI(인공지능)을 교육시킬 데이터가 모두 고갈될 것이다." 미국 민간 연구단체 에포크 AI(EPOCH AI)는 최근 발표한 보고서를 통해 이같이 밝혔다. 생성형 AI 모델 간 경쟁이 치열해지면서 AI를 교육시킬 데이터가 빠르게 소진되고 있다. 생성형 AI 모델이 정교해질 수록 교육에 활용되는 데이터 수는 기하급수적으로 늘어난다. 이른바 '데이터 기근'이다. 데이터 기근을 해결할 해법으로 합성 데이터가 주목 받는다. 생성형 AI 교육을 위한 가상의 데이터다. 부족한 학습 데이터를 채우는 역할이다. 그러나 한계도 있다. 원본 데이터와의 관계에서 오는 딜레마 때문이다. 원본 데이터를 최대한 살려 학습 정확도를 높이자니 정보 유출이 우려된다. 그렇다고 정보 유출을 막기 위해 원본 데이터를 수정하다 보면 학습 정확도가 떨어진다. 큐빅은 차등정보보호 기
김태현기자 2024.09.03 11:30:00