[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.] 큐빅의 DTS솔루션/사진제공=큐빅보안 합성데이터 스타트업 큐빅(Cubig)이 정부가 추진하는 'AI(인공지능)-레디 공공데이터' 구축 수요에 맞춰 자사의 합성데이터 솔루션 'DTS'의 공공 분야 공급을 본격화하겠다고 12일 밝혔다. 조달청에 등록과 정부 및 지방자치단체, 공공기관의 AI-레디 관련 시범사업에 본격적으로 참여하겠다는 설명이다.
AI-레디는 공공데이터는 공공데이터를 AI가 별도 가공 과정 없이 즉시 학습하고 분석할 수 있도록 제공하는 개념이다. 10만건이 넘는 개방 데이터들을 표기나 코드 등을 통일시키고, 민감정보는 비식별화해 AI가 즉시 활용할 수 있도록 하는 것이 골자다.
업계에선 이같은 AI-레디 공공데이터 구축 방식으로 실제 데이터를 사용하지 않고도 구조적·통계적 특성을 재현하는 합성데이터 방식을 유망하게 보고있다. 개인정보보호위원회도 '합성데이터 생성·활용 안내서'를 통해 합성데이터를 통해 개인정보 보호와 AI-레디 형태의 전환을 동시에 달성할 수 있다고 강조했다.
특히 큐빅은 DTS의 '비접근(Non-Access)'구조가 고위험 공공 데이터를 처리하는 데 최적화돼있다고 보고있다. 비접근 구조는 내부망에 있는 원본 데이터를 외부로 반출하지 않고, 통계적 패턴을 학습해 새로운 합성데이터로 생성하는 방식이다. 큐빅은 여기에 '차등정보보호' 등 최신 기술을 더해 개인정보를 역추적하거나 재식별할 가능성도 낮춘다.
큐빅 측은 "이를 통해 데이터 3법, 개인정보보호법, GDPR(일반 데이터 보호 규정) 수준의 규제를 준수하면서도 민원·복지·보건·교통 등 고위험 데이터를 안전하게 개방·공유할 수 있을 것"이라며 "조달청이나 정부·공공기관 시범사업 등을 통해 자사의 합성데이터 솔루션 DTS 공급을 본격화하겠다"고 밝혔다.
배호 큐빅 대표는 "정부가 AI 시대에 걸맞은 질적 개방을 추진하는 만큼 이제는 '바로 학습에 활용할 수 있는 데이터'가 필요하다"며 "DTS를 공공기관 재식별 우려 없이 민간·연구기관과 데이터를 공유하고 동시에 자체 AI 서비스와 데이터 기반 행정을 고도화할 수 있는 인프라이자 합성데이터의 품질·프라이버시 검증 기준으로 만들 것"이라고 말했다.