개인정보 걱정없이 AI 학습…'3조' 합성데이터 시장 흔든다
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다. ] "수도권에 사는 A씨" vs "경기 수원시 40대 남성 자영업자 홍길동씨" 두 가지 정보 중 어느 쪽이 데이터로 가치가 높을지는 분명하다. 더 구체적인 후자이다. 하지만 '홍길동'이라는 실제 인물의 정보를 무작정 사용할 수는 없다. 이름 주소 등은 중요한 개인정보이고 질병이력 등 의료 정보라면 극히 민감한 프라이버시 사안이다. 데이터 생성·분석이 AI(인공지능) 시대 핵심분야으로 떠올랐지만 데이터산업이 빨리 성장하기 어려운 배경에 이 같은 한계가 있다. 이를 극복하는 대안이 합성데이터이다. 합성데이터는 시뮬레이션이나 알고리즘을 통해 만들어낸 가상의 데이터다. 새로 창조하는 생성형, 실제 데이터와 흡사한 구조를 갖도록 만든 재현형으로 나눌 수 있는데 '그레타'는 특히 재현형 데이터에 강점이 있는 스타트업이다. 김현태 그레타 대표는 최근 머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리'와 만나 "합성데이터는 실제와 비슷하게 신뢰도가 높고 개인정보 우려에서 안전하다"며 "금융, 헬스케어 등에 활용하면 AI 모델을 개발하거나 성능을 향상하는 데 시간과 비용을 획기적으로 개선할 것"라고 말했다.
김성휘기자
2025.12.07 10:00:00