박희성 우리데이터 대표가 전자신문과 만나 인터뷰를 진행하고 있다. 〈사진=강성전 기자〉“생성형 인공지능(AI) 확산으로 공공데이터 품질 관리가 새로운 과제로 떠올랐습니다. AI 모델 고도화 못지않게 AI가 바로 활용할 수 있는 'AI 레디 데이터' 확보가 중요해졌기 때문입니다. 우리데이터는 데이터 품질관리 도구를 앞세워 공공 데이터 품질관리 시장을 적극 공략할 계획입니다.”
박희성 우리데이터 대표는 최근 전자신문과 만나 공공 AI 확산을 위한 핵심 과제로 'AI 레디 데이터' 확보를 꼽았다.
AI 레디 데이터는 AI가 별도의 복잡한 전처리 없이 바로 활용할 수 있도록 구조와 표준, 데이터값 품질을 정비한 데이터다.
박 대표는 AI 도입이 활발해지면서 공공데이터 정비 필요성도 커지고 있다고 강조했다. 그는 “공공데이터는 양이 많지만, AI가 바로 학습할 수 있는 상태로 정비된 데이터는 아직 부족하다”며 “AI 경쟁력은 모델만이 아니라 원천 데이터 품질에서 갈린다”고 설명했다.
이어 “업무 처리에는 문제가 없더라도 AI 학습용으로 쓰기에는 표준 불일치, 데이터 누락, 코드 체계 불일치 등으로 한계가 있다”며 “AI 도입 때마다 수집·전처리·결합에 막대한 시간과 비용을 들이는 방식으로는 공공 AI 확산에 속도를 내기 어렵다”고 덧붙였다.
우리데이터는 이 같은 문제를 해결하기 위해 지능형 데이터 품질관리 솔루션 '우리데이터클리닉 V1.0'을 개발했다. 이 솔루션은 운영 중인 데이터베이스(DB)를 역공학 방식으로 분석해 데이터 구조와 표준, 값을 진단하고 문제 원인을 파악해 개선 방안을 제시한다. 우리데이터는 향후 AI 기능을 접목해 솔루션을 고도화할 계획이다.
우리데이터클리닉은 데이터 품질을 설계와 운영 두 축에서 점검한다. 표준 용어와 영문명, 도메인, 코드 체계를 지키지 않아 생긴 설계 문제를 찾아내고, 운영 과정에서 잘못 입력된 날짜·전화번호·코드값 등도 진단한다.
박 대표는 “우리데이터클리닉의 핵심은 AI 활용 직전의 전처리 자동화가 아니라 원천 데이터 자체를 상시 활용할 수 있는 상태로 정비하는 것”이라며 “기존 솔루션이 데이터 품질 점수를 알려주는 진단 도구에 가까웠다면, 우리데이터클리닉은 어디가 문제인지 찾고 어떻게 고칠지 제시하는 클리닉형 솔루션”이라고 말했다.
특히 박 대표는 설계 단계 중요성을 강조했다. 그는 “데이터 품질 문제는 설계 단계에서 시작된다”며 “표준을 지키지 않은 설계는 시간이 갈수록 유지보수와 활용을 어렵게 만든다”고 덧붙였다.
우리데이터클리닉 V1.0은 최근 굿소프트웨어(GS) 인증도 획득했다. 공공기관 도입 기반을 마련한 만큼 나라장터 등 공공 조달 채널 진입을 추진할 계획이다. 감리업체와 협력해 시스템 구축 감리 과정에서 데이터 구조·표준·값 품질을 전수 점검하는 방안도 추진한다.
박 대표는 “공공 AI의 출발점은 AI가 쓸 수 있는 데이터부터 만드는 것”이라며 “국내 공공기관의 데이터 품질 개선을 지원하고, 장기적으로는 AI 레디 데이터 품질관리 솔루션을 해외 시장에도 선보이겠다”고 말했다.
강성전 기자 castlekang@etnews.com

1 hour ago
1



![[콘텐츠 핫&뉴] ‘카스온라인’, 시즌26 ‘서유기’ 업데이트](https://pimg.mk.co.kr/news/cms/202606/25/news-p.v1.20260625.0c11cbf83faf406eb00c13be0d38040f_R.jpg)
![[플로우 AX 페스타] '리패턴 AI' 핵심 기능 현장서 소개](https://img.etnews.com/news/article/2026/06/25/news-p.v1.20260625.f4f6618c3b474cf79bda2599a5cf904b_P1.jpg)





![[G-브리핑] 컴투스, 임직원 참여형 ESG 플로깅 활동](https://pimg.mk.co.kr/news/cms/202606/11/news-p.v1.20260611.0f1bb9233318459cb7ad7f04a40a2d5c_R.jpg)



English (US) ·