에스에이티정보 “한글로 된 공공문서, 이젠 AI로 쉽게 활용할 수 있는 데이터로 전환해야.”

1 month ago 6
에스에이티정보의 R2-TA 패키지.에스에이티정보의 R2-TA 패키지.

에스에이티정보(대표 오세용)는 공직사회에서 생산되는 보고서와 공공문서가 인공지능(AI)에 제대로 활용되지 못하고 있다는 문제의식이 커지는 가운데, 자사 전자문서 데이터 전처리 솔루션 'R2'을 통해 해법을 제시하고 있다.

공공기관이 오랜 기간 축적해 온 방대한 행정·정책 문서가 존재함에도 상당수가 AI 분석과 학습에 적합하지 않은 형태로 관리되고 있다는 지적이 이어지고 있다.

최근 정부 업무보고 과정에서도 공공 보고서가 AI 활용에 적합하지 않다는 문제가 언급된 바 있다. 공직사회에서 작성되는 보고서가 AI가 읽고 분석하기 어려운 구조로 돼 있어, AI 기반 행정 혁신을 추진하는 데 제약으로 작용하고 있다는 취지다. 특히 공공기관에서 사실상 표준처럼 사용돼 온 한글(HWP) 문서 형식이 AI 분석과 학습 측면에서 구조적인 한계를 안고 있다는 점이 과제로 제기되고 있다.

공공 한글 문서는 사람 중심 보고와 결재 문화에는 최적화돼 있지만, 텍스트와 표, 이미지가 혼합된 비정형 구조와 복잡한 편집 방식으로 인해 AI가 문서 의미와 구조를 정확히 이해하는 데 어려움이 있다는 평가를 받아왔다. 이로 인해 AI 기반 정책 분석이나 보고서 자동 요약, 행정 데이터 활용, 지능형 검색 등 다양한 공공 AI 활용 시도가 현실적인 한계에 부딪히고 있다는 분석이다.

에스에이티정보는 이러한 문제를 해결하기 위해 단순한 파일 형식 변환을 넘어, 한글 문서를 AI가 이해할 수 있는 구조적 데이터로 재구성하는 접근이 필요하다고 보고 있다. 문서 내 본문과 제목, 표, 목차, 주석 등 전체 구조를 정밀하게 분석하고, 의미 단위 기반으로 텍스트를 추출해 정형화함으로써 AI 학습과 검색, 요약, 분석에 바로 활용할 수 있는 데이터로 가공하는 방식이다.

이 같은 접근을 바탕으로 에스에이티정보의 전자문서 데이터 전처리 솔루션 'R2'는 한글(HWP) 문서의 구조와 맥락을 분석해 문서 내용을 의미 단위의 데이터로 전환한다. 기존 공공 문서를 재작성하지 않고도 AI 활용이 가능하도록 하는 데 초점을 맞춘 것이 특징이다.

이를 통해 공공기관은 이미 축적된 보고서와 행정 문서를 그대로 활용하면서도 AI 기반 업무 환경을 구축할 수 있다는 설명이다. 정책 분석 고도화와 업무 효율 향상, 데이터 기반 행정 구현 측면에서 실질적인 도움이 될 수 있다는 평가도 나온다.

에스에이티정보 관계자는 “공공 AI 활용의 성패가 새로운 문서를 만드는 데 있는 것이 아니라, 이미 존재하는 문서 자산을 얼마나 효과적으로 데이터로 전환하고 활용하느냐에 달려 있다”며 “공공문서를 AI가 이해할 수 있는 데이터로 전환하려는 시도가 공공 AI 행정의 중요한 출발점이 될 수 있다”고 말했다.

김현민 기자 minkim@etnews.com

Read Entire Article