[기고] AI 데이터 증강, 국방을 위한다면 전장 설계가 우선이다

1 hour ago 1

국방 인공지능(AI) 분야에서 특히 주목받는 기술은 데이터 증강과 합성 기법이다. AI가 주어진 것 이상의 새로운 데이터를 스스로 만들어내야 할 때, 기존 데이터를 변환해 데이터의 다양성을 늘리는 것을 증강, 아예 새로운 데이터를 생성하는 걸 합성이라고 한다. 전시 상황은 극단적이면서 불확실성이 높고 적의 기만책 등으로 인해 충분한 데이터를 확보할 수 없는 만큼 증강과 합성을 통해 AI의 견고성을 높이는 일이 필수적이다.

문제는 무엇을 증강하느냐다. '1+2=3'이라는 기존 데이터를 2+3, 100+200으로 증강한들 AI의 수학 실력이 좋아지지는 않는다. 수학이라는 기대공간을 먼저 체계적으로 설계해야만 곱셈, 방정식, 미적분이라는 데이터 증강을 통해 실제 역량을 발전시킬 수 있다.

전장 데이터도 마찬가지다. 표적 이미지를 회전시키고, 밝기를 바꾸고, 노이즈를 섞었다고 해서 AI가 돌발 상황에 더 잘 대처하게 되지는 않는다. 사람 눈에는 달라 보여도 AI 학습 관점에서는 같은 상황에 대한 중복 데이터일 뿐이기 때문이다.

데이터 증강은 데이터 용량을 늘리자고 하는 일이 아니다. AI가 주어진 데이터 이상의 현실을 접할 수 있게 해 실제 전장에서 더 나은 판단을 할 수 있게끔 만들기 위함이다. 그러려면 AI에 추가로 '어떤 현실을 보게 만들지' 먼저 설계해야 한다. 또 그 설계가 설계자의 느낌이나 주관에 의지해서도 안 된다. 담당자가 바뀌더라도 완벽한 인수인계가 가능하게끔, 공학적으로 재현 가능한 방식이어야 한다.

그렇기에 중요한 것은 현실의 조건을 많이 나열하는 게 아니라 조건 사이의 관계를 설계하는 일이다. 이를테면 전장에서 어떤 원인이 어떤 결과에 영향을 미치는지, 원인과 원인이 동시에 발생하면 어떤 논리 관계가 형성되는지, 하나의 결과가 다른 결과에 어떤 의존성을 갖는지를 기술적으로 설계해야 한다. 영상 자체의 특성, 탐지하려는 개체의 특성, 간섭의 특성 등은 식별률에 영향을 주고, 시계열의 노이즈 패턴은 패턴 식별이나 추세 예측에 영향을 주게 된다. 이런 원인-결과, 원인-원인, 결과-결과 간 관계를 구조화했을 때 비로소 '무엇을 증강할지'가 나오게 된다.

국제표준 ISO/IEC 5259-2에서 말하는 충실도(Fidelity) 역시 단순히 데이터가 다양하게 보이는지, 통계적 분포는 어떠한지를 의미하는 것이 아니라, 데이터가 기대하는 현실의 공간을 얼마나 제대로 담고 있는지를 측정한다. 전장 상황에 대한 기대공간을 먼저 설계하고, 그 공간에서 비어 있는 조건을 찾아 최적화된 증강이나 합성 작업을 진행하는 것이다. 이런 기법 하에서는 비어 있는 현실을 무한정 만들 필요가 없다. AI의 판단력에 도움을 주는 기대공간의 조건을 공학적으로 줄이고, 묶고, 대표 조합으로 뽑아내 효율적으로 진행하면 된다. 그러면 왜 꼭 그 데이터를 증강해야 하는지 설명할 수 있으며, 같은 절차를 다시 적용했을 때도 유사한 결과가 나오게끔 객관성을 확보할 수 있다.

실제 비교 실험 결과, 이런 방식으로 설계한 2000장의 데이터가 무작정 수집한 5만장의 데이터보다 더 높은 견고성을 보였다. AI는 데이터가 많아서 강해지는 것이 아니라, 강해지게끔 정확히 설계된 데이터가 주어졌을 때 강해진다.

핵심은 증강 플랫폼 자체가 아니라 증강해야 할 현실을 설계하는 기술이다. 국방 AI는 세상에서 가장 극단적이면서 불확실한 현실에 대응해야 한다. 기존 데이터로 파악하지 못했던 현실에 대처하는 AI의 견고성이 유사시에는 엄청난 인명 손실을 막을 수 있다. 인명이 막중하고 전장이 엄혹한 만큼, 국방 기술은 철저히 객관적이고 공학적이어야 한다.

박지환 씽크포비엘 대표 jihwan.park@thinkforbl.com

Read Entire Article