[ET단상] 의료 AI 대전환 시대, 단백질 빅데이터가 '승부처'다

6 days ago 3
강운범 베르티스 바이오마커연구소장강운범 베르티스 바이오마커연구소장

바야흐로 '인공지능(AI) 대전환 시대'이다.

정부는 '모두의 AI'를 기치로 포용적이고 책임 있는 생태계 구축에 속도를 내고 있으며 산업 전반에서 AI 혁신이 확산하고 있다. 바이오 분야에서도 단백질 구조 예측, 신약 후보물질 탐색, 영상 판독, 예후 예측 등 다양한 영역에서 AI가 혁신의 새로운 동력으로 부상했다. 이처럼 AI의 활용 범위가 넓어질수록, 데이터의 품질이 AI 성능의 핵심으로 부상하고 있다.

AI의 성능은 이제 연산 규모가 아니라 데이터의 품질과 희소성이 가른다. 인류가 축적한 공개 데이터는 대부분 이미 학습에 활용됐고, 기존 데이터를 단순히 조합하거나 재가공하는 것만으로는 차별적 경쟁력을 확보하기 어렵다. 결국 AI 산업의 승부처는 누가 더 신뢰도 높고 희소한 데이터를 확보하는지에 달려 있다.

그 중에서도 생명과학 데이터는 AI 산업의 미개척 영역으로 꼽힌다. 그 중심에 있는 것이 단백질이다. 유전자가 질병의 가능성을 보여주는 설계도라면, 단백질은 그 설계의 작동 방법을 보여주는 생명 현상의 실체다. 질병의 발생과 약물 반응, 면역 반응, 노화, 대사 등 인체 변화를 직접적으로 유발하고 그 결과가 반영되는 것이 단백질이다. 그래서 단백질 데이터는 의료를 넘어 신약개발, 헬스케어까지 바이오 산업 전반의 혁신을 가능케 하는 기반 인프라다. 단백질은 AI 의료의 판도를 바꾸고, 국가 기술주권과 바이오 경제의 향배를 좌우하는 전략 자산이다.

세계 각국은 이미 단백질 빅데이터 확보 경쟁에 나섰다. 영국은 영국 바이오뱅크(UK Biobank)로 60만명의 혈액 샘플에서 5400종의 단백질을 분석하는 프로젝트에 착수했고, 14개 글로벌 제약사가 공동 참여하고 있다. 중국은 '파이허브(π-HuB)' 프로젝트로 30년간 수조원을 투입해 인체 단백질 지도 완성을 추진 중이며, 미국은 국립암연구소(NCI) 주도의 임상단백체분석컨소시엄(CPTAC)을 통해 암 단백질 데이터베이스를 구축하고 있다.

우리나라 역시 바이오 빅데이터 구축사업을 추진 중이다. 2024~2028년 1단계 기간에 약 77만명 모집을 계획하고 있으며, 최종적으로 100만명 규모의 통합 바이오 빅데이터 구축이 목표다. 그러나 유전자 중심 설계 탓에 단백질 데이터의 양과 깊이, 산업계와의 연계성 측면에서는 선진국에 비해 여전히 부족한 상황이다.

다행히 한국은 이미 학계와 산업계 전반에서 단백질 분석과 질병 바이오마커 연구 등 프로테오믹스(단백체학) 분야의 경쟁력을 빠르게 키워 왔으며, 이러한 기술은 실제 의료 현장에서도 활용되고 있다.

혁신은 기술력 위에 방향을 세울 때 비로소 완성된다. '콜럼버스의 달걀' 일화가 보여주듯, 혁신은 기존의 틀을 깨는 데서 비롯된다. 이미 만들어진 길을 걷는 것은 누구나 할 수 있지만 첫 길을 여는 것은 오직 선도자의 몫이다. 그 첫걸음은 변화의 흐름을 예견하고, 그 가능성을 과학과 데이터로 현실화하려는 지적 도전에서 비롯될 것이다.

우리는 반도체와 같은 기술집약 산업에서 세계가 주목한 혁신 역량을 입증해 왔다. 이제 그 역량을 바이오와 AI로 확장해 단백질을 미래 산업의 반도체로 키워가야 한다. 바이오 빅데이터 구축사업의 중간 점검 단계에 접어든 지금, 단백질 데이터를 확대하고 학계와 산업계가 함께하는 생태계를 조성해야 한다. AI 기술이 아무리 발전해도 학습할 재료가 없다면 진보는 없다. 앞으로 의료 AI의 경쟁력은 얼마나 깊고 정확한 단백질 데이터를 확보하고, 그 데이터를 산업 경쟁력으로 전환하는지에 달려 있다.

강운범 베르티스 바이오마커연구소장 unbeom.kang@bertis.com

Read Entire Article