단백질은 생명현상의 기본 단위이며, 그 3차원 구조가 기능을 규정한다는 사실은 분자생물학의 핵심 원리다. 전통적으로 단백질 구조는 X-선 결정학, NMR 등 고가의 실험 장비를 통한 관측에 의존했으며, 구조를 밝히는 데 수개월에서 수년이 소요됐다. 이러한 구조 정보의 부족은 신약 개발과 기능성 단백질 연구의 큰 병목이었다. 하지만 인공지능(AI)은 이 병목을 극복하는 혁신적 방법을 제시했다.
2024년 노벨화학상은 AI를 활용한 단백질 구조 예측과 설계 기법에 수여되었다. 구글 딥마인드의 알파폴드(AlphaFold)와 데이비드 베이커 교수의 계산적 단백질 설계법이 그 대표적 사례다. 특히 알파폴드2는 방대한 단백질 데이터 기반 학습을 통해 2억 여개 이상의 단백질 구조를 정확히 예측하며, 기존 구조 결정법 대비 획기적으로 시간을 단축하고 신뢰도를 확보했다. 이는 AI 기반 단백질 구조 예측이 이제 실험적 방법을 상당 부분 대체할 수 있는 수준에 도달했음을 의미한다.
단백질 구조 예측 기술의 또 다른 진전은 AI를 통한 동적 구조 및 기능 예측이다. 최근 국제학술지 사이언스에 발표된 BioEmu 모델은 기존 분자역학 시뮬레이션이 수천 시간 이상 필요한 단백질 동역학을 몇 분 만에 구현하는 성과를 달성했다. BioEmu는 알파폴드에서 차용된 진화 기반 변환기 기술과 대규모 실험·시뮬레이션 데이터를 결합해 단백질의 구조, 안정성, 기능적 변화까지 예측할 수 있어 신약 개발의 병목 해소 및 설계 효율성을 크게 높일 잠재력을 보여준다.
세계적 동향: AI 기반 단백질 예측 및 설계의 지형 변화
단백질 AI의 중심에는 구조 예측에서 설계로의 확장이라는 맥락적 진화가 있다. 전통적 예측 모델이 단백질 구조를 제공하는 파운데이션 모델 역할을 했다면, 설계 모델은 이를 기반으로 신약 후보 단백질을 직접 생성하는 수준까지 나아갔다. 이 변화의 선두에는 AI를 활용한 드노보(de novo) 단백질 설계 분야가 자리한다.
미국 워싱턴대의 베이커 교수는 기존 로제타 소프트웨어를 확장해 단백질 구조가 아닌 맞춤형 단백질 설계 역량까지 확보하는 데 성공했다. 이는 단백질의 고유 기능을 설계 목표로 삼아 질병 타깃 분자를 처음부터 설계할 수 있는 능력을 의미한다. 이 같은 접근법은 예측만으로는 해결할 수 없는 기능적 약물 후보 개발, 효소 설계, 백신 및 나노물질 설계 등 다양한 응용을 가능하게 한다.
구글 딥마인드는 2024년 알파폴드3를 오픈 소스로 공개하며 AI 기반 단백질 연구의 민주화를 촉진했다. 알파폴드3는 이전 모델보다 DNA나 다른 분자와의 상호작용까지 예측할 수 있는 기능적 확장을 포함한다. 이 소스 공개 결정은 학계와 연구자들 사이의 검증 가능성 문제와 재현 가능성 논란을 해소하기 위한 조치로, AI 생명과학 연구의 투명성과 생태계 확장을 강화할 것으로 평가된다.
또한 BioEmu와 같은 AI 기반 분자역학 모델의 등장은 구조 안정성과 기능적 변화 재현을 가능하게 함으로써, AI가 단순히 정적 구조를 예측하는 수준을 넘어 생체 분자가 실제 환경에서 어떻게 작동하는지까지 예측하는 방향으로 진화하고 있음을 보여준다.
한국 단백질 AI의 현황과 생태계
한국에서도 AI 기반 단백질 연구는 빠르게 현실화되고 있다. 대표적으로 서울대에서 AI 기반 단백질 설계 회사 갤럭스(Galux)를 설립해 갤럭스 디자인이라는 AI 플랫폼을 개발했다. 이 플랫폼은 단백질 구조 예측을 넘어 새로운 항체를 드노보 방식으로 설계하는 데 성공했다. 석 교수 연구진은 9종의 드노보 항체 설계를 진행했으며, 이는 자연계에 존재하지 않는 구조를 설계하는 실증적 성과로 평가된다. 실제로 2024년 12월에는 자연에 없는 단백질을 AI로 설계해 실험실 조건에서 항체가 정확히 타깃에 결합함을 확인하는 성과를 발표하며, 글로벌 단백질 AI 설계 성공 사례 중 세계 두 번째로 기록되기도 했다.
이 같은 설계 성과는 단백질 AI가 단순히 구조 예측을 하는 도구를 넘어 신약 후보 물질 발굴의 초기 단계에서 효능과 안전성을 고려한 설계까지 수행 가능함을 시사한다. 이는 신약 개발 초기 단계의 실패 가능성을 줄이고, 시간 및 비용 효율성을 극적으로 향상할 수 있는 잠재력을 갖는다.
단백질 AI의 도전 과제와 미래 방향
그럼에도 불구하고 단백질 AI는 몇 가지 중요한 도전 과제를 안고 있다. 구조 예측의 정확도 자체는 크게 향상됐지만, 항체처럼 구조가 불규칙한 단백질은 여전히 예측 난이도가 높다. 또한 GPT-계열 대형언어모델(LLM) 기반 기술로는 단백질 문제를 해결할 수 없고, 생명과학 문제 특화 아키텍처가 필수적이라는 점이 전문가들에 의해 지적되고 있다.
한국에서도 과학 AI역량 강화 및 해당 분야 인재 양성이 필요하다는 의견이 있다. 여기에는 생명과학 전문성과 AI 기술을 동시에 갖춘 연구자 육성, 학계-기업 협력 생태계 활성화, 신약 개발 과정에서 AI 활용을 제도적으로 뒷받침할 수 있는 정책 지원 등이 포함된다.
향후 단백질 AI는 구조 예측 → 기능적 변화 예측 → 설계로 이어지는 전체 파이프라인을 완성함으로써, 신약 개발의 패러다임을 근본적으로 전환할 가능성을 지닌다. 특히 예측·생성·설계 모델이 통합된 플랫폼은 신약 후보물질의 발견, 최적화, 초기 검증까지의 전 과정을 효율화할 잠재력을 갖는다.
결론
단백질 AI는 과학적 도전과 산업적 기회를 동시에 품고 있는 기술 혁신의 최전선이다. 2024년 노벨화학상 수상은 이 분야가 이미 단순 실험 보조 수준을 넘어 기초과학을 재정의할 수준임을 증명했으며, BioEmu와 같은 고속 동역학 예측 기술은 이를 더욱 확장하고 있다.
한국 또한 AI 설계 기반 신약 후보 개발에서 눈에 띄는 실증적 성과를 내고 있으며, 글로벌 경쟁력 확보를 위한 생태계 조성이 활발해지고 있다. 향후 정책적·산업적 지원이 뒷받침된다면, 한국은 단백질 AI 기술을 신약 개발의 핵심 경쟁력으로 체계적 자리매김시킬 수 있을 것이다.
#AI #바이오 #단백질AI #AlphaFold #알파폴드 #신약개발 #Biopharma #바이오제약