글래스고 슈퍼컴퓨터, 단백질 AI 정확도 28% 향상
페이지 정보
본문
(퍼플렉시티가 정리한 기사)
글래스고 대학교의 과학자들은 원래 천체물리학 연구를 위해 설계된 강력한 슈퍼컴퓨터를 활용하여 전례 없는 정확도로 단백질 상호작용을 예측하는 인공지능 모델을 개발했으며, 이는 암에서 바이러스 감염에 이르는 질병에 대한 약물 발견과 질병 연구를 잠재적으로 가속화할 수 있습니다.
오늘 Nature Communications에 발표된 획기적인 PLM-Interact 모델은 구글의 DeepMind AlphaFold3를 포함한 기존 최첨단 AI 단백질 예측 도구보다 16%에서 28% 더 높은 정확도를 보여줍니다. 이 연구는 의약품 개발 및 팬데믹 대비에 즉각적으로 적용 가능한 계산 생물학 분야의 주요 진전을 나타냅니다.
슈퍼컴퓨터 파워가 정밀도를 이끕니다
에든버러 대학교 암 과학부와 영국 암 연구소 스코틀랜드 연구소의 Ke Yuan 박사가 이끄는 학제간 팀은 영국의 DiRAC 고성능 슈퍼컴퓨터 시설을 사용하여 단백질 언어 모델을 훈련시켰습니다. 원래 이론 물리학자들이 우주 현상을 시뮬레이션하는 것을 돕기 위해 개발된 Tursa 슈퍼컴퓨터는 6억 5천만 개 이상의 매개변수를 포함하는 모델의 신속한 개발을 가능하게 하는 고도로 최적화된 GPU 클러스터에 대한 접근을 제공했습니다.
PLM-Interact는 처음에 421,000개 이상의 인간 단백질 쌍과 그들의 상호작용으로 훈련되었습니다. 그런 다음 이 모델은 5,882개의 인간 단백질과 996개의 바이러스 단백질로부터 얻은 22,383개의 단백질 간 상호작용으로 추가 훈련을 거쳐, 인간과 바이러스 단백질이 어떻게 상호작용하는지 예측하는 데 있어 우수한 성능을 보여주었습니다.
"가장 작은 아원자 입자부터 우주의 가장 큰 규모까지 자연의 법칙을 이해하는 것을 돕기 위해 개발된 DiRAC가 대신 단백질 상호작용의 내부 공간을 탐구하기 위한 이 새로운 모델을 구축하는 데 도움을 주었다고 생각하니 정말 좋습니다"라고 Yuan 박사는 말했습니다.
업계 선두 기업들을 능가하다
비교 실험에서 PLM-Interact는 RNA 중합과 단백질 운반을 포함한 필수 생물학적 기능을 조절하는 다섯 가지 주요 단백질 상호작용을 정확하게 예측했습니다. 반면, AlphaFold3를 포함한 경쟁 단백질 AI 도구들은 다섯 가지 단백질 간 상호작용 중 단 하나만을 성공적으로 예측하였습니다.
모델은 또한, 유전 질환을 유발하는 변이뿐만 아니라 암을 일으키는 필수 단백질 기능을 방해하는 변이 등, 단백질 상호작용에 대한 변이의 영향을 식별하는 데에서도 우수한 능력을 보였습니다. 이러한 능력 덕분에 이 도구는 질병의 분자 수준에서의 기전을 이해하는 데 특히 가치가 있는 것으로 평가됩니다.
Glasgow 대학 CVR 생물정보학 책임자이자 논문의 공동 교신저자인 David L. Robertson 교수에 따르면, COVID-19 팬데믹 기간 동안 바이러스-숙주 상호작용을 신속하게 이해하는 것의 시급함이 이러한 도구가 미래의 전염병 대비에 얼마나 소중할 수 있는지를 보여줍니다. 이 모델은 바이러스가 인간 단백질과 어떻게 상호작용하는지 빠르게 분석할 수 있어, 과학자들이 바이러스 출현과 질병 위험을 더 잘 이해하고, 궁극적으로 신약 및 치료 개발 속도를 높이는 데 기여할 수 있습니다.
이 연구는 AI 기반 신약 개발이 점점 탄력을 받는 가운데 이루어졌으며, 제약 산업은 2025년까지 AI 애플리케이션을 통해 연간 3,500억~4,100억 달러의 가치를 창출할 것으로 예상됩니다. 기존 신약 개발에는 평균 14.6년이 소요되고 약 26억 달러의 비용이 들지만, AI 기반 워크플로는 복잡한 타깃에 대해 기간과 비용을 최대 40%까지 줄일 가능성을 보여주고 있습니다.