핵심 요약
• 구글 딥마인드의 알파폴드가 출시 5주년을 맞이했으며, 지난해 노벨 화학상을 수상
• 알파폴드 데이터베이스는 2억 개 이상의 단백질 구조 예측 정보를 담고 있으며, 전 세계 190개국 350만 명의 연구자가 활용 중
• 알파폴드3는 단백질뿐 아니라 DNA, RNA, 약물까지 예측 범위를 확장
• 딥마인드는 'AI 공동 과학자' 시스템을 통해 과학자들과 협력하는 인공지능 개발에 박차
• 향후 목표는 인간 세포 전체의 정밀 시뮬레이션 구현 구글 딥마인드가 개발한 인공지능 시스템 알파폴드가 출시 5주년을 맞이했다. 지난 몇 년간 알파폴드의 성과를 꾸준히 보도해 왔으며, 지난해에는 노벨 화학상을 수상하는 영예를 안았다. 2020년 11월 알파폴드가 처음 등장하기 전까지, 딥마인드는 인공지능에 고대 보드게임 바둑을 가르쳐 인간 챔피언을 꺾은 것으로 잘 알려져 있었다. 이후 딥마인드는 더 심각한 과제에 도전하기 시작했다. 현대 과학에서 가장 어려운 문제 중 하나인 단백질 접힘 문제에 딥러닝 알고리즘을 적용한 것이다. 그 결과물이 바로 알파폴드2로, 단백질의 3차원 구조를 원자 수준의 정확도로 예측할 수 있는 시스템이다. 알파폴드의 연구는 현재 2억 개 이상의 예측 구조를 담은 데이터베이스 구축으로 이어졌다. 이는 사실상 알려진 모든 단백질 세계를 망라하는 것으로, 전 세계 190개국 약 350만 명의 연구자가 활용하고 있다. 2021년 네이처에 발표된 알고리즘 설명 논문은 현재까지 4만 회 인용됐다. 지난해에는 알파폴드3가 출시되어 인공지능의 역량을 DNA, RNA, 약물로까지 확장했다. 단백질의 무질서 영역에서 발생하는 '구조적 환각' 같은 과제가 남아 있지만, 이는 미래를 향한 한 걸음이다. WIRED는 딥마인드 연구 부문 부사장이자 과학을 위한 AI 부서를 이끄는 푸쉬미트 콜리와 향후 5년간 알파폴드의 방향에 대해 이야기를 나눴다. WIRED: 콜리 박사님, 5년 전 알파폴드2의 등장은 생물학의 '아이폰 순간'으로 불렸습니다. 바둑 같은 게임에서 단백질 접힘이라는 근본적인 과학 문제로의 전환과 그 과정에서 박사님의 역할에 대해 말씀해 주시겠습니까? 푸쉬미트 콜리: 과학은 처음부터 우리 미션의 핵심이었습니다. 데미스 하사비스는 AI가 과학적 발견을 가속화하는 가장 좋은 도구가 될 수 있다는 생각으로 구글 딥마인드를 설립했습니다. 게임은 언제나 시험대였고, 결국 실제 문제를 해결할 기술을 개발하는 방법이었습니다. 제 역할은 AI가 변혁적 영향을 미칠 수 있는 과학적 문제를 식별하고 추진하며, 진전을 이루는 데 필요한 핵심 요소를 파악하고, 이러한 대과제를 해결할 다학제 팀을 구성하는 것이었습니다. 알파고가 증명한 것은 신경망과 계획, 탐색을 결합하면 엄청나게 복잡한 시스템도 마스터할 수 있다는 것이었습니다. 단백질 접힘도 같은 특성을 가지고 있었습니다. 결정적 차이점은 이를 해결하면 생물학과 의학 전반에 걸쳐 사람들의 삶을 실제로 개선할 수 있는 발견이 열린다는 것이었습니다. 우리는 '뿌리 노드 문제'에 집중합니다. 과학계가 해결책이 변혁적일 것이라고 동의하지만, 기존 접근법으로는 향후 5~10년 내에 도달할 수 없는 영역입니다. 지식의 나무처럼 생각하면 됩니다—이러한 뿌리 문제를 해결하면 완전히 새로운 연구 분야가 열립니다. 단백질 접힘은 분명 그런 문제 중 하나였습니다. 앞을 내다보면 세 가지 핵심 기회 영역이 보입니다: 연구 파트너처럼 과학자들과 진정으로 추론하고 협력할 수 있는 더 강력한 모델 구축, 이러한 도구를 지구상의 모든 과학자에게 제공하는 것, 그리고 완전한 인간 세포의 최초 정확한 시뮬레이션 같은 더 대담한 야망에 도전하는 것입니다. 환각에 대해 이야기해 보겠습니다. 창의적인 생성 모델과 엄격한 검증자를 짝지우는 '하네스' 아키텍처의 중요성을 반복적으로 주장해 오셨습니다. 알파폴드2에서 알파폴드3로 넘어오면서, 특히 본질적으로 더 '상상력이 풍부하고' 환각을 일으키기 쉬운 확산 모델을 사용하게 되면서 이 철학은 어떻게 진화했습니까? 핵심 철학은 변하지 않았습니다—우리는 여전히 창의적 생성과 엄격한 검증을 결합합니다. 진화한 것은 이 원칙을 더 야심찬 문제에 어떻게 적용하느냐입니다. 우리는 항상 문제 우선 접근법을 취해왔습니다. 기존 기술을 적용할 곳을 찾는 것이 아니라, 문제를 깊이 이해한 다음 해결에 필요한 것을 구축합니다. 알파폴드3에서 확산 모델로 전환한 것은 과학이 요구한 바였습니다: 개별 단백질 구조뿐만 아니라 단백질, DNA, RNA, 소분자가 어떻게 함께 상호작용하는지 예측해야 했습니다. 확산 모델이 더 생성적이라는 점에서 환각 우려를 제기하신 것은 옳습니다. 이것이 검증이 더욱 중요해지는 부분입니다. 예측이 덜 신뢰할 수 있을 때 신호를 보내는 신뢰도 점수를 구축했으며, 이는 본질적으로 무질서한 단백질에 특히 중요합니다. 그러나 접근법을 진정으로 검증하는 것은 5년에 걸쳐 과학자들이 실험실에서 알파폴드 예측을 반복적으로 테스트해왔다는 것입니다. 실제로 작동하기 때문에 신뢰합니다. Gemini 2.0을 기반으로 가설을 생성하고 토론하는 에이전트 시스템인 'AI 공동 과학자'를 출시하고 계십니다. 이것은 상자 안의 과학적 방법처럼 들립니다. 연구실의 '책임 연구자'가 AI가 되고, 인간은 단지 실험을 검증하는 기술자가 되는 미래로 나아가고 있는 것입니까? 제가 보는 것은 과학자들이 시간을 보내는 방식의 변화입니다. 과학자들은 항상 이중 역할을 해왔습니다—어떤 문제를 해결해야 하는지 생각하고, 그것을 어떻게 해결할지 알아내는 것입니다. AI가 '어떻게' 부분에서 더 많이 도움을 주면, 과학자들은 '무엇', 즉 어떤 질문이 실제로 물을 가치가 있는지에 더 집중할 자유를 갖게 됩니다. AI는 때로는 상당히 자율적으로 해결책 찾기를 가속화할 수 있지만, 어떤 문제가 관심을 기울일 가치가 있는지 결정하는 것은 근본적으로 인간의 영역으로 남습니다. 공동 과학자는 이러한 파트너십을 염두에 두고 설계되었습니다. Gemini 2.0으로 구축된 다중 에이전트 시스템으로 가상 협력자 역할을 합니다: 연구 격차를 식별하고, 가설을 생성하며, 실험적 접근법을 제안합니다. 최근 임페리얼 칼리지 연구자들은 특정 바이러스가 박테리아를 하이재킹하는 방법을 연구하면서 이를 사용했고, 이는 항생제 내성을 다루는 새로운 방향을 열었습니다. 그러나 인간 과학자들이 검증 실험을 설계하고 글로벌 보건에 대한 중요성을 파악했습니다. 중요한 것은 이러한 도구를 적절히 이해하는 것입니다—강점과 한계 모두를요. 그 이해가 과학자들이 이를 책임감 있고 효과적으로 사용할 수 있게 해주는 것입니다. 약물 재목적화나 박테리아 진화에 관한 작업에서 AI 에이전트들이 의견을 달리하고, 그 불일치가 인간 혼자 작업하는 것보다 더 나은 과학적 결과로 이어진 구체적인 사례를 공유해 주실 수 있습니까? 시스템이 작동하는 방식은 매우 흥미롭습니다. 여러 Gemini 모델이 서로 다른 에이전트로 작동하여 아이디어를 생성한 다음, 서로의 가설을 토론하고 비판합니다. 이 아이디어는 증거에 대한 다양한 해석을 탐색하는 이러한 내부 논쟁이 더 정제되고 창의적인 연구 제안으로 이어진다는 것입니다. 예를 들어, 임페리얼 칼리지의 연구자들은 특정 '해적 파지'—다른 바이러스를 하이재킹하는 매혹적인 바이러스—가 박테리아에 침입하는 방법을 조사하고 있었습니다. 이러한 메커니즘을 이해하면 약물 내성 감염을 다루는 완전히 새로운 방법을 열 수 있으며, 이는 분명히 거대한 글로벌 보건 과제입니다. 공동 과학자가 이 연구에 가져온 것은 수십 년간의 출판된 연구를 빠르게 분석하고 임페리얼 팀이 수년간 개발하고 실험적으로 검증한 것과 일치하는 박테리아 유전자 전달 메커니즘에 대한 가설에 독립적으로 도달하는 능력이었습니다. 우리가 정말로 보고 있는 것은 시스템이 가설 생성 단계를 극적으로 압축할 수 있다는 것입니다—방대한 양의 문헌을 빠르게 종합하면서—인간 연구자들은 여전히 실험을 설계하고 발견이 환자에게 실제로 무엇을 의미하는지 이해합니다. 향후 5년을 내다보면, 단백질과 재료 외에 이러한 도구가 도움을 줄 수 있는 '미해결 문제'로 밤잠을 설치게 하는 것은 무엇입니까? 저를 진정으로 흥분시키는 것은 세포가 완전한 시스템으로 어떻게 기능하는지 이해하는 것입니다—그리고 게놈 해독은 그것의 근본입니다. DNA는 생명의 레시피북이고, 단백질은 재료입니다. 우리가 유전적으로 무엇이 다르고 DNA가 변할 때 무슨 일이 일어나는지 진정으로 이해할 수 있다면, 놀라운 새로운 가능성이 열립니다. 맞춤형 의학뿐만 아니라, 잠재적으로 기후 변화에 대처할 새로운 효소 설계와 의료를 훨씬 넘어서는 다른 응용들도요. 그렇긴 하지만, 전체 세포를 시뮬레이션하는 것은 생물학의 주요 목표 중 하나이지만, 아직 갈 길이 멉니다. 첫 번째 단계로, 우리는 세포의 가장 안쪽 구조인 핵을 이해해야 합니다: 유전자 코드의 각 부분이 정확히 언제 읽히는지, 궁극적으로 단백질이 조립되도록 이끄는 신호 분자가 어떻게 생성되는지. 핵을 탐구한 후에는 안쪽에서 바깥쪽으로 작업할 수 있습니다. 우리는 그것을 향해 작업하고 있지만, 몇 년은 더 걸릴 것입니다. 세포를 신뢰성 있게 시뮬레이션할 수 있다면, 의학과 생물학을 변혁시킬 수 있습니다. 합성 전에 약물 후보를 컴퓨터로 테스트하고, 근본적인 수준에서 질병 메커니즘을 이해하며, 개인화된 치료를 설계할 수 있습니다. 이것이 정말로 질문하시는 생물학적 시뮬레이션과 임상적 현실 사이의 다리입니다—컴퓨터 예측에서 실제로 환자를 돕는 치료로 나아가는 것. 이 기사는 원래 WIRED Italia에 게재되었으며 이탈리아어에서 번역되었습니다.