구글, 암 돌연변이 탐지 오픈소스 AI 출시
페이지 정보
본문

(퍼플렉시티가 정리한 기사)
구글 리서치는 10월 16일에 딥소매틱(DeepSomatic)을 공개했습니다. 이 오픈소스 AI 모델은 암을 유발하는 유전적 돌연변이의 탐지 능력을 획기적으로 향상시키며, 전 세계적으로 정밀 의료의 발전을 가속할 잠재력을 지니고 있습니다. UC 산타크루즈 게놈 연구소와 아동 자선 병원(Children's Mercy Hospital)과 협력하여 개발된 이 도구는 합성곱 신경망(convolutional neural networks)을 활용해 암세포 내 유전적 변이를 전례 없는 정확도로 식별합니다.
모든 주요 시퀀싱 기술에서 뛰어난 성능
DeepSomatic은 벤치마크 테스트에서 기존 암 분석 도구들을 현저히 능가했으며, Illumina 시퀀싱 데이터에서 삽입 및 결실(indel)을 감지하는 데 있어 90%의 F1 점수를 달성했습니다(현재 방법은 80%). Pacific Biosciences의 롱리드 시퀀싱 데이터에서는 향상이 더욱 두드러졌고, DeepSomatic은 80% 이상의 점수를 기록한 반면 기존 도구들은 50% 미만의 점수를 받았습니다.
Nature Biotechnology에 게재된 이 AI 모델은 암 세포주에서 329,011개의 체세포 변이를 분석하고, 소아 백혈병이나 교모세포종과 같은 공격적인 뇌종양 등 난이도가 높은 사례에서 유전적 돌연변이를 성공적으로 식별했습니다. 소아 백혈병 샘플에서 DeepSomatic은 연구자가 이미 알고 있던 변이 외에 10개의 이전에 발견되지 않은 돌연변이를 추가로 발견했습니다.
포괄적인 오픈소스 공개가 전 세계 연구를 가속화하다
Google Research는 DeepSomatic 모델과 고품질 학습 데이터셋인 CASTLE(Cancer Standards Long-read Evaluation)을 GitHub에서 오픈 소스 라이선스 하에 공개했습니다. CASTLE 데이터셋은 세 가지 주요 플랫폼인 Illumina, PacBio, Oxford Nanopore에서 얻은 전체 유전체 시퀀싱 데이터를 사용하여 유방 및 폐암 샘플에서 얻은 6쌍의 종양-정상 세포주 쌍을 결합하고 있습니다.
“암은 근본적으로 유전 질환이며, 올바른 돌연변이 식별은 정확한 치료를 제공하는 데 매우 중요합니다.”라고 Google 연구진은 밝혔습니다. 이 툴은 학습 데이터셋을 넘어서 초기 연구되지 않은 암 유형에도 적용되어 다양한 연구 및 임상 응용에 대한 다재다능함을 보여줍니다. DeepSomatic은 종양-정상 샘플 쌍 분석뿐만 아니라 건강한 조직 비교가 불가능한 혈액암 등 어려운 종양 단독 케이스도 분석할 수 있습니다.