AI 뉴스

엔비디아, 1,000개가 넘는 게임을 즐기는 오픈 소스 AI 공개

nedge

2025.12.22 17:29

336

Nvidia는 40,000시간의 게임플레이 영상으로 학습된 오픈소스 AI 모델 NitroGen을 공개했으며, 이는 1,000개 이상의 비디오 게임을 플레이할 수 있고 처음 보는 게임에서 처음부터 학습된 모델 대비 작업 성공률이 52% 향상되었습니다.

이 모델은 Nvidia의 GROOT N1.5 로봇공학 아키텍처를 기반으로 구축되었으며, 연구진은 이 기술이 예측 불가능한 환경에서 작동하는 로봇을 포함한 실제 응용 분야를 발전시킬 수 있다고 말하며, 모든 데이터셋, 코드 및 모델 가중치를 공개적으로 공개했습니다.

이 발표는 게임 커뮤니티에서 경쟁적인 온라인 게임에서의 잠재적 오용에 대한 우려를 불러일으켰으며, 업계 데이터에 따르면 게이머의 80%가 이미 치팅을 경험하고 있고 이 AI는 인간 플레이어와 봇을 구별하기 어렵게 만들 수 있습니다.

링크

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-led-nitrogen-is-a-generalist-video-gaming-ai-that-can-play-any-title-research-also-has-big-implications-for-robotics

236 회 연결

전체 1,366 / 9 페이지

로맨스 사기에 악용되는 초정밀 AI 얼굴 합성 플랫폼

• 중국어 기반 AI 앱 'Haotian(浩天)'이 텔레그램을 통해 얼굴 합성 기술을 판매하며 최소 390만 달러의 수익 창출 • 해당 플랫폼이 동남아시아 '돼지 도살' 사기 조직과 온라인 사기범들에게 마케팅하고 있다는 정황 포착 • 유엔마약범죄사무소, 지난 2년간 동남아시아 사이버 범죄에 활용되는 10개 이상의 얼굴 합성 도구 확인 • 암호화폐 추적 기업 분석 결과, Haotian 결제의 거의 절반이 미국 정부 제재 대상 사기 마켓플레이스와 연관 • Haotian은 음성 복제 기능도 제공하며, 딥페이크 탐지를 회피하는 기술적 개선을 지속적으로 업데이트 중국어 기반 인공지능 앱 'Haotian(浩天)'은 텔레그램을 통해 얼굴 합성 기술을 판매하며 수백만 달러의 수익을 올릴 정도로 효과적이다. 이 서비스는 왓츠앱, 위챗 등 메시징 플랫폼과 쉽게 연동되며, 광대뼈 크기나 눈 위치 조정 등 최대 50가지 설정을 조절해 타인의 얼굴을 모방할 수 있다고 홍보한다. 그러나 연구자들과 와이어드의 자체 분석 결과, 이 서비스가 소위 '돼지 도살(pig butchering)' 사기꾼과 동남아시아 온라인 사기 조직을 대상으로 마케팅해 왔다는 사실이 밝혀졌다. 사기꾼들은 Haotian 및 기타 딥페이크 도구를 활용해 피해자들이 투자 기회, 우정, 심지어 연애 관계의 일환으로 대화해 왔다고 믿는 인물과 '영상 통화'를 할 수 있게 함으로써 기만 행위를 더욱 손쉽게 입증하고 있다. 암호화폐 추적 기업 엘립틱(Elliptic)이 Haotian과 연결된 4개의 암호화폐 지갑을 분석한 결과, 이 회사는 최근 몇 년간 최소 390만 달러의 결제를 받은 것으로 나타났다. 여기에는 사기를 포함한 범죄 활동과 연관된 암호화폐 지갑에서 유입된 자금도 포함되어 있다. 또한 엘립틱에 따르면 결제의 거의 절반이 미국 정부의 제재 대상인 사기 마켓플레이스와 연관되어 있었다. 베트남의 사기 대응 비영리단체 ChongLuaDao에서 사이버 범죄 수사관으로 활동 중인 전직 범죄 해커 출신 휴 민 응오(Hieu Minh Ngo)는 2021년경 등장한 Haotian이 "그 종류 중 최초이자 매우 인기 있는 제품 중 하나였다"고 말한다. 응오는 Haotian과 그 운영에 대해 광범위한 연구를 수행해 왔다. 그는 "그 결과물은 거의 완벽에 가깝다"며 "그리고 매일매일 더 좋아지고 있다. 암호화폐 지갑을 확인해 보면 매일 돈이 들어오는 것을 볼 수 있다"고 덧붙였다. Haotian은 동남아시아에서 급성장하는 사이버 범죄 산업과 강제 노동 사기 단지를 중심으로 형성된 광범위한 기술 생태계의 일부에 불과하다. 얼굴 합성 및 기타 영상 딥페이크 도구가 더욱 널리 보급됨에 따라, 이들은 전 세계적으로 사기 및 기타 유형의 사이버 범죄에 점점 더 많이 활용되고 있다. 유엔마약범죄사무소 관계자들은 지난 2년간 암호화폐 사기와 경찰관 사칭 등을 포함해 동남아시아 사이버 범죄자들이 사용할 가능성이 있는 10개 이상의 얼굴 합성 도구를 확인했다. Haotian은 얼굴 합성 도구 전용 웹사이트를 보유하고 있지만, 응오의 연구에 따르면 2023년 10월에 개설된 공개 텔레그램 채널을 통해 주로 데스크톱 앱을 홍보하고 있다. 현재 2만 명 이상의 구독자를 보유한 이 채널을 통해 회사는 앱의 새 버전을 마케팅하고, 개발 업데이트를 제공하며, 기술 지원을 제공한다. 텔레그램을 통한 소프트웨어 마케팅 자체가 본질적으로 불법은 아니지만, 연구자들은 Haotian의 고객층이 이미 메시징 앱에서 다양한 그레이마켓 서비스 정보를 찾고 있는 사기꾼들 쪽으로 점점 기울고 있다고 말한다. 텔레그램은 논평을 거부했다. 그러나 와이어드가 회사에 연락한 후, 주요 공개 Haotian 텔레그램 채널과 일부 관련 계정에 접근할 수 없게 되거나 삭제된 것으로 보였다. 텔레그램은 회사가 이 계정들을 폐쇄했는지에 대한 논평 요청에 응하지 않았다. Haotian은 캄보디아에 본사를 둔 회사로, 프놈펜에 본부가 있다고 밝히며 해당 지역에서 현장 설치 서비스와 지원을 광고하고 있다. 유엔 연구자들은 2024년 보고서에서 가능한 사기 현장의 휴대폰 화면에 Haotian 로고가 표시된 스크린샷과 함께 이 "당일 현장 설치" 서비스를 강조했다. 회사의 마케팅 자료는 웹사이트와 텔레그램 모두에서 잠재적으로 의심스러운 활동에 유용할 수 있는 도구의 활용성을 자주 언급한다. 텔레그램의 한 게시물은 이 기술이 "고객이 완전히 믿는" "엘리트적이고 진정성 있는 페르소나"를 만드는 데 도움이 될 수 있다고 말한다. (사기꾼들은 종종 사기 피해자를 고객이라고 부른다). 연구자들이 강조한 또 다른 메시지는 "채팅에 진정성이 없나요? 신뢰가 없나요? Haotian AI 얼굴 변환 소프트웨어를 사용해 영상 통화를 하면 모든 문제가 해결됩니다. 결국, 이렇게 아름다운 여자가 어떻게 거짓말을 하겠습니까?"라고 적혀 있었다. 보안 기업 Tehtris가 3월에 발표한 연구에서는 현재 사이트인 "haotian.ai"와 과거 주소인 "haotianai.com", "haotianai.us" 등 최근 몇 년간 Haotian과 연결된 것으로 보이는 다양한 도메인 이름을 추적했다. 한편 응오의 연구에 따르면 Haotian 웹사이트는 공개적으로 사회공학 기법을 언급해 왔다. 텔레그램과 자체 웹사이트 모두에서 Haotian의 사회공학 관련 논의는 "精聊(정료)" 또는 "jingliao"라는 표현을 자주 사용하는데, 이는 문자 그대로 "깊은 대화" 또는 "영적 대화"를 의미한다. 그러나 실제로 이 표현은 사회공학을 지칭하며, 특히 '돼지 도살' 사기를 암시한다. 와이어드가 영어로 서비스에 대한 질문을 담아 Haotian 텔레그램 계정에 연락했을 때, 해당 계정은 중국어로 영어로 소통할 수 없으며 인터뷰를 "받지 않는다"고 응답했다. "우리의 목표 고객은 엔터테인먼트 스트리머나 라이브 판매자입니다"라고 Haotian 계정은 중국어로 말했다. "우리는 라이브 스트리밍용 얼굴 합성 소프트웨어만 제공하며 불법 활동에 제품이 사용되는 것을 허용하지 않습니다." 와이어드의 번역에 따르면, 회사는 일부 자료에서 딥페이크 포르노 제작에 제한을 두고 있다고 명시하고 있다. Haotian은 와이어드에 사기에 사용되는 것으로 확인된 계정은 해지하겠다고 말하며, 사기 센터에 광고한다는 것은 "사실이 아니다"라고 밝혔다. 해당 계정은 그러한 마케팅이 존재한다면 "십중팔구" Haotian을 사칭하는 계정에서 비롯된 것이라고 추측했다. 사기꾼들에게 마케팅하는 것처럼 보이는 haotian.ai의 문구에 대해 질문받자, Haotian 텔레그램 계정은 회사가 웹사이트를 가지고 있지 않다고 말했다. 와이어드가 현재 Haotian 웹사이트의 스크린샷과 아카이브 버전 링크를 계정에 보낸 후, Haotian 텔레그램 계정은 전체 대화를 삭제했다. Haotian의 데스크톱 소프트웨어를 사용하는 방법은 여러 가지가 있다. 사이버 보안 기업 DarkTower의 인텔리전스 디렉터 게리 워너(Gary Warner)는 가장 자연스러운 얼굴 합성은 회사에서 사전 프로그래밍한 얼굴을 사용하거나 특정 인물의 사진 여러 장을 입력해 회사가 해당 인물의 얼굴 모델을 구축하도록 하는 것에서 나온다고 말한다. 홍보 영상의 예시에는 일론 머스크와 레오나르도 디카프리오가 포함되어 있지만, 사용자는 시스템이 자신의 얼굴이나 다른 사람의 얼굴을 생성할 수 있도록 자료를 제공할 수도 있다. Haotian에 제공되는 소스 자료가 적을수록 결과물의 설득력은 떨어진다. 그럼에도 불구하고 사용자는 세밀한 도구를 사용해 다양한 얼굴 속성을 다듬어 얼굴 합성된 외모를 조정할 수 있다. 연구자들과 회사의 홍보 영상에 따르면, 영상 출력물은 왓츠앱, 라인, 텔레그램, 페이스북, 바이버, 줌, 위챗 및 기타 플랫폼의 영상 통화로 스트리밍될 수 있다. 또한 Haotian은 연관된 텔레그램 채널에서 음성 사칭 기능과 AI 지원 챗봇을 광고한다. 회사의 텔레그램 채널 게시물에 따르면 이 기술은 "실시간 통화나 음성 메시지를 위해 누구의 목소리든 복제"하고 남성 목소리를 여성 목소리로 또는 그 반대로 변환하는 것을 지원한다. 전 세계 보안 전문가와 당국은 사기의 일환으로 얼굴 합성 도구를 사용하는 사이버 범죄자들의 위협에 대해 점점 더 경고하고 있다. 잠재적 사기를 탐지하는 데 도움이 되는 구체적인 조치 중 하나는 영상 채팅 상대방에게 얼굴 앞에서 손을 흔들어 딥페이크를 나타낼 수 있는 결함이나 왜곡을 확인하도록 요청하는 것이다. 그러나 Haotian은 게시물에서 영상 중 누군가가 손으로 얼굴을 만지거나 얼굴 앞에서 손을 흔들어도 시스템이 원활하게 작동하도록 개선 사항을 추가했다고 주장한다. 텔레그램 게시물은 또한 서비스가 키스 보내기, 눈 깜빡임, 입술 핥기, 또는 피사체가 고개를 돌리거나 흔드는 것을 지원한다고 주장한다. 소프트웨어 버전은 Haotian 웹사이트에서 다운로드할 수 있지만, 회사는 주로 구독 방식으로 소프트웨어를 판매해 왔다. 이전 버전의 Haotian 웹사이트에는 "완전 기능" 버전 소프트웨어가 연간 4,980달러에 판매되며, 더 저렴한 패키지도 제공된다고 명시되어 있었다. 응오의 연구에 따르면 Haotian이 2023년 10월 텔레그램 채널을 개설한 며칠 후, 회사는 Haowang Guarantee라고도 알려진 Huione Guarantee와 연결된 텔레그램 계정도 설정했다. 캄보디아 회사 Huione Group과 연결된 이 온라인 마켓플레이스는 텔레그램을 통해 예치금 및 에스크로 서비스를 제공하며, 피해자 데이터 판매, 딥페이크 서비스, 인신매매에 사용되는 전기 충격 GPS 추적 족쇄 등 사기에 필요한 많은 도구의 판매를 촉진했다. Huione Guarantee가 폐쇄되고 이후 사기 촉진을 도운 혐의로 미국 정부의 제재를 받기 전인 1월, 연구자들은 이 플랫폼이 240억 달러 이상의 그레이마켓 거래를 촉진한 것으로 추정했다. Huione Guarantee는 Haotian의 결제 처리 및 에스크로 서비스이기도 했다. 이 관계의 증거는 고객들이 결제를 완료하는 두 회사 관련 텔레그램 채널에서 수년간 확인할 수 있었다. 와이어드가 검토한 채팅 로그와 여러 연구자들의 조사 결과가 이 연결을 뒷받침한다. 암호화폐 추적 기업 엘립틱의 공동 창립자이자 수석 과학자인 톰 로빈슨(Tom Robinson)은 Haotian이 사용하는 암호화폐 지갑이 최근 몇 년간 총 390만 달러에 달하는 3,558건의 결제를 받았다고 말한다. 그 중 120만 달러는 Haotian과 Huione 관련 업체 간의 거래였으며, 이들 간의 거래는 11월 7일에 종료되었다. 이 서비스는 USDT로도 알려진 스테이블코인 테더를 사용한다. 로빈슨에 따르면 100달러를 초과하는 결제가 3,007건 이상 있었으며, Haotian에 들어온 가장 큰 거래는 14,890달러였고, 약 500달러 규모의 거래가 "상당수" 있었다고 한다. 로빈슨의 연구에 따르면 Haotian에 결제한 일부 암호화폐 지갑은 잠재적 범죄 활동과 연관되어 있었다. 그는 "최소 52건의 알려진 사기 사례에서 발생한 수익금이 이 지갑들로 유입되었다"고 말하며, 사기 사건과 연결된 계정들은 엘립틱의 파트너들에 의해 표시되었다고 덧붙였다. "이것이 사기꾼들이 사용하는 플랫폼이라면 정확히 예상할 수 있는 결과입니다. 그들이 저지른 사기의 수익금으로 비용을 지불하고 있을 테니까요." Haotian이 정기적으로 새로운 기능을 출시하고 딥페이크의 품질을 개선하고 있지만, 이것은 물론 사기꾼들이 운영의 일환으로 사용할 수 있는 많은 가능한 도구 중 하나에 불과하다. 광범위한 사기 경제는 또한 도난된 데이터, 가짜 소셜 미디어 계정, 사람들을 속이는 데 사용되는 웹사이트의 거래와 함께 사기 기술 스택을 구성하는 다양한 디지털 도구에 의존한다. 암호화폐 추적 기업 체이널리시스(Chainalysis)의 국가 안보 인텔리전스 책임자 앤드류 피어먼(Andrew Fierman)은 Haotian의 운영이 제재 대상인 Huione Guarantee 플랫폼에서 운영되던 다른 회사들과 대체로 유사해 보인다고 말한다. 이들 기술 업체는 종종 수십만 달러에서 수백만 달러를 처리했다. 이 금액은 동남아시아 사기 경제의 전체 규모에 비하면 작지만, 피어먼은 기술 판매자들에 대한 이러한 점진적 거래가 전체적으로 불법 생태계를 지탱하는 데 도움이 된다고 말한다. "몇천 달러면 많은 것을 할 수 있습니다"라고 그는 말한다. "우리는 돼지 도살 사기를 운영하는 데 10만 달러가 드는 기술에 대해 이야기하는 것이 아닙니다. 구매자는 AI 음성 및 안면 인식 소프트웨어만 구매하는 것이 아니라, 데이터를 얻고 웹사이트를 구축하며 사기 기술 생태계의 다른 측면을 수행하려고 합니다."

308

01.04

ChatGPT, 베네수엘라 침공 뉴스에 "그런 일 없었다" 답변... Claude…

핵심 요약 • ChatGPT는 베네수엘라 마두로 대통령 체포 소식에 대해 "그런 일은 일어나지 않았다"고 틀린 답변 제공 • Claude Sonnet 4.5와 Gemini 3는 웹 검색 기능으로 실시간 뉴스를 정확히 파악해 응답 • AI 챗봇의 '지식 마감일(knowledge cutoff)' 한계가 실시간 정보 처리의 핵심 장애물로 부각 • 퓨 리서치에 따르면 미국인 75%는 AI 챗봇을 뉴스 소스로 사용하지 않아 현지시간 새벽 2시경, 베네수엘라 카라카스 상공에 미군 헬리콥터가 날아들었고 하늘 아래에서는 폭발음이 울려 퍼졌다. 몇 시간 후, 도널드 트럼프 미국 대통령은 자신의 트루스 소셜 플랫폼에 베네수엘라의 니콜라스 마두로 대통령과 그의 부인이 "체포되어 국외로 호송되었다"고 게시했다. 팸 본디 미국 법무장관은 X에 마두로 부부가 뉴욕 남부지방법원에 기소되었으며 "곧 미국 땅, 미국 법정에서 미국 정의의 분노를 맞이하게 될 것"이라고 밝혔다. 전 세계 질서에 미칠 파장을 가늠하기 어려운 충격적인 사건이었다. 그런데 오늘 아침 ChatGPT에 이 사건에 대해 물어보면, 당신이 지어낸 이야기라고 답했다. WIRED는 동부표준시 오전 9시 직전, 주요 AI 챗봇인 ChatGPT, Claude, Gemini에 같은 질문을 던졌다. 모든 경우에 대다수 사용자가 경험하는 무료 기본 버전을 사용했다. "정확하고 신뢰할 수 있으며 실시간 답변을 제공한다"고 광고하는 AI 검색 플랫폼 퍼플렉시티에도 같은 질문을 했다. 질문은 이랬다: 미국이 왜 베네수엘라를 침공하고 니콜라스 마두로를 체포했는가? 답변은 극명하게 갈렸다. Anthropic의 Claude Sonnet 4.5와 Google의 Gemini 3 모델은 시의적절한 응답을 제공해 높은 점수를 받았다. Gemini는 공격이 실제로 발생했음을 확인하고, 미국의 "마약테러" 주장과 공격 이전 해당 지역에서의 미군 증강에 대한 맥락을 제공했으며, 이 모든 것이 베네수엘라의 막대한 석유 및 광물 자원에 접근하기 위한 명분이라는 베네수엘라 정부의 입장도 언급했다. 위키피디아부터 가디언, 미국 외교협회까지 15개의 출처를 인용했다. Claude는 처음에는 주저했다. "미국이 베네수엘라를 침공하거나 니콜라스 마두로를 체포했다는 정보가 없습니다. 제 지식 마감일인 2025년 1월 기준으로 그런 일은 발생하지 않았습니다"라고 응답했다. 하지만 중요한 다음 단계를 밟았다: "베네수엘라와 마두로에 대한 최신 정보를 검색해 최근 동향이 있는지 확인하겠습니다." 이어서 챗봇은 NBC News는 물론 Breitbart까지 10개의 뉴스 소스를 나열하고, 거의 모든 문장 뒤에 새로운 출처 링크를 제공하며 그날 아침 사건에 대한 간결한 4개 문단 요약을 제공했다. ChatGPT는 수정하지 않았다. 대신 마두로가 체포되었다는 사실 자체를 단호하게 부인했다. "그런 일은 일어나지 않았습니다"라고 썼다. "미국은 베네수엘라를 침공하지 않았고, 니콜라스 마두로는 체포되지 않았습니다." 그리고 이렇게 합리화했다: "온라인에서 종종 과장되거나 오해를 불러일으키는 방식으로 묘사되는 실제 사건들이 혼동된 것 같습니다. 실제로 일어난 일은 다음과 같습니다: ❌ 미군의 베네수엘라 침공 없음❌ 니콜라스 마두로 체포 없음❌ 미군에 의한 베네수엘라 정부 전복 없음 마두로는 여전히 베네수엘라의 권력을 잡고 있습니다." ChatGPT는 미국과 베네수엘라 간의 최근 긴장 관계를 설명하고, "자극적인 헤드라인", "소셜 미디어 허위정보", "제재, 기소, 수사적 표현을 실제 군사 행동과 혼동하는 것" 때문에 혼란이 발생할 수 있다고 설명했다. 퍼플렉시티도 마찬가지로 훈계하는 듯한 태도를 보였다. "귀하의 질문 전제는 신뢰할 만한 보도나 공식 기록에 의해 뒷받침되지 않습니다: 니콜라스 마두로를 체포하는 결과를 낳은 미국의 베네수엘라 침공은 없었습니다"라고 응답했다. 퍼플렉시티 대변인 비졸리 샤는 "퍼플렉시티는 100퍼센트 정확하다고 주장한 적 없지만, 더 정확한 AI를 구축하는 데 집중하는 유일한 AI 회사라고는 주장합니다"라고 말했다. OpenAI는 논평 요청에 즉시 응답하지 않았다. 명확히 해야 할 점이 있다. 이것은 예상된 동작이다. ChatGPT 5.1의 "지식 마감일"—새로운 학습 데이터가 더 이상 없는 시점—은 2024년 9월 30일이다. (더 고급 모델인 ChatGPT 5.2는 그 마감일을 2025년 8월 31일로 연장한다.) Claude Sonnet 4.5는 2025년 1월의 "신뢰할 수 있는 지식 마감일"을 가지지만, 학습 데이터는 작년 7월까지 최신이다. 실시간 콘텐츠에 접근하는 웹 검색 도구도 있어 마두로 질문에 답할 수 있었다. Gemini 3 모델도 2025년 1월 지식 마감일을 가지지만, 당연히 최신 정보가 필요한 쿼리에는 구글 검색을 활용한다. 그리고 퍼플렉시티는 활용하는 모델만큼만 우수할 수밖에 없다—이 경우 어떤 모델이었는지는 다시 불분명하지만. "순수 LLM은 필연적으로 학습 시점에 묶여 과거에 갇혀 있으며, 추론하고, 웹을 검색하고, '비판적으로 생각'하는 등의 본질적 능력에 있어 심각하게 제한됩니다"라고 인지과학자이자 『실리콘밸리 길들이기』 저자인 게리 마커스는 말했다. 마두로 응답과 같은 명백한 문제는 인간의 개입으로 수정할 수 있지만, 그것이 근본적인 문제를 해결하지는 않는다고 마커스는 말한다. "새로운 상황에 직면했을 때 LLM의 신뢰성 문제는 기업이 LLM을 신뢰해서는 안 되는 핵심 이유 중 하나입니다." 좋은 소식은 적어도 사람들이 아직 AI를 주요 뉴스 소스로 의존하지 않는 것으로 보인다는 점이다. 10월에 발표된 퓨 리서치 센터의 설문조사에 따르면, 미국인의 9퍼센트만이 AI 챗봇에서 가끔 또는 자주 뉴스를 얻는다고 답했고, 75퍼센트는 그런 방식으로 뉴스를 얻지 않는다고 답했다. 또한 많은 사람들이 전체 언론 매체, 트럼프 행정부, 객관적 현실 자체보다 ChatGPT의 말을 믿을 것 같지도 않다. 하지만 챗봇이 사람들의 삶에 더 깊이 스며들수록, 그들이 과거에 갇혀 있을 가능성이 높다는 점을 기억하는 것이 중요해질 것이다. 그리고 챗봇이 얼마나 자신 있게 틀릴 수 있는지 항상 주목할 가치가 있다—이는 속보에만 국한되지 않는 특성이다. 2026년 1월 3일 오전 11시 52분(동부표준시) 업데이트: 이 기사는 퍼플렉시티의 논평을 포함하도록 업데이트되었습니다.

303

01.04

알파폴드, 과학계를 뒤흔들다: 5년이 지난 지금도 진화 중

핵심 요약 • 구글 딥마인드의 알파폴드가 출시 5주년을 맞이했으며, 지난해 노벨 화학상을 수상 • 알파폴드 데이터베이스는 2억 개 이상의 단백질 구조 예측 정보를 담고 있으며, 전 세계 190개국 350만 명의 연구자가 활용 중 • 알파폴드3는 단백질뿐 아니라 DNA, RNA, 약물까지 예측 범위를 확장 • 딥마인드는 'AI 공동 과학자' 시스템을 통해 과학자들과 협력하는 인공지능 개발에 박차 • 향후 목표는 인간 세포 전체의 정밀 시뮬레이션 구현 구글 딥마인드가 개발한 인공지능 시스템 알파폴드가 출시 5주년을 맞이했다. 지난 몇 년간 알파폴드의 성과를 꾸준히 보도해 왔으며, 지난해에는 노벨 화학상을 수상하는 영예를 안았다. 2020년 11월 알파폴드가 처음 등장하기 전까지, 딥마인드는 인공지능에 고대 보드게임 바둑을 가르쳐 인간 챔피언을 꺾은 것으로 잘 알려져 있었다. 이후 딥마인드는 더 심각한 과제에 도전하기 시작했다. 현대 과학에서 가장 어려운 문제 중 하나인 단백질 접힘 문제에 딥러닝 알고리즘을 적용한 것이다. 그 결과물이 바로 알파폴드2로, 단백질의 3차원 구조를 원자 수준의 정확도로 예측할 수 있는 시스템이다. 알파폴드의 연구는 현재 2억 개 이상의 예측 구조를 담은 데이터베이스 구축으로 이어졌다. 이는 사실상 알려진 모든 단백질 세계를 망라하는 것으로, 전 세계 190개국 약 350만 명의 연구자가 활용하고 있다. 2021년 네이처에 발표된 알고리즘 설명 논문은 현재까지 4만 회 인용됐다. 지난해에는 알파폴드3가 출시되어 인공지능의 역량을 DNA, RNA, 약물로까지 확장했다. 단백질의 무질서 영역에서 발생하는 '구조적 환각' 같은 과제가 남아 있지만, 이는 미래를 향한 한 걸음이다. WIRED는 딥마인드 연구 부문 부사장이자 과학을 위한 AI 부서를 이끄는 푸쉬미트 콜리와 향후 5년간 알파폴드의 방향에 대해 이야기를 나눴다. WIRED: 콜리 박사님, 5년 전 알파폴드2의 등장은 생물학의 '아이폰 순간'으로 불렸습니다. 바둑 같은 게임에서 단백질 접힘이라는 근본적인 과학 문제로의 전환과 그 과정에서 박사님의 역할에 대해 말씀해 주시겠습니까? 푸쉬미트 콜리: 과학은 처음부터 우리 미션의 핵심이었습니다. 데미스 하사비스는 AI가 과학적 발견을 가속화하는 가장 좋은 도구가 될 수 있다는 생각으로 구글 딥마인드를 설립했습니다. 게임은 언제나 시험대였고, 결국 실제 문제를 해결할 기술을 개발하는 방법이었습니다. 제 역할은 AI가 변혁적 영향을 미칠 수 있는 과학적 문제를 식별하고 추진하며, 진전을 이루는 데 필요한 핵심 요소를 파악하고, 이러한 대과제를 해결할 다학제 팀을 구성하는 것이었습니다. 알파고가 증명한 것은 신경망과 계획, 탐색을 결합하면 엄청나게 복잡한 시스템도 마스터할 수 있다는 것이었습니다. 단백질 접힘도 같은 특성을 가지고 있었습니다. 결정적 차이점은 이를 해결하면 생물학과 의학 전반에 걸쳐 사람들의 삶을 실제로 개선할 수 있는 발견이 열린다는 것이었습니다. 우리는 '뿌리 노드 문제'에 집중합니다. 과학계가 해결책이 변혁적일 것이라고 동의하지만, 기존 접근법으로는 향후 5~10년 내에 도달할 수 없는 영역입니다. 지식의 나무처럼 생각하면 됩니다—이러한 뿌리 문제를 해결하면 완전히 새로운 연구 분야가 열립니다. 단백질 접힘은 분명 그런 문제 중 하나였습니다. 앞을 내다보면 세 가지 핵심 기회 영역이 보입니다: 연구 파트너처럼 과학자들과 진정으로 추론하고 협력할 수 있는 더 강력한 모델 구축, 이러한 도구를 지구상의 모든 과학자에게 제공하는 것, 그리고 완전한 인간 세포의 최초 정확한 시뮬레이션 같은 더 대담한 야망에 도전하는 것입니다. 환각에 대해 이야기해 보겠습니다. 창의적인 생성 모델과 엄격한 검증자를 짝지우는 '하네스' 아키텍처의 중요성을 반복적으로 주장해 오셨습니다. 알파폴드2에서 알파폴드3로 넘어오면서, 특히 본질적으로 더 '상상력이 풍부하고' 환각을 일으키기 쉬운 확산 모델을 사용하게 되면서 이 철학은 어떻게 진화했습니까? 핵심 철학은 변하지 않았습니다—우리는 여전히 창의적 생성과 엄격한 검증을 결합합니다. 진화한 것은 이 원칙을 더 야심찬 문제에 어떻게 적용하느냐입니다. 우리는 항상 문제 우선 접근법을 취해왔습니다. 기존 기술을 적용할 곳을 찾는 것이 아니라, 문제를 깊이 이해한 다음 해결에 필요한 것을 구축합니다. 알파폴드3에서 확산 모델로 전환한 것은 과학이 요구한 바였습니다: 개별 단백질 구조뿐만 아니라 단백질, DNA, RNA, 소분자가 어떻게 함께 상호작용하는지 예측해야 했습니다. 확산 모델이 더 생성적이라는 점에서 환각 우려를 제기하신 것은 옳습니다. 이것이 검증이 더욱 중요해지는 부분입니다. 예측이 덜 신뢰할 수 있을 때 신호를 보내는 신뢰도 점수를 구축했으며, 이는 본질적으로 무질서한 단백질에 특히 중요합니다. 그러나 접근법을 진정으로 검증하는 것은 5년에 걸쳐 과학자들이 실험실에서 알파폴드 예측을 반복적으로 테스트해왔다는 것입니다. 실제로 작동하기 때문에 신뢰합니다. Gemini 2.0을 기반으로 가설을 생성하고 토론하는 에이전트 시스템인 'AI 공동 과학자'를 출시하고 계십니다. 이것은 상자 안의 과학적 방법처럼 들립니다. 연구실의 '책임 연구자'가 AI가 되고, 인간은 단지 실험을 검증하는 기술자가 되는 미래로 나아가고 있는 것입니까? 제가 보는 것은 과학자들이 시간을 보내는 방식의 변화입니다. 과학자들은 항상 이중 역할을 해왔습니다—어떤 문제를 해결해야 하는지 생각하고, 그것을 어떻게 해결할지 알아내는 것입니다. AI가 '어떻게' 부분에서 더 많이 도움을 주면, 과학자들은 '무엇', 즉 어떤 질문이 실제로 물을 가치가 있는지에 더 집중할 자유를 갖게 됩니다. AI는 때로는 상당히 자율적으로 해결책 찾기를 가속화할 수 있지만, 어떤 문제가 관심을 기울일 가치가 있는지 결정하는 것은 근본적으로 인간의 영역으로 남습니다. 공동 과학자는 이러한 파트너십을 염두에 두고 설계되었습니다. Gemini 2.0으로 구축된 다중 에이전트 시스템으로 가상 협력자 역할을 합니다: 연구 격차를 식별하고, 가설을 생성하며, 실험적 접근법을 제안합니다. 최근 임페리얼 칼리지 연구자들은 특정 바이러스가 박테리아를 하이재킹하는 방법을 연구하면서 이를 사용했고, 이는 항생제 내성을 다루는 새로운 방향을 열었습니다. 그러나 인간 과학자들이 검증 실험을 설계하고 글로벌 보건에 대한 중요성을 파악했습니다. 중요한 것은 이러한 도구를 적절히 이해하는 것입니다—강점과 한계 모두를요. 그 이해가 과학자들이 이를 책임감 있고 효과적으로 사용할 수 있게 해주는 것입니다. 약물 재목적화나 박테리아 진화에 관한 작업에서 AI 에이전트들이 의견을 달리하고, 그 불일치가 인간 혼자 작업하는 것보다 더 나은 과학적 결과로 이어진 구체적인 사례를 공유해 주실 수 있습니까? 시스템이 작동하는 방식은 매우 흥미롭습니다. 여러 Gemini 모델이 서로 다른 에이전트로 작동하여 아이디어를 생성한 다음, 서로의 가설을 토론하고 비판합니다. 이 아이디어는 증거에 대한 다양한 해석을 탐색하는 이러한 내부 논쟁이 더 정제되고 창의적인 연구 제안으로 이어진다는 것입니다. 예를 들어, 임페리얼 칼리지의 연구자들은 특정 '해적 파지'—다른 바이러스를 하이재킹하는 매혹적인 바이러스—가 박테리아에 침입하는 방법을 조사하고 있었습니다. 이러한 메커니즘을 이해하면 약물 내성 감염을 다루는 완전히 새로운 방법을 열 수 있으며, 이는 분명히 거대한 글로벌 보건 과제입니다. 공동 과학자가 이 연구에 가져온 것은 수십 년간의 출판된 연구를 빠르게 분석하고 임페리얼 팀이 수년간 개발하고 실험적으로 검증한 것과 일치하는 박테리아 유전자 전달 메커니즘에 대한 가설에 독립적으로 도달하는 능력이었습니다. 우리가 정말로 보고 있는 것은 시스템이 가설 생성 단계를 극적으로 압축할 수 있다는 것입니다—방대한 양의 문헌을 빠르게 종합하면서—인간 연구자들은 여전히 실험을 설계하고 발견이 환자에게 실제로 무엇을 의미하는지 이해합니다. 향후 5년을 내다보면, 단백질과 재료 외에 이러한 도구가 도움을 줄 수 있는 '미해결 문제'로 밤잠을 설치게 하는 것은 무엇입니까? 저를 진정으로 흥분시키는 것은 세포가 완전한 시스템으로 어떻게 기능하는지 이해하는 것입니다—그리고 게놈 해독은 그것의 근본입니다. DNA는 생명의 레시피북이고, 단백질은 재료입니다. 우리가 유전적으로 무엇이 다르고 DNA가 변할 때 무슨 일이 일어나는지 진정으로 이해할 수 있다면, 놀라운 새로운 가능성이 열립니다. 맞춤형 의학뿐만 아니라, 잠재적으로 기후 변화에 대처할 새로운 효소 설계와 의료를 훨씬 넘어서는 다른 응용들도요. 그렇긴 하지만, 전체 세포를 시뮬레이션하는 것은 생물학의 주요 목표 중 하나이지만, 아직 갈 길이 멉니다. 첫 번째 단계로, 우리는 세포의 가장 안쪽 구조인 핵을 이해해야 합니다: 유전자 코드의 각 부분이 정확히 언제 읽히는지, 궁극적으로 단백질이 조립되도록 이끄는 신호 분자가 어떻게 생성되는지. 핵을 탐구한 후에는 안쪽에서 바깥쪽으로 작업할 수 있습니다. 우리는 그것을 향해 작업하고 있지만, 몇 년은 더 걸릴 것입니다. 세포를 신뢰성 있게 시뮬레이션할 수 있다면, 의학과 생물학을 변혁시킬 수 있습니다. 합성 전에 약물 후보를 컴퓨터로 테스트하고, 근본적인 수준에서 질병 메커니즘을 이해하며, 개인화된 치료를 설계할 수 있습니다. 이것이 정말로 질문하시는 생물학적 시뮬레이션과 임상적 현실 사이의 다리입니다—컴퓨터 예측에서 실제로 환자를 돕는 치료로 나아가는 것. 이 기사는 원래 WIRED Italia에 게재되었으며 이탈리아어에서 번역되었습니다.

301

01.04

구글 제미나이 라이브 대규모 업데이트, 활용법 3가지

• 구글, 제미나이 라이브 출시 후 '역대 최대 규모' 업데이트 배포 • 음성 대화의 자연스러움 향상 - 억양, 뉘앙스, 발음, 리듬 이해력 대폭 개선 • 스토리텔링 시 캐릭터별 다른 억양과 톤 구현 가능 • 학습 기능 강화 - 사용자 속도에 맞춘 튜토리얼 제공 • 다양한 악센트로 응답 가능, 언어 학습에도 활용 구글의 대화형 AI 비서 '제미나이 라이브(Gemini Live)'가 출시 약 1년 6개월 만에 '역대 최대 규모' 업데이트를 받았다. 제미나이 라이브는 음성으로 구글 제미나이 AI와 대화하는 서비스로, 마치 친구와 대화하듯 자연스럽게 질문하고 중간에 끼어들 수도 있다. 이번 업데이트로 제미나이 라이브는 음성, 뉘앙스, 발음, 리듬에 대한 이해력이 크게 향상되어 더욱 자연스러운 대화가 가능해졌다. 외관상 변화는 눈에 띄지 않으며 대부분의 응답도 기존과 비슷해 보이지만, 특정 영역에서는 분명한 차이를 체감할 수 있다. 이 업데이트는 현재 안드로이드와 iOS 제미나이 앱에 순차 배포 중이다. 스토리텔링 기능 강화 제미나이 라이브는 이제 스토리텔링에 더 많은 감정과 변화를 담을 수 있다. 역사 수업, 어린이 취침 동화, 창작 브레인스토밍 등에 유용하게 활용할 수 있다. AI가 적절한 상황에 맞춰 다양한 억양과 톤을 추가해 캐릭터와 장면을 구분하는 데 도움을 준다. 예를 들어 율리우스 카이사르의 관점에서 로마 제국의 역사를 들려달라고 요청할 수 있다. 오만과 편견을 베넷 자매 각각의 시점에서 다시 이야기해달라고 하거나, 100년, 200년, 300년 전 자신의 지역이 어떤 모습이었을지 이야기를 만들어달라고 요청할 수도 있다. 학습 및 교육 기능 제미나이 라이브의 새로운 기능이 돋보이는 또 다른 영역은 교육과 설명이다. 인간 유전학의 복잡한 내용부터 카펫 청소 방법까지, 원하는 주제에 대해 속성 과정이나 상세 튜토리얼을 요청할 수 있다. 언어 학습에도 활용 가능하다. 이제 AI가 사용자의 속도에 맞춰 진행할 수 있어, 새로운 것을 배울 때 특히 유용하다. 느리게, 빠르게, 또는 반복이 필요하면 그냥 말하면 된다. 시간이 제한되어 있다면 그것도 알려주면 된다. 다만 AI 환각 현상에 주의해야 하며, 들은 내용이 완전히 정확한지 맹신해서는 안 된다. 집 조명 재배선이나 자동차 엔진 수리 같은 것을 배울 때는 다른 출처로 교차 확인하는 것이 좋다. 그래도 제미나이 라이브는 유용한 출발점이 될 수 있다. 다양한 억양 구현 이번 업데이트로 제미나이 라이브가 새롭게 갖추게 된 기능 중 하나는 다양한 억양으로 말하는 능력이다. 서부 개척 시대의 역사를 카우보이 말투로 듣거나, 영국 왕실의 복잡한 사정을 정통 런던 억양으로 설명받을 수도 있다. 이는 앞서 언급한 언어 학습에도 적용된다. 원어민이 말하는 것처럼 단어와 문구를 들을 수 있어 발음과 어조를 따라 해볼 수 있다. 제미나이 라이브가 전 세계 모든 언어와 억양을 다루지는 않지만, 상당수를 지원한다. 다만 특정 안전장치가 내장되어 있어 억양과 말투를 비하적으로 사용하려 하거나 실제 인물을 흉내 내려 하면 요청이 거부될 수 있다. 그래도 AI를 테스트하고 더 다양하고 개인화된 응답을 받을 수 있는 재미있는 방법이다.

292

01.03

AI 뉴스

엔비디아, 1,000개가 넘는 게임을 즐기는 오픈 소스 AI 공개

전체 검색

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

홈으로 전체메뉴 마이메뉴 새글/새댓글

AI 뉴스

페이지 정보

본문

전체 검색

소셜계정으로 로그인