Loading...

AI 뉴스

구글 딥마인드, 가상 세계를 위한 제미나이 기반 AI 에이전트 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.14 17:35
1,509 조회
0 추천
0 비추천

본문

f9808763c6f7a5cb1ce12959ca3fb61a_1763109246_17.png
(퍼플렉시티가 정리한 기사)


Google DeepMind는 목요일에 SIMA 2를 발표했습니다. 이는 회사의 Gemini 언어 모델을 통합하여 3D 가상 환경을 탐색하고 상호작용하는 차세대 AI 에이전트로, 연구원들이 인공 일반 지능과 실제 로보틱스 응용 분야를 향한 진전이라고 설명하는 것을 나타냅니다.

DeepMind에 따르면, 이 새로운 에이전트는 전작 대비 성능이 크게 향상되어 복잡한 작업의 성공률을 두 배로 높였습니다. 원래 SIMA가 어려운 과제에서 인간 플레이어의 71%에 비해 31%의 완료율만 달성한 반면, SIMA 2는 Gemini 2.5 Flash-lite 통합을 통해 향상된 기능을 보여줍니다.


향상된 추론 및 자기 개선

SIMA 2는 단순한 지시 따르기를 넘어 맥락을 이해하고, 목표에 대해 추론하며, 사용자와 대화할 수 있다고 DeepMind의 선임 연구 과학자 Joe Marino가 기자 브리핑에서 설명했다. 이 에이전트는 이모지를 포함한 멀티모달 프롬프트를 해석할 수 있으며—“????????”와 같은 명령에 나무를 베어 넘어뜨리는 것으로 반응한다—작업을 해결할 때 내부 추론 과정을 보여준다.

이 에이전트는 No Man’s Sky, Valheim, Goat Simulator 3 등 다양한 상용 비디오 게임에서 훈련되었으며, 화면 픽셀과 가상 키보드 및 마우스 컨트롤만을 사용하여 600개 이상의 동작을 실행하는 방법을 학습했다. DeepMind는 또한 자사의 월드 모델인 Genie 3가 생성한 사실적인 세계에서 SIMA 2를 테스트했으며, 에이전트는 완전히 새로운 환경에서 성공적으로 탐색하고 작업을 완료했다.

아마도 가장 주목할 만한 점은 SIMA 2의 자기 개선 능력이다. 전적으로 인간 게임플레이 데이터에 의존했던 SIMA 1과 달리, 새로운 시스템은 Gemini 모델을 사용하여 작업을 생성하고 자체 성능을 평가하며, 인간의 개입보다는 AI 기반 피드백을 통한 시행착오로 학습한다.


물리적 로봇공학으로 가는 길

DeepMind는 SIMA 2를 범용 로봇을 위한 기초적인 기술로 제시하고 있습니다. “로봇과 같이 실제 세계에서 작업을 수행하기 위해 시스템이 해야 할 일을 생각해보면 두 가지 구성 요소가 있습니다”라고 DeepMind의 수석 연구 엔지니어인 Frederic Besse는 말했습니다. “첫째, 실제 세계에 대한 높은 수준의 이해와 수행해야 할 작업, 그리고 약간의 추론이 필요합니다”.

그러나 전문가들은 신중한 입장을 표명하고 있습니다. 뉴욕 대학교의 AI 연구원인 Julian Togelius는 결과가 흥미롭다고 평가하면서도, 시각적 관찰만으로 여러 게임에 걸쳐 모델을 훈련시키는 것은 여전히 어려운 과제라고 지적합니다. 앨버타 대학교의 Matthew Guzdial은 로봇공학에 얼마나 많은 지식이 전이될 수 있을지 의문을 제기하며, 실제 세계의 카메라 영상을 이해하는 것이 인간 플레이어를 위해 설계된 게임 그래픽을 해석하는 것보다 훨씬 더 복잡하다고 언급했습니다.

DeepMind는 SIMA 2를 소수의 학계 및 게임 개발자 그룹에게 제한된 연구 프리뷰로 공개하고 있습니다.

댓글 0
전체 1,366 / 25 페이지
OpenAI는 화요일에 2026년까지 인공 일반 지능에 도달하는 것은 더 강력한 모델을 개발하는 것만큼이나 사용자가 AI를 효과적으로 채택하도록 돕는 것에 달려 있다고 발표했으며, AI가 할 수 있는 것과 대부분의 사람들이 실제로 사용하는 것 사이에 “능력 격차”가 있다고 지적했다.이 회사의 전환은 조사 대상 근로자의 75%가 AI가 속도나 품질을 향상시켜 매일 40~60분을 절약한다고 보고하는 데이터 가운데 이루어졌지만, 일반 직원보다 6배 많은 AI 메시지를 보내는 “선도” 사용자들과의 격차가 존재한다.OpenAI의 2026년 로드맵은 이제 의료, 비즈니스 운영 및 일상생활에서 “배포 격차”를 줄이는 것을 강조하며, 케냐 파트너십과 같은 실제 배포를 통해 39,849건의 환자 방문에서 진단 오류를 16% 감소시켰다.
558 조회
0 추천
2025.12.25 등록
웨어러블 AI 시장은 원격의료 플랫폼과의 통합으로 지속적인 건강 모니터링과 예측 진단이 가능해지면서 2025년 363억 8천만 달러에서 2030년 658억 달러로 연평균 12.4%의 성장률로 증가할 것으로 예상됩니다.삼성전자는 Galaxy Ring에 전고체 배터리 기술을 적용하여 연중무휴 의료급 모니터링을 구현하고 있으며, Philips와 Masimo는 실시간 환자 데이터를 위해 무선 센서를 임상 모니터링 대시보드에 통합하는 파트너십을 맺었습니다.Apple과 Alphabet은 각각 HealthKit 생태계와 Gemini AI 기반 Fitbit을 통해 경쟁하고 있으며, DexCom은 연속 혈당 모니터링을 위한 최초의 생성형 AI 플랫폼을 출시했고, FDA는 의료 관련 주장에 대한 규제 심사를 강화하고 있습니다.
578 조회
0 추천
2025.12.25 등록
• Google은 디스플레이 하단에 단일 행의 떠 있는 입력 상자를 배치한 새로운 Gemini 인터페이스를 테스트하고 있다. 이 디자인은 첨부 파일, 모델 선택기 같은 고급 도구들을 통합된 플러스(Plus) 버튼 뒤로 모아 시각적 혼잡을 줄이는 방식이며, 이는 Google 앱 16.51.52 버전 코드에서 발견된 내용에 따른 것이다.• “Gemini UX 2.0”으로 명명된 이번 전면 개편은 점진적 공개(pr​ogressive disclosure) 원칙을 따르며, 기본 상태에서는 인터페이스를 최소화하되 Deep Research, Canvas와 같은 기능들을 새로운 Tools 아이콘 아래에 배치해, 고급 제어 기능이 필요할 때에만 접근 가능하도록 한다.• 코드 문자열에 따르면, 실험적 기능을 위한 새로운 Gemini Labs 설정 영역이 추가되었으며, 이는 Google Labs와 Search Labs를 반영한 형태다. 초기 테스트 사용자들은 이 영역에서 완성되지 않은 기능들의 토글을 전환하고, 더 넓은 범위로 공개되기 전에 피드백을 제공할 수 있다.
559 조회
0 추천
2025.12.25 등록
• 엑서터 대학교(University of Exeter) 연구진은 AI 챗봇이 평판 훼손, 정서적 피해, 사회적 혼란을 야기하는 “야생형(feral)” 가십을 만들어 퍼뜨리고 있으며, 인간 의사소통을 조절하는 사회적 규범의 통제를 받지 않은 채 작동하고 있다고 경고했다.• Ethics and Information Technology에 게재된 이 연구는 AI 시스템들 사이에서 빠르게 확산되는 위험한 “봇-투-봇(bot-to-bot)” 가십을 강조하며, 챗봇이 **호주 시장 브라이언 후드(Brian Hood)**에게 뇌물 수수 혐의를, 라디오 진행자 **마크 월터스(Mark Walters)**에게 횡령 혐의를 거짓으로 뒤집어씌운 사례 등을 문서화했다.• 연구진은 기술 기업들이 메모리 기능, 음성 모드와 같은 개인화 기능을 갖춘 챗봇을 설계함에 따라, AI 가십이 더욱 만연해질 것이며, 그 결과 이용자들이 신뢰할 만한 정보와 함께 근거 없는 비난도 더 쉽게 수용하게 될 것이라고 예측한다.
582 조회
0 추천
2025.12.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입