Loading...

AI 뉴스

구글, 기록적인 벤치마크를 달성한 DS-STAR 데이터 사이언스 에이전트 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.08 15:02
1,264 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581743_1577.jpg
 

(퍼플렉시티가 정리한 기사)


구글(알파벳 주식회사) 리서치는 다양한 데이터 형식에서 복잡한 데이터 과학 작업을 자동화하는 고급 AI 에이전트 DS-STAR를 공개했으며, 여러 산업 벤치마크에서 최고의 성능을 달성하고 엔터프라이즈 데이터 분석 자동화에 있어 중요한 진전을 알리고 있습니다.


업계 표준에서의 획기적인 성능

Google의 11월 6일 발표에 따르면, DS-STAR는 2025년 9월 기준 DABStep 벤치마크 리더보드에서 어려운 작업에 대해 45.2%의 정확도로 1위를 차지했습니다. 이 시스템은 DABStep, KramaBench, DA-Code의 세 가지 주요 벤치마크에서 선두 경쟁자인 AutoGen과 DA-Agent를 능가했습니다. KramaBench에서 DS-STAR는 DA-Agent의 39.8%에 비해 44.7%의 정확도를 달성했으며, DA-Code에서는 37.0% 대비 38.5%에 도달했습니다.​

성능 향상은 특히 복잡한 다중 파일 작업에서 두드러졌습니다. Gemini 2.5 Pro를 사용하여 DS-STAR는 DABStep의 높은 난이도 정확도를 12.7%에서 45.2%로 향상시켰으며, 이는 32 퍼센트 포인트를 초과하는 개선입니다. 이는 Open Data Scientist, Mphasis-I2I-Agents, Amity DA Agent를 포함한 상용 대안들에 비해 상당한 도약을 나타냅니다.​


혁신적인 다중 에이전트 구조

기존의 구조화된 SQL 데이터베이스에 의존하는 전통적인 데이터 과학 에이전트와 달리, DS-STAR는 CSV, JSON, Markdown, 그리고 비정형 텍스트 파일과 같은 다양한 파일 형식을 처리합니다. 이 시스템은 다양한 형식에서 컨텍스트를 추출하는 데이터 파일 분석기, 실행 가능한 단계를 생성하는 플래너, Python 스크립트를 생성하는 코더, 그리고 계획의 충분성을 평가하는 검증자로 구성된 멀티 에이전트 프레임워크를 채택하고 있습니다.​

반복적 세분화 과정은 DS-STAR가 복수의 데이터 소스를 필요로 하는 복잡한 분석도 처리할 수 있게 합니다. 연구에 따르면, 난이도가 높은 작업은 문제 해결에 평균 5.6회의 세분화 라운드가 필요했고, 더 간단한 작업은 3.0회의 라운드만 필요했으며, 절반 이상의 쉬운 작업은 한 번의 반복만에 완료되었습니다. 이 시스템은 디버깅 기능과 대규모 데이터셋에서 관련 파일을 선택하는 검색 모듈을 포함하고 있어, 패턴 변화나 누락 데이터 발생 시에도 견고성을 높여줍니다.​


산업 맥락 및 응용

이번 출시는 AI 기반 데이터 분석에 대한 기업 수요가 가속화되는 가운데 이루어졌습니다. Google Cloud의 AI 에이전트에 대한 광범위한 진출에는 2025년 8월에 발표된 BigQuery Notebooks용 Data Science Agent가 포함되어 있으며, 이는 탐색적 분석, 데이터 정제, 머신러닝 예측을 포함한 자율적 분석 워크플로우를 실행합니다. Gartner의 애널리스트들은 2026년까지 기업 애플리케이션의 40%가 작업별 AI 에이전트를 탑재할 것으로 예측하고 있으며, 이는 현재 5% 미만에서 증가한 수치입니다.​

DS-STAR는 문서 해석부터 통계 분석까지 전체 데이터 사이언스 워크플로우를 자동화하는 데 중점을 두고 있어, 깊은 기술적 전문 지식이 부족한 기업들의 중요한 문제점을 해결합니다. 깨끗한 관계형 데이터베이스가 아닌 실제 세계의 복잡한 데이터를 다룰 수 있는 이 시스템의 능력은 실용적인 기업 배포에 적합하며, 조직 전반에 걸쳐 고급 분석을 민주화할 가능성이 있습니다.

댓글 0
전체 1,366 / 87 페이지
Capgemini가 화요일 발표한 보고서에 따르면, 마케팅 예산이 회사 매출의 단 5%로 축소되는 동안 중요한 비즈니스 의사결정에 참여하는 CMO의 비율이 2년 만에 70%에서 55%로 감소했으며, 이는 AI 기반 디지털 혁신을 주도해야 한다는 기대가 급증하고 있는 상황에서 발생했다.AI 및 마케팅 기술 이니셔티브의 절반 이상이 현재 마케팅 팀이 아닌 IT 부서에서 자금을 지원하고 통제하고 있으며, 마케팅 기술 투자에서 AI가 차지하는 비중이 2023년 64%에서 2025년 79%로 급증했지만, AI가 효과성을 개선했다고 강력히 동의하는 마케팅 리더는 7%에 불과하다.이러한 조사 결과는 측정 가능한 비즈니스 가치를 제공하기 위한 CMO-CIO 협업의 시급한 필요성을 강조하는데, 마케팅 기술 예산을 통제하는 CMO가 40% 미만이고 광범위한 AI 도입에도 불구하고 고객 상호작용을 성공적으로 개인화하는 비율은 18%에 불과하기 때문이다.
817 조회
0 추천
2025.11.20 등록
Google은 미국 외 지역에서 최대 규모의 인공지능 인프라 하드웨어 엔지니어링 센터를 대만에 개설했으며, 라이칭더 총통은 이번 조치가 대만이 신뢰할 수 있는 기술 파트너이자 안전한 AI 개발을 위한 핵심 허브임을 입증하는 것이라고 설명했다.타이베이에 위치한 이 시설은 매일 수십억 명의 사람들이 사용하는 기기에 전력을 공급하는 전 세계 Google 데이터 센터에 배치되는 기술을 개발하고 테스트할 예정이라고 Google Cloud 부사장 아머 마흐무드가 밝혔다.대만은 전 세계 반도체의 60% 이상, 최첨단 칩의 90% 이상을 생산하고 있으며, AI 수요가 급증하는 가운데 TSMC만으로도 계약 칩 제조 분야에서 64%의 글로벌 시장 점유율을 차지하고 있다.
837 조회
0 추천
2025.11.20 등록
**마이크로소프트(Microsoft)**의 AI CEO **무스타파 술레이만(Mustafa Suleyman)**은 Copilot과 Windows에 AI가 통합되는 것에 불만을 가진 비평가들에게 반박하며, 사람들이 AI와 유창하게 대화하고 이미지와 동영상을 생성할 수 있는 능력에 감명을 받지 않는다는 사실에 “정말 놀랐다”고 말했다.술레이만의 옹호는 최근 The Verge의 보고서에서 실제 Copilot의 기능이 **마이크로소프트(Microsoft)**가 광고에서 보여주는 것과 맞지 않는다는 점이 지적된 가운데 나왔으며, Windows 사장 **파반 다불루리(Pavan Davuluri)**가 “대리 OS(agentic OS)” 비전을 홍보하다가 심한 반발을 받아 자신의 게시물에서 답글 기능을 비활성화해야 했던 사건에 이어졌다.이 논란은 **마이크로소프트(Microsoft)**가 새로운 “AI를 위한 당신의 캔버스(Your canvas for AI)” 슬로건을 밀어붙이는 가운데, Windows의 평판이 해당 매체가 “역대 최저”라고 묘사할 정도로 떨어진 상황을 부각시킨다. 사용자들은 모든 인터페이스에 원하지 않는 AI 기능을 강제로 넣는 대신 회사가 근본적인 플랫폼 문제를 해결할 것을 요구하고 있다.
831 조회
0 추천
2025.11.20 등록
Google DeepMind는 Boston Dynamics의 전 최고기술책임자(CTO)인 Aaron Saunders를 하드웨어 엔지니어링 부사장으로 영입했습니다. 이는 CEO Demis Hassabis가 Gemini를 Android가 여러 제조업체의 스마트폰을 구동하는 것처럼 범용 로봇 운영체제로 변모시키려는 비전을 발전시키기 위한 것입니다.Hassabis는 Gemini가 “거의 모든 물리적 구성으로 즉시 작동할 수 있는” AI 기반으로 기능하기를 목표로 하며, 이는 인간형 및 비인간형 로봇을 포함하여 회사가 AI 기반 로봇공학 분야로의 진출을 강화하고 있는 가운데 추진되고 있습니다.이러한 움직임은 Google DeepMind를 2035년까지 510억 달러 규모에 달할 것으로 예상되는 급속히 성장하는 시장에서 경쟁할 수 있는 위치에 올려놓습니다. 경쟁사인 Tesla는 향후 10년간 백만 대의 Optimus 인간형 로봇 생산을 목표로 하고 있으며, Unitree와 같은 중국 기업들은 경쟁력 있는 가격의 다리 달린 로봇을 제공하고 있습니다
806 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입