AI 뉴스

구글, 기록적인 벤치마크를 달성한 DS-STAR 데이터 사이언스 에이전트 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.08 15:02
1,590 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581743_1577.jpg
 

(퍼플렉시티가 정리한 기사)


구글(알파벳 주식회사) 리서치는 다양한 데이터 형식에서 복잡한 데이터 과학 작업을 자동화하는 고급 AI 에이전트 DS-STAR를 공개했으며, 여러 산업 벤치마크에서 최고의 성능을 달성하고 엔터프라이즈 데이터 분석 자동화에 있어 중요한 진전을 알리고 있습니다.


업계 표준에서의 획기적인 성능

Google의 11월 6일 발표에 따르면, DS-STAR는 2025년 9월 기준 DABStep 벤치마크 리더보드에서 어려운 작업에 대해 45.2%의 정확도로 1위를 차지했습니다. 이 시스템은 DABStep, KramaBench, DA-Code의 세 가지 주요 벤치마크에서 선두 경쟁자인 AutoGen과 DA-Agent를 능가했습니다. KramaBench에서 DS-STAR는 DA-Agent의 39.8%에 비해 44.7%의 정확도를 달성했으며, DA-Code에서는 37.0% 대비 38.5%에 도달했습니다.​

성능 향상은 특히 복잡한 다중 파일 작업에서 두드러졌습니다. Gemini 2.5 Pro를 사용하여 DS-STAR는 DABStep의 높은 난이도 정확도를 12.7%에서 45.2%로 향상시켰으며, 이는 32 퍼센트 포인트를 초과하는 개선입니다. 이는 Open Data Scientist, Mphasis-I2I-Agents, Amity DA Agent를 포함한 상용 대안들에 비해 상당한 도약을 나타냅니다.​


혁신적인 다중 에이전트 구조

기존의 구조화된 SQL 데이터베이스에 의존하는 전통적인 데이터 과학 에이전트와 달리, DS-STAR는 CSV, JSON, Markdown, 그리고 비정형 텍스트 파일과 같은 다양한 파일 형식을 처리합니다. 이 시스템은 다양한 형식에서 컨텍스트를 추출하는 데이터 파일 분석기, 실행 가능한 단계를 생성하는 플래너, Python 스크립트를 생성하는 코더, 그리고 계획의 충분성을 평가하는 검증자로 구성된 멀티 에이전트 프레임워크를 채택하고 있습니다.​

반복적 세분화 과정은 DS-STAR가 복수의 데이터 소스를 필요로 하는 복잡한 분석도 처리할 수 있게 합니다. 연구에 따르면, 난이도가 높은 작업은 문제 해결에 평균 5.6회의 세분화 라운드가 필요했고, 더 간단한 작업은 3.0회의 라운드만 필요했으며, 절반 이상의 쉬운 작업은 한 번의 반복만에 완료되었습니다. 이 시스템은 디버깅 기능과 대규모 데이터셋에서 관련 파일을 선택하는 검색 모듈을 포함하고 있어, 패턴 변화나 누락 데이터 발생 시에도 견고성을 높여줍니다.​


산업 맥락 및 응용

이번 출시는 AI 기반 데이터 분석에 대한 기업 수요가 가속화되는 가운데 이루어졌습니다. Google Cloud의 AI 에이전트에 대한 광범위한 진출에는 2025년 8월에 발표된 BigQuery Notebooks용 Data Science Agent가 포함되어 있으며, 이는 탐색적 분석, 데이터 정제, 머신러닝 예측을 포함한 자율적 분석 워크플로우를 실행합니다. Gartner의 애널리스트들은 2026년까지 기업 애플리케이션의 40%가 작업별 AI 에이전트를 탑재할 것으로 예측하고 있으며, 이는 현재 5% 미만에서 증가한 수치입니다.​

DS-STAR는 문서 해석부터 통계 분석까지 전체 데이터 사이언스 워크플로우를 자동화하는 데 중점을 두고 있어, 깊은 기술적 전문 지식이 부족한 기업들의 중요한 문제점을 해결합니다. 깨끗한 관계형 데이터베이스가 아닌 실제 세계의 복잡한 데이터를 다룰 수 있는 이 시스템의 능력은 실용적인 기업 배포에 적합하며, 조직 전반에 걸쳐 고급 분석을 민주화할 가능성이 있습니다.

댓글 0
전체 1,366 / 46 페이지
인공지능은 노동 시장에 예상치 못한 반전을 가져올 태세다. 자동화에 대한 기존의 두려움을 뒤집는 최근 보고서와 전문가 분석 물결에 따르면, 만연한 실업 대신 숙련된 인력 부족이 발생할 전망이다.11월 24일 맨해튼 연구소가 블룸버그 오피니언에 발표한 분석에 따르면, AI가 빠르게 발전하더라도 이 기술은 일자리를 없애기보다는 “노동력 부족, 또는 최소한 새로운 기술을 최대한 활용할 수 있는 숙련된 인력의 부족”을 초래할 가능성이 더 높다고 주장한다. 분석에 인용된 대형 대학 정보학 프로그램 책임자에 따르면, 주요 장애물은 많은 학생들이 AI가 주도하는 노동력에 필요한 수학 능력을 갖추지 못했다는 점이다. 특히 AI 분야를 전공하지 않는 학생들에서 이런 경향이 두드러진다.이러한 역설은 경제 전반에 예상치 못한 방식으로 퍼지고 있다. 베어링포인트가 2025년 8월에 실시한 전 세계 1,000명 이상의 경영진 대상 설문조사에서 92%는 AI 자동화로 인해 최대 20%의 인력 과잉을 보고했다. 하지만 동시에, 94%는 AI 특화 직무(거버넌스 전문가, 프롬프트 엔지니어, 인간-AI 협업 전문가 등)에서 심각한 인력 부족을 겪고 있으며, 3분의 1은 40~60%의 인력 공백을 보고하고 있다.기술 격차가 건설 붐을 주도하다AI 주도 노동력 부족의 가장 명확한 증거는 예상치 못한 분야인 건설업에서 나타났습니다. Amazon, Google Microsoft를 포함한 거대 기술 기업들이 AI 시스템을 구동하기 위해 수백 개의 새로운 데이터 센터를 건설하기 위해 경쟁하고 있지만, Associated Builders and Contractors 업계 단체에 따르면 약 439,000명의 숙련된 근로자가 부족한 상황에 직면해 있습니다.이러한 시설을 건설하는 건설 근로자들은 25%에서 30%의 급여 인상을 경험하고 있으며, 일부는 연간 200,000달러 이상을 벌고 있다고 월스트리트 저널이 11월 30일 보도했습니다. 기업들은 난방이 되는 휴게 텐트, 무료 점심, 최대 100달러의 일일 인센티브 보너스로 제안을 더욱 매력적으로 만들고 있습니다.이주에서 변혁으로매사추세츠공과대학교(MIT)가 11월 26일에 발표한 연구에 따르면, 인공지능(AI)이 이미 미국 일자리의 11.7%에 해당하는 업무를 수행할 수 있는 것으로 나타났습니다. 이는 약 1조 2천억 달러 규모의 임금에 해당합니다. 하지만 연구진은 이러한 수치가 기술적 능력을 반영하지만, 일자리 손실이 불가피하다는 일정을 의미하는 것은 아니라고 강조했습니다. 이 연구의 ’아이스버그 지수(Iceberg Index)’는 32,000가지 기술을 보유한 1억 5,100만 명의 노동자를 시뮬레이션하여 정책 입안자들이 노동력 전환을 계획하는 데 도움을 줍니다.MIT의 슬론 경영대학원이 이전에 실시한 연구에 따르면, AI에 대규모 투자를 하는 기업들은 실제로 고용을 늘렸습니다. AI 도입은 5년간 고용 증가율 6%, 매출 증가율 9.5%와 연관이 있었습니다. Anthropic이 2025년 2월에 400만 건 이상의 AI 프롬프트를 분석한 별도의 연구에서는 근로자들이 AI를 주로 업무를 대체하기보다 보완하는 데 활용하는 것으로 나타났습니다.]2028년까지 BearingPoint가 조사한 경영진의 거의 절반은 인력 초과 현상이 30%를 넘을 것으로 예측하고 있으며, 중요한 AI 기술 격차는 계속될 것으로 보입니다. 세계경제포럼(WEF)은 2030년까지 전 세계적으로 9,200만 개의 일자리가 사라지는 반면, 1억 7,000만 개의 새로운 일자리가 생겨 순증 7,800만 개의 일자리가 창출될 것으로 전망하고 있습니다.
698 조회
0 추천
2025.12.02 등록
• Apple은 월요일 기계 학습 및 AI 전략 담당 수석 부사장인 John Giannandrea가 2026년 봄에 물러나 은퇴할 것이며, Microsoft와 Google에서 근무한 Amar Subramanya가 AI 담당 부사장으로 합류할 것이라고 발표했습니다.[investing +2]• 이번 리더십 개편은 Apple이 AI 강화 Siri 어시스턴트 출시 지연으로 비판을 받고 있는 가운데 이루어졌습니다. Siri는 원래 2024년에 약속되었으나 이제 2026년으로 연기되었으며, 회사는 생성형 AI 경쟁에서 OpenAI, Google, Microsoft와 같은 경쟁사들을 따라잡기 위해 고군분투하고 있습니다.[investing +2]• CEO Tim Cook에게 직접 보고했던 Giannandrea와 달리, Subramanya는 소프트웨어 책임자인 Craig Federighi에게 보고할 예정입니다. Federighi의 AI 책임은 확대되어 “내년에 사용자들에게 더 개인화된 Siri를 제공”하기 위한 Apple의 노력을 감독하게 된다고 Cook이 말했습니다.[nbcnews +2]
712 조회
0 추천
2025.12.02 등록
• Nvidia는 NeurIPS 컨퍼런스에서 Alpamayo-R1을 공개했으며, 이는 사고 연쇄(chain-of-thought) AI 추론과 경로 계획을 통합하여 자율주행 자동차가 실시간으로 자신의 결정을 설명할 수 있도록 하는 세계 최초의 개방형 산업 규모 추론 비전 언어 행동 모델로 설명되었습니다.[quantumzeitgeist +1]• 이 모델은 센서 데이터를 자연어 설명으로 변환하고 주행 결정을 단계별로 추론함으로써 자율주행 차량 소프트웨어의 “블랙박스” 문제를 해결하며, 강화 학습 후처리 후 추론 품질이 45% 향상되었습니다.[quantumzeitgeist +1]• Nvidia는 비상업적 연구 용도로 GitHub와 Hugging Face에 이 모델을 공개했으며, 개발자들이 자율주행 차량 및 로봇공학을 위한 물리적 AI 모델을 맞춤화할 수 있도록 Cosmos Cookbook과 AlpaSim 평가 프레임워크도 함께 제공했습니다.[quantumzeitgeist +1]
727 조회
0 추천
2025.12.02 등록
Runway는 월요일에 Gen 4.5를 공개했으며, 이는 독립 벤치마킹 업체 Artificial Analysis가 관리하는 Video Arena 리더보드에서 1위를 차지한 새로운 AI 비디오 생성 모델로, 2위인 Google의 Veo 3 모델과 7위인 OpenAI의 Sora 2 Pro를 능가했다.PitchBook에 따르면 35억 5천만 달러의 가치를 평가받은 이 100명 규모의 스타트업은 블라인드 테스트를 사용하며, 투표자들이 어느 회사가 제작했는지 모르는 상태에서 비디오 결과물을 비교하여 순수한 사용자 선호도를 기반으로 편향되지 않은 순위를 보장한다.CEO Cristóbal Valenzuela는 CNBC에 Runway가 “100명의 팀으로 수조 달러 규모의 기업들을 능가하는 데 성공했다”고 말했으며, “David”라는 코드명의 이 모델은 주말까지 회사의 플랫폼, API 및 파트너 통합을 통해 모든 고객에게 제공될 예정이다.
705 조회
0 추천
2025.12.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입