Loading...

AI 뉴스

구글, 기록적인 벤치마크를 달성한 DS-STAR 데이터 사이언스 에이전트 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.08 15:02
1,670 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581743_1577.jpg
 

(퍼플렉시티가 정리한 기사)


구글(알파벳 주식회사) 리서치는 다양한 데이터 형식에서 복잡한 데이터 과학 작업을 자동화하는 고급 AI 에이전트 DS-STAR를 공개했으며, 여러 산업 벤치마크에서 최고의 성능을 달성하고 엔터프라이즈 데이터 분석 자동화에 있어 중요한 진전을 알리고 있습니다.


업계 표준에서의 획기적인 성능

Google의 11월 6일 발표에 따르면, DS-STAR는 2025년 9월 기준 DABStep 벤치마크 리더보드에서 어려운 작업에 대해 45.2%의 정확도로 1위를 차지했습니다. 이 시스템은 DABStep, KramaBench, DA-Code의 세 가지 주요 벤치마크에서 선두 경쟁자인 AutoGen과 DA-Agent를 능가했습니다. KramaBench에서 DS-STAR는 DA-Agent의 39.8%에 비해 44.7%의 정확도를 달성했으며, DA-Code에서는 37.0% 대비 38.5%에 도달했습니다.​

성능 향상은 특히 복잡한 다중 파일 작업에서 두드러졌습니다. Gemini 2.5 Pro를 사용하여 DS-STAR는 DABStep의 높은 난이도 정확도를 12.7%에서 45.2%로 향상시켰으며, 이는 32 퍼센트 포인트를 초과하는 개선입니다. 이는 Open Data Scientist, Mphasis-I2I-Agents, Amity DA Agent를 포함한 상용 대안들에 비해 상당한 도약을 나타냅니다.​


혁신적인 다중 에이전트 구조

기존의 구조화된 SQL 데이터베이스에 의존하는 전통적인 데이터 과학 에이전트와 달리, DS-STAR는 CSV, JSON, Markdown, 그리고 비정형 텍스트 파일과 같은 다양한 파일 형식을 처리합니다. 이 시스템은 다양한 형식에서 컨텍스트를 추출하는 데이터 파일 분석기, 실행 가능한 단계를 생성하는 플래너, Python 스크립트를 생성하는 코더, 그리고 계획의 충분성을 평가하는 검증자로 구성된 멀티 에이전트 프레임워크를 채택하고 있습니다.​

반복적 세분화 과정은 DS-STAR가 복수의 데이터 소스를 필요로 하는 복잡한 분석도 처리할 수 있게 합니다. 연구에 따르면, 난이도가 높은 작업은 문제 해결에 평균 5.6회의 세분화 라운드가 필요했고, 더 간단한 작업은 3.0회의 라운드만 필요했으며, 절반 이상의 쉬운 작업은 한 번의 반복만에 완료되었습니다. 이 시스템은 디버깅 기능과 대규모 데이터셋에서 관련 파일을 선택하는 검색 모듈을 포함하고 있어, 패턴 변화나 누락 데이터 발생 시에도 견고성을 높여줍니다.​


산업 맥락 및 응용

이번 출시는 AI 기반 데이터 분석에 대한 기업 수요가 가속화되는 가운데 이루어졌습니다. Google Cloud의 AI 에이전트에 대한 광범위한 진출에는 2025년 8월에 발표된 BigQuery Notebooks용 Data Science Agent가 포함되어 있으며, 이는 탐색적 분석, 데이터 정제, 머신러닝 예측을 포함한 자율적 분석 워크플로우를 실행합니다. Gartner의 애널리스트들은 2026년까지 기업 애플리케이션의 40%가 작업별 AI 에이전트를 탑재할 것으로 예측하고 있으며, 이는 현재 5% 미만에서 증가한 수치입니다.​

DS-STAR는 문서 해석부터 통계 분석까지 전체 데이터 사이언스 워크플로우를 자동화하는 데 중점을 두고 있어, 깊은 기술적 전문 지식이 부족한 기업들의 중요한 문제점을 해결합니다. 깨끗한 관계형 데이터베이스가 아닌 실제 세계의 복잡한 데이터를 다룰 수 있는 이 시스템의 능력은 실용적인 기업 배포에 적합하며, 조직 전반에 걸쳐 고급 분석을 민주화할 가능성이 있습니다.

댓글 0
전체 1,366 / 25 페이지
MIT Technology Review는 AI로 생성된 비디오 콘텐츠를 처음에는 저품질 "slop"으로 치부했으나, 추가 조사 결과 크리에이터들이 OpenAI의 Sora, Google의 Veo, Runway와 같은 도구를 사용하여 기술과 실험이 필요한 의도적이고 종종 초현실적인 예술 작품을 제작하는 더 미묘한 창작 생태계가 있음을 발견했다고 보도했습니다.technologyreview​ AI 비디오 크리에이터들과의 인터뷰에 따르면 매력적인 콘텐츠를 제작하는 데는 클립당 수 시간의 작업이 필요하며, Daryl Anselmo와 같은 아티스트는 4년간의 일일 AI 실험을 갤러리 전시회로 편집하고, 다른 이들은 수백만 명의 팔로워를 확보한 반복 캐릭터 프랜차이즈를 구축하고 있습니다.inkl+1​ Adobe 설문조사에 따르면 전 세계 크리에이터의 86%가 현재 생성형 AI 도구를 사용하고 있으며, Brookings 연구에서는 2022년 새로운 AI 도구 출시 이후 AI에 노출된 분야의 프리랜서들이 계약 2% 감소와 수입 5% 하락을 경험했다고 밝혀 이 기술의 파괴적인 경제적 영향을 강조했습니다.biz.chosun+2​ https://www.technologyreview.com/2025/12/23/1130396/how-i-learned-to-stop-worrying-and-love-ai-slop/ https://www.inkl.com/news/the-ais-have-it-adobe-report-reveals-86-of-creators-use-creative-generative-ai https://biz.chosun.com/en/en-it/2025/11/04/FRVYHP2MVBDB3PWZ5NBT5C3K6M/ https://www.brookings.edu/articles/is-generative-ai-a-job-killer-evidence-from-the-freelance-market/ https://www.cnbc.com/2024/12/09/openai-releases-sora-its-buzzy-ai-video-generation-tool.html https://mashable.com/article/ai-slop-tiktok-fyp-trending-social-media-why https://www.reddit.com/r/VEO3/comments/1m6oc2v/veo_vs_sora_runway_ai_video_generators_for_quick/ https://www.transparencycoalition.ai/news/openai-launches-sora-video-generator-aims-to-kickstart-ai-video-era https://www.reddit.com/r/Futurology/comments/1hyt8dm/aigenerated_slop_is_slowly_killing_the_internet/ https://www.youtube.com/watch?v=US2gO7UYEfY https://www.axios.com/2024/12/09/openai-sora-video-ai-tool https://en.wikipedia.org/wiki/AI_slop https://www.youtube.com/watch?v=g5CWQXoK7wM https://www.theguardian.com/technology/2024/dec/09/openai-ai-video-generator-sora-publicly-available https://hawkemedia.com/insights/ai-slop/ https://www.youtube.com/watch?v=eZvSwOnnLrs https://www.cnbc.com/2025/09/30/openai-sora-ai-video-generator-us-canada.html https://www.theguardian.com/commentisfree/2025/apr/21/ai-slop-artificial-intelligence-social-media https://deepmind.google/models/veo/ https://openai.com/index/sora-is-here/ https://www.cnet.com/tech/services-and-software/ai-slop-has-turned-social-media-into-an-antisocial-wasteland/ https://www.youtube.com/watch?v=NmoZvPt0a78 https://openai.com/index/sora-2/ https://www.searchenginepeople.com/blog/ai-slop-and-the-rise-of-slop-culture.html https://www.today.com/news/bunnies-jumping-trampoline-viral-video-ai-concern-rcna223637 https://tech.yahoo.com/ai/articles/ais-adobe-report-reveals-86-153703401.html https://www.reddit.com/r/Bunnies/comments/1mjvetv/a_viral_security_cam_clip_of_rabbits_bouncing_on/ https://www.abc.net.au/news/2025-11-25/ai-slop-named-macquarie-dictionary-word-of-the-year-2025/106047682 https://www.youtube.com/watch?v=9O-8kAnBL2s https://dictionary.cambridge.org/us/dictionary/english/slop https://news.adobe.com/news/2025/10/adobe-max-2025-creators-survey https://www.facebook.com/thedodosite/videos/viral-trampoline-animal-videos-show-how-ai-can-go-really-wrong/4068853723366784/ https://www.linkedin.com/posts/kingajentetics_cambridge-dictionary-adds-new-definition-activity-7344348856932798464-g-ME https://www.netinfluencer.com/86-percent-of-global-creators-now-leverage-ai-tools-driving-growth-in-creator-economy-adobe-report/ https://www.youtube.com/watch?v=ydycD3iMhvc https://www.cambridge.org/news-and-insights/cambridge-dictionary-tracks-new-ai-words https://blog.adobe.com/en/publish/2024/10/08/adobes-ai-creative-frontier-study-reveals-creators-views-opportunities-risks-generative-ai https://www.tiktok.com/@rachelthecatlovers/video/7531584773500751118 https://www.thebookseller.com/news/cambridge-dictionary-adds-new-definition-for-slop-to-reflect-low-quality-content-created-by-ai https://www.linkedin.com/posts/paulgreenberg_the-creator-economy-has-embraced-generative-activity-7389380797801062400-VsWW https://www.youtube.com/shorts/vTPx_muLksc https://www.bbc.com/news/articles/c5y0g79xevxo https://people.com/openai-bans-martin-luther-king-jr-deepfakes-following-racist-videos-11832092 https://builtin.com/articles/job-market-ai-impact-yale-brookings-study https://edition.cnn.com/2025/10/17/tech/openai-mlk-sora-pause https://www.brookings.edu/articles/the-effects-of-ai-on-firms-and-workers/ https://www.cnn.com/2025/10/17/tech/openai-mlk-sora-pause https://www.brookings.edu/articles/new-data-show-no-ai-jobs-apocalypse-for-now/ https://fortune.com/2025/10/17/openai-sora-martin-luther-king-deepfakes-foolishness-direspectful/ https://www.facebook.com/businessinsider/posts/brookings-says-that-ai-could-initially-boost-wages-but-then-drive-them-down-as-a/1210304244301191/ https://www.cnbc.com/2025/10/17/open-ai-sora-mlk-jr-disrespectful-deepfakes.html https://www.brookings.edu/articles/how-are-americans-using-ai-evidence-from-a-nationwide-survey/ https://www.npr.org/2025/10/17/nx-s1-5577869/sora-block-videos-mlk https://www.linkedin.com/posts/brookings-metro_ai-generativeai-aiadoption-activity-7379252760019632129-73QS https://mashable.com/article/openai-marthin-luther-king-sora-offensive-memes-backlash https://www.facebook.com/techinsider/posts/brookings-says-that-ai-could-initially-boost-wages-but-then-drive-them-down-as-a/1211787024154105/ https://www.yahoo.com/news/articles/openais-sora-2-app-suspends-173232838.html https://budgetlab.yale.edu/research/evaluating-impact-ai-labor-market-current-state-affairs https://www.reddit.com/r/technology/comments/1o8wpy8/openai_pauses_sora_video_generations_of_martin/
801 조회
0 추천
2025.12.26 등록
Pendo의 수석 제품 디자이너인 Brian Greenbaum은 육아휴직 중 보낸 단 하나의 Slack 메시지로 회사 전체의 변화를 촉발시킨 후, 전체 제품 조직에 걸쳐 AI 도입을 이끌어내기 위한 실용적인 플레이북을 공유합니다.lennysnewsletter​ 그의 접근 방식은 동기식 실습 워크숍과 비동기식 학습 기회를 결합했으며, 법무, 보안, 재무 팀과 협력하여 명확한 정책을 수립함으로써 AI 도구 사용을 위한 "황금 경로"를 확립했습니다.lennysnewsletter​ 이 이니셔티브는 Greenbaum의 개인 기여자 역할을 넘어 그의 경력을 변화시켰으며, 회사 전략에 영향을 미치고 조직의 AI 챔피언으로 자리매김할 수 있는 기회를 열어주었습니다—이는 AI 도입을 주도하는 것이 어떻게 중요한 경력 가속기 역할을 할 수 있는지를 보여줍니다.lennysnewsletter​ https://www.lennysnewsletter.com/p/how-to-get-your-whole-team-excited https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-to-get
798 조회
0 추천
2025.12.26 등록
Nate's Newsletter는 Claude Code가 오해의 소지가 있는 이름이라고 주장하는데, Anthropic의 12월 릴리스는 소프트웨어 개발이 아니라 브라우저 자동화, Slack 통합, 모바일 위임, 그리고 비기술 사용자들이 코드 작성 없이 활용할 수 있는 조직 워크플로우 도구에 초점을 맞췄기 때문이다.natesnewsletter.substack​ 이 가이드는 29페이지의 설정 지침, 양식 작성, 경쟁 조사, 회의 처리, 파일 정리를 포함한 10가지 단계별 프로덕션 워크플로우, 그리고 완전한 자율 위임이 아닌 빈번한 체크포인트를 통한 반복적 협업을 통해 Claude에게 작업을 위임하는 프레임워크를 제공한다.natesnewsletter.substack​ Anthropic의 내부 연구에 따르면 사용자들은 Claude로 업무의 60%를 완료하고 50%의 생산성 향상을 달성하며, Claude Code는 2025년 5월 공개 출시 후 단 6개월 만에 연간 10억 달러의 수익을 달성했다.venturebeat+1​ https://natesnewsletter.substack.com/p/the-complete-wait-i-can-use-claude https://venturebeat.com/ai/anthropics-claude-code-can-now-read-your-slack-messages-and-write-code-for https://simonwillison.net/2025/Oct/20/claude-code-for-web/ https://x.com/DanielMiessler/status/2002485123040817525 https://www.gend.co/blog/automate-code-sessions-with-claude-in-slack https://en.wikipedia.org/wiki/Claude_(language_model) https://code.claude.com/docs/en/slack https://techcrunch.com/2025/10/20/anthropic-brings-claude-code-to-the-web/ https://x.com/mattyglesias/status/2002388080460812420 https://www.codegpt.co/blog/anthropic-claude-models-complete-guide https://x.com/simonw/status/2002416381980213307 https://www.salesforce.com/news/stories/claude-code-in-slack/ https://www.datastudios.org/post/all-claude-ai-models-available-in-2025-full-list-for-web-app-api-and-cloud-platforms https://bsky.app/profile/mattyglesias.bsky.social https://www.reddit.com/r/ClaudeCode/comments/1phuzfs/claude_code_in_slack_signals_shift_to/ https://www.anthropic.com/claude/sonnet https://x.com/LBacaj/status/2002446302744097050 https://n8n.io/integrations/claude/and/slack/ https://support.claude.com/en/articles/12138966-release-notes https://www.slowboring.com/p/mailbag-more-philosophical-than-usual https://vertu.com/lifestyle/the-ai-model-race-reaches-singularity-speed/ https://claude-plugins.dev/skills/@greyhaven-ai/claude-code-config/browser-automation https://claude-plugins.dev/skills/@chriscarterux/chris-claude-stack/effective-delegation-patterns https://newsroom.accenture.com/news/2025/accenture-and-anthropic-launch-multi-year-partnership-to-drive-enterprise-ai-innovation-and-value-across-industries https://www.datacamp.com/tutorial/claude-for-chrome-ai-powered-browser-assistance-automation https://claude-plugins.dev/skills/@rsmdt/the-startup/agent-delegation https://www.youtube.com/watch?v=4ue4CNt8YxE https://code.claude.com/docs/en/chrome https://www.youtube.com/watch?v=0J2_YGuNrDo https://www.anthropic.com/news https://github.com/SawyerHood/dev-browser https://www.youtube.com/watch?v=oZF6TgxB5yw https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-announce-200-million-partnership-to-bring-agentic-ai-to-global-enterprises/ https://www.reddit.com/r/ClaudeAI/comments/1prcypb/anthropic_just_dropped_claude_for_chrome_ai_that/ https://claude.ai/public/artifacts/7029f156-12d7-4680-9df4-5af4715e0612 https://www.anthropic.com/news/snowflake-anthropic-expanded-partnership https://www.youtube.com/watch?v=XYzs8JJAL24 https://www.reddit.com/r/ClaudeAI/comments/1obq6wq/understanding_claude_skills_vs_subagents_its_not/ https://techcrunch.com/2025/12/04/anthropic-signs-200m-deal-to-bring-its-llms-to-snowflakes-customers/ https://www.anthropic.com/engineering/claude-code-best-practices
895 조회
0 추천
2025.12.26 등록
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
787 조회
0 추천
2025.12.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입