AI 뉴스

AI 에이전트, 기업들이 약속하고 절실히 필요로 하는 미래

페이지 정보

작성자 symbolika
작성일 2025.12.31 00:47
451 조회
0 추천
0 비추천

본문

AI Agents

• AI 기업들이 '에이전트'라 불리는 자율 AI 시스템 개발에 총력을 기울이고 있으며, 이는 수익화를 위한 핵심 전략으로 부상했다

• 마이크로소프트, 구글, 앤스로픽, 오픈AI 등 주요 기업들이 고객 서비스부터 예약까지 다양한 업무를 자동화하는 AI 에이전트를 선보이고 있다

• AI 에이전트 스타트업에 지난 12개월간 82억 달러의 투자가 유입되며 전년 대비 81.4% 증가했다

• 그러나 현재 기술 수준에서 AI 에이전트는 다단계 작업이나 예상치 못한 상황에서 오류가 발생하며, AI 환각 문제 등 신뢰성 우려가 있다

• 오픈AI는 2025년을 AI 에이전트가 본격적으로 주류에 진입하는 해가 될 것으로 전망하고 있다


인류는 수세기 동안 작업을 자동화해왔다. 이제 AI 기업들은 효율성에 대한 우리의 열망을 수익으로 연결할 방안을 찾았고, 그 해법에 '에이전트'라는 이름을 붙였다.


AI 에이전트는 사람의 개입을 최소화하면서 업무를 수행하고, 의사결정을 내리며, 환경과 상호작용하는 자율 프로그램이다. 오늘날 AI 분야에서 활동하는 모든 주요 기업이 이에 주목하고 있다. 마이크로소프트는 고객 서비스와 관리 업무 자동화를 돕는 '코파일럿'을 개발했다. 구글 클라우드의 토마스 쿠리안 CEO는 최근 6가지 AI 생산성 에이전트 구상을 발표했고, 구글 딥마인드는 AI 비디오 제품 '소라'의 공동 책임자를 오픈AI에서 영입해 AI 에이전트 훈련용 시뮬레이션 개발에 투입했다. 앤스로픽은 자사 AI 챗봇 '클로드'에 누구나 자신만의 'AI 어시스턴트'를 만들 수 있는 기능을 추가했다. 오픈AI는 범용인공지능(AGI), 즉 인간 수준의 인공지능에 도달하기 위한 5단계 접근법에서 에이전트를 2단계로 설정했다.


물론 컴퓨팅 분야에는 자율 시스템이 이미 넘쳐난다. 팝업 고객 서비스 봇이 있는 웹사이트를 방문하거나, 알렉사 스킬 같은 자동 음성 비서 기능을 사용하거나, 간단한 IFTTT 스크립트를 작성해본 사람도 많다. 그러나 AI 기업들은 '에이전트'가—이들은 절대 '봇'이라 부르지 말라고 한다—다르다고 주장한다. 단순하고 반복적인 명령을 따르는 대신, 에이전트는 환경과 상호작용하고, 피드백에서 학습하며, 지속적인 인간의 개입 없이 의사결정을 내릴 수 있다고 믿는다. 이들은 구매, 여행 예약, 회의 일정 조율 같은 업무를 동적으로 관리하면서 예상치 못한 상황에 적응하고, 인간과 다른 AI 도구를 포함한 시스템과 상호작용할 수 있다.


AI 기업들은 에이전트가 강력하지만 비용이 많이 드는 AI 모델을 수익화할 방법이 되기를 바란다. 벤처 캐피털이 기술과의 상호작용 방식을 혁신하겠다고 약속하는 AI 에이전트 스타트업에 쏟아지고 있다. 기업들은 고객 서비스부터 데이터 분석까지 모든 것을 에이전트가 처리하는 효율성의 도약을 꿈꾼다. 개인 사용자에게 AI 기업들은 일상적인 업무가 자동화되어 창의적이고 전략적인 일에 시간을 확보할 수 있는 새로운 생산성의 시대를 제시하고 있다. 진정한 신봉자들의 최종 목표는 단순한 도구가 아닌 진정한 파트너가 되는 AI를 만드는 것이다.


오픈AI CEO 샘 알트만은 올해 초 MIT 테크놀로지 리뷰와의 인터뷰에서 사용자들이 진정으로 원하는 것은 "그냥 곁에서 도와주는 존재"라고 말했다. 그는 킬러 AI 앱이 간단한 작업은 즉시 처리하고, 복잡한 것은 가서 답을 찾아 돌아올 수 있어야 한다고 했다. "내 모든 이메일, 모든 대화 등 내 삶 전체를 완벽히 알고 있지만, 그러면서도 내 연장처럼 느껴지지 않는 초유능 동료"와 같은 존재가 될 것이라고 했다. 기술 기업들은 적어도 1970년대부터 개인 비서를 자동화하려 해왔으며, 이제 드디어 가까워지고 있다고 약속한다.


오픈AI가 연례 Dev Day를 앞두고 열린 언론 행사에서 개발자 경험 담당 로맹 위에는 회사의 새로운 실시간 API를 활용한 어시스턴트 에이전트를 시연했다. 위에는 에이전트에게 예산과 몇 가지 조건을 주고 초콜릿 딸기 400개를 주문하도록 했으며, 가상의 상점에 전화를 걸어 주문하도록 지시했다.


이 서비스는 2018년 구글이 선보인 예약 봇 '듀플렉스'와 유사하다. 하지만 그 봇은 가장 단순한 시나리오만 처리할 수 있었고, 통화의 4분의 1은 실제로 사람이 처리하는 것으로 드러났다.


영어로 주문이 이루어졌지만, 위에는 도쿄에서 더 복잡한 시연을 했다고 전했다. 그는 에이전트에게 일본어로 호텔 객실을 예약하도록 지시했고, 에이전트는 일본어로 대화를 처리한 뒤 영어로 다시 전화해 완료를 확인했다. "물론 저는 일본어 부분을 이해하지 못했습니다—에이전트가 알아서 처리했죠"라고 위에는 말했다.


그러나 위에의 시연은 기자들로 가득 찬 현장에서 즉각적인 우려를 불러일으켰다. AI 어시스턴트가 스팸 전화에 악용될 수 있지 않을까? 왜 스스로를 AI 시스템이라고 밝히지 않았을까? (위에는 공식 Dev Day에서 시연을 업데이트해 에이전트가 스스로를 "로맹의 AI 어시스턴트"라고 소개하도록 했다고 참석자가 전했다.) 불안감이 감지됐고, 이는 놀라운 일이 아니었다—에이전트가 없어도 AI 도구는 이미 기만에 사용되고 있다.


더 즉각적인 문제도 있었다: 시연이 제대로 작동하지 않았다. 에이전트는 충분한 정보가 없었고 디저트 맛을 잘못 기록해 바닐라와 딸기 같은 맛을 열에 자동 입력했다. 해당 정보가 없다고 말하는 대신 말이다. 에이전트는 다단계 워크플로우나 예상치 못한 시나리오에서 자주 문제를 일으킨다. 또한 기존 봇이나 음성 비서보다 더 많은 에너지를 소모한다. 추론하거나 여러 시스템과 상호작용할 때 상당한 컴퓨팅 파워가 필요해 대규모 운영 비용이 높다.


AI 에이전트는 잠재력 면에서 도약을 제공하지만, 일상적인 업무에서 봇, 어시스턴트, 스크립트보다 아직 크게 나은 것은 아니다. 오픈AI와 다른 연구소들은 강화학습을 통해 추론 능력을 향상시키면서 무어의 법칙이 계속해서 더 저렴하고 강력한 컴퓨팅을 제공하기를 바라고 있다.


그렇다면 AI 에이전트가 아직 그다지 유용하지 않은데 왜 이 아이디어가 이토록 인기가 있을까? 간단히 말해: 시장 압력이다. 이들 기업은 강력하지만 비싼 기술을 보유하고 있으며 사용자에게 비용을 청구할 수 있는 실용적인 사용 사례를 찾기에 급급하다. 약속과 현실 사이의 격차는 또한 투자를 촉진하는 매력적인 과대 광고 사이클을 만들어내고, 공교롭게도 오픈AI는 에이전트를 띄우기 시작하면서 66억 달러를 조달했다.


AI 에이전트 스타트업들은 지난 12개월 동안 투자자로부터 82억 달러를 확보했다.


대형 기술 기업들은 온갖 종류의 'AI'를 자사 제품에 통합하기 위해 분주하지만, 특히 AI 어시스턴트가 수익을 창출하는 열쇠가 될 수 있기를 기대한다. 위에의 AI 통화 시연은 현재 모델이 대규모로 수행할 수 있는 수준을 앞서지만, 그는 오픈AI가 '추론' o1 모델을 개선하면서 내년에는 이런 기능이 더 일반화될 것으로 예상한다고 말했다.


현재 이 개념은 주로 소비자용 제품이 아닌 기업용 소프트웨어 스택에 국한된 것으로 보인다. 고객 관계 관리(CRM) 소프트웨어를 제공하는 세일즈포스는 연례 드림포스 컨퍼런스를 몇 주 앞두고 '에이전트' 기능을 대대적으로 선보였다. 이 기능은 고객이 자연어를 사용해 슬랙을 통해 몇 분 만에 고객 서비스 챗봇을 구축할 수 있게 해준다. 코딩에 많은 시간을 들이는 대신 말이다. 이 챗봇은 회사의 CRM 데이터에 접근할 수 있고 대규모 언어 모델 기반이 아닌 봇보다 자연어를 더 쉽게 처리할 수 있어 주문과 반품에 대한 질문 처리 같은 제한된 업무에서 더 나은 성능을 보일 가능성이 있다.


AI 에이전트 스타트업(여전히 다소 모호한 용어다)은 이미 상당히 뜨거운 투자처가 되고 있다. 피치북 데이터에 따르면, 지난 12개월 동안 156건의 거래에 걸쳐 82억 달러의 투자자 자금을 확보했으며, 이는 전년 대비 81.4% 증가한 수치다. 더 잘 알려진 프로젝트 중 하나는 세일즈포스 전 공동 CEO 브렛 테일러가 창업한, 세일즈포스의 최근 프로젝트와 유사한 고객 서비스 에이전트 시에라다. 변호사를 위한 AI 에이전트 하비, 세금 처리용 AI 에이전트 택스GPT도 있다.


에이전트에 대한 모든 열광에도 불구하고, 이러한 고위험 사용 사례는 분명한 질문을 제기한다: 법률이나 세금처럼 심각한 문제를 에이전트에게 맡겨도 정말 믿을 수 있을까? ChatGPT 사용자들을 자주 곤경에 빠뜨린 AI 환각은 현재 해결책이 보이지 않는다. 더 근본적으로 IBM이 1979년에 선견지명 있게 밝혔듯이 "컴퓨터는 결코 책임을 질 수 없다"—그리고 그 귀결로 "컴퓨터는 절대 경영 결정을 내려서는 안 된다." 자율적인 의사결정자라기보다 AI 어시스턴트는 있는 그대로 봐야 한다: 저위험 업무를 위한 강력하지만 불완전한 도구. 이것이 AI 기업들이 사람들에게 청구하려는 거금의 가치가 있을까?


현재로서는 시장 압력이 우세하며, AI 기업들은 수익화 경쟁을 벌이고 있다. 오픈AI의 신임 최고 제품 책임자 케빈 웨일은 언론 행사에서 "2025년이 에이전트 시스템이 마침내 주류에 진입하는 해가 될 것으로 본다"고 말했다. "제대로 하면, 정말 중요한 인간적인 일에 더 많은 시간을 쓰고, 휴대폰만 들여다보는 시간을 조금 줄일 수 있는 세상으로 우리를 데려다줄 것입니다."

댓글 0
전체 1,366 / 90 페이지
(퍼플렉시티가정리한기사)화요일,의회의원들은AI챗봇이어린이들에게미치는정신건강위험을면밀히조사했으며,전문가들은취약한청소년들이이기술에대해건강하지못한정서적의존을형성하고자해및자살에관한위험한조언을받고있다고경고했다.하원감독및조사소위원회는"진실성을갖춘혁신:AI챗봇의위험과이점검토"라는제목의청문회를개최하여미성년자의대화형AI플랫폼사용에대한증가하는우려를검토했다.존조이스(펜실베이니아주공화당)위원장은챗봇상호작용과연관된일련의청소년자살사건이후AI혁신과취약한사용자보호사이의균형을맞출필요성을강조했다.​전문가들이위기관리실패사례를상세히설명하다정신건강전문가들은AI챗봇이종종놀라울정도로높은비율로해로운행동을지지하며적절한위기개입능력이부족하다고증언했습니다.AI와정신건강을전문으로하는정신과의사MarlynnWei박사는의원들에게"AI챗봇은인간보다50%더많이사용자의잘못된행동을지지한다"고말했습니다.그녀는챗봇이"허위또는오해의소지가있는정보를생성하는환각을일으킬수있으며,사용자를현실에고정시킬수있는장비가갖춰져있지않다"고덧붙였습니다.​BethIsraelDeaconessMedicalCenter의디지털정신의학책임자인JohnTorous박사는AI동반자가사용자들이봇을도구가아닌친밀한대상으로취급하는문제적인"준사회적관계"를조장할수있다고설명했습니다.그는챗봇이명확한경계를가진"자기계발서"처럼작동하여,대화가"너무개인적으로"되거나인간의개입이필요한"더깊은문제"와관련될때중단되어야한다고권고했습니다.​증언에따르면안전성테스트결과AI동반자는청소년정신건강응급상황에적절하게대응한비율이22%에불과한반면,범용챗봇은83%를기록했습니다.여러위원회위원들은청소년들이AI플랫폼에서매일몇시간씩보내고,일부는자해,섭식장애,성적콘텐츠를조장하는내용에노출된사례가문서화된것에대해우려를표명했습니다.​비극속에서규제압력이거세지다이번청문회는9월에시작된FTC조사에따른것으로,OpenAI,Meta,Alphabet을포함한7개주요AI기업을대상으로아동보호장치에관한정보를요구했습니다.이조사는14세SewellSetzerIII와16세AdamRaine의사례를포함하여AI챗봇이청소년자살에기여했다고주장하는여러소송이후시작되었습니다.​10월말,OpenAI는매주약120만명의ChatGPT사용자가"자살계획이나의도의명시적지표"를포함한대화에참여하고있으며,이는주간활성사용자8억명의0.15%에해당한다고공개했습니다.이후회사는위기대응능력을개선하기위해170명이상의정신건강전문가와협의했습니다.​부모들로부터과실치사소송을받은Character.AI는10월에11월말까지미성년자의챗봇접근을금지하겠다고발표했습니다.ErinHouchin하원의원(공화당-인디애나)은청문회에서긴급성을강조하며다음과같이말했습니다:"아이들은우리가카시트,놀이터,낯선사람위험에적용하는것과같은안전의식을온라인에서도받을자격이있습니다".
905 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)일론머스크의인공지능스타트업xAI가2,300억달러의기업가치로150억달러의신규지분투자를유치하기위한막바지협상을진행중인것으로월스트리트저널이보도했다.이는3월대비기업가치가두배이상증가한것으로,설립2년차인이벤처기업을세계에서가장가치있는비상장기업중하나로자리매김하게한다.​화요일밤머스크의자산관리사인제러드버철이투자자들에게자금조달조건을설명했으나,해당수치가투자전기업가치인지투자후기업가치인지는불분명한상태다.이번거래는xAI에게급격한성장을의미하는데,xAI는올해초소셜미디어플랫폼X와주식교환방식으로합병할당시1,130억달러의기업가치를공개한바있다.​수익성전망및경쟁적포지셔닝업계선두주자인OpenAI는5,000억달러의가치평가를받고있지만2029년까지1,150억달러의현금소진을예상하는반면,xAI는더이른시기에수익성을달성할수있는위치에있는것으로보입니다.Forbes가검토한투자자프레젠테이션녹음에따르면,ValorEquityPartners의JonathanShulkin은xAI가"빠르게매출을증가시키고있으며약2년반에서3년내에현금흐름플러스를달성할것으로예상된다"고밝혔으며,100억달러의현금보유고를유지하고있다고전했습니다.​이일정은xAI를2028년까지현금흐름플러스를달성할것으로예상하는Anthropic과동등한수준에놓이게합니다.이와대조적으로,OpenAI는올해연간매출130억달러를창출함에도불구하고2030년까지긍정적인현금흐름을달성할것으로예상하지않습니다.​인프라확장및재원조달전략자본의상당부분은xAI의공격적인인프라구축에배정되어있으며,여기에는테네시주멤피스에있는Colossus슈퍼컴퓨터가포함됩니다.이슈퍼컴퓨터는이미200,000개이상의그래픽처리장치로구성되어있으며100만개의GPU로확장하고있습니다.회사는최근최신AI챗봇인Grok4.1을출시했으며,이는감성지능및창의적글쓰기분야에서업계벤치마크1위를차지했습니다.​지분투자와함께ValorEquityPartners는특수목적법인을통해추가로150억~200억달러를조달하여Nvidia칩을구매하고이를xAI에임대할예정입니다.Nvidia는이구조에20억달러를투자하기로약속했으며,Shulkin은이를전통적인지분융자의40-50%비용보다xAI의자본비용을절감하기위해고안된"시장혁신"이라고설명했습니다.​Tesla주주들은이달초전기차제조업체가xAI에투자할수있도록하는제안을승인했지만,상당수가기권했습니다.Tesla,SpaceX,X,xAI를아우르는머스크의벤처들간상호연결된네트워크는지지자들의열정과잠재적이해충돌에대한정밀조사를모두받고있습니다.
895 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)MetaPlatforms,Inc.는오늘오픈소스컴퓨터비전모델컬렉션인SegmentAnythingCollection의최신버전인SAM3와SAM3D를발표했으며,텍스트기반객체감지및3D재구성기능을도입하여비디오편집및콘텐츠제작워크플로우를혁신할것이라고밝혔습니다.​이번릴리스는사용자가수동선택이아닌자연어프롬프트를사용하여객체를감지하고분할할수있도록함으로써이전SegmentAnything모델과는다른방향을제시합니다.Meta의발표에따르면,SAM3는"노란색스쿨버스"또는"빨간야구모자를쓰지않고앉아있는사람들"과같은텍스트문구로설명된객체의모든인스턴스를식별할수있습니다.SAM3D는단일이미지에서객체,사람및장면의3차원모델을재구성합니다.​텍스트프롬프트와향상된정확도SAM3는Meta의연구논문에따르면LVIS벤치마크에서47.0의제로샷마스크평균정밀도를달성하여기존시스템대비22%향상된성능을나타냅니다.이모델은H200GPU에서프레임당약30밀리초로이미지를처리하며동시에100개이상의객체를처리합니다.​Meta는발표에서"SAM3는이러한제한을극복하여훨씬더광범위한텍스트프롬프트를수용합니다"라고밝혔습니다.회사는Roboflow와협력하여개발자들이특정애플리케이션을위해데이터에주석을달고,미세조정하며,SAM3를배포할수있도록했습니다.​메타제품전반에걸친즉각적인통합Meta는이미자사의제품생태계전반에두모델을배포하고있습니다.SAM3는회사의Edits비디오제작앱과Vibes플랫폼에서새로운효과를지원하여,크리에이터들이콘텐츠내특정객체에수정을적용할수있도록합니다.SAM3D는FacebookMarketplace의새로운"방에서보기"기능을구현하여,사용자들이구매전에가구및홈데코아이템을자신의공간에서시각화할수있도록돕습니다.​​두모델모두Meta의새로운SegmentAnythingPlayground플랫폼을통해접근할수있으며,기술적전문지식이필요하지않습니다.Meta는SAM3모델가중치,평가벤치마크및연구논문을공개하고있으며,SAM3D모델체크포인트와추론코드는연구커뮤니티와공유되고있습니다.
876 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)OpenAI는월요일에GPT-5.1-Codex-Max를출시하며,복잡한다중시간프로그래밍프로젝트를다루는개발자들을위한획기적인최신에이전틱코딩모델로포지셔닝했습니다.내부적으로24시간개발작업을완료한것으로알려진이모델은컨텍스트를잃지않고수백만개의토큰에걸쳐일관되게작동할수있도록하는"압축(compaction)"기술을도입했습니다.​이번출시는Google이Gemini3Pro를공개한지하루만에이루어져,개발자도구시장에서AI거대기업들간의경쟁을심화시키고있습니다.OpenAI의발표에따르면,GPT-5.1-Codex-Max는이제모든Codex플랫폼에서GPT-5.1-Codex를대체하는기본모델이되었습니다.​성능향상및벤치마크결과GPT-5.1-Codex-Max는표준소프트웨어엔지니어링벤치마크인SWE-BenchVerified에서77.9%의정확도를달성하여,Gemini3Pro의보고된76.2%를근소하게앞질렀습니다.이모델은또한SWE-LancerICSWE에서79.9%를기록하여이전버전의66.3%와비교되며,TerminalBench2.0에서는58.1%에도달했습니다.​벤치마크점수를넘어,이모델은실질적인효율성개선을제공합니다.OpenAI는GPT-5.1-Codex-Max가실제코딩작업을완료할때GPT-5.1-Codex보다약30%적은토큰을사용하면서27%에서42%더빠르게작업을완료한다고보고합니다.ZDNET에따르면,이러한효율성향상은사용량제한이있는ChatGPTPlus구독자들에게잠재적으로추가1시간의프로그래밍시간으로환산됩니다.​압축시스템은주요아키텍처발전을나타내며,컨텍스트한계에접근할때필수정보를유지하면서세션기록을자동으로압축할수있게합니다.TheDecoder에따르면"모델이컨텍스트창을채우면자동으로세션기록을압축합니다".OpenAI의시스템카드는이모델이"압축이라는프로세스를통해여러컨텍스트창에걸쳐작동하도록기본적으로훈련된최초의모델"이라고명시합니다.​가용성및내부채택GPT-5.1-Codex-Max는ChatGPTPlus,Pro,Business,Edu및Enterprise사용자를위한Codex를통해즉시사용할수있습니다.OpenAI에따르면API액세스는"곧"제공될예정입니다.이모델은또한Windows환경에최적화된최초의Codex버전입니다.​OpenAI내부채택률은상당합니다.회사의10월발표에따르면,OpenAI엔지니어의95%가매주Codex를사용하고있으며,이도구를채택하기전과비교하여현재70%더많은풀리퀘스트를병합하고있습니다.OpenAI는"7월에절반을조금넘었던것에비해오늘날거의모든엔지니어가Codex를사용합니다"라고밝혔습니다.​이모델은프롬프트인젝션및데이터유출을포함한보안위험을완화하기위해기본적으로네트워크액세스가비활성화된샌드박스환경내에서작동합니다.
912 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입