AI 뉴스

AI 에이전트 구축은 여전히 어렵다

페이지 정보

작성자 xtalfi
작성일 11.23 17:10
48 조회
0 추천
0 비추천

본문

179eca808840ce5856d6d8f0d4e339a7_1763885343_7714.png
 

개발자 Armin Ronacher는 2025년에도 AI 에이전트 구축이 여전히 어렵다고 주장하며, Vercel AI SDK와 같은 고수준 SDK 추상화는 실제 도구 사용을 처리할 때 제대로 작동하지 않아, 캐싱, 강화, 에이전트 루프 설계에 대한 더 나은 제어를 위해 Anthropic과 OpenAI의 네이티브 플랫폼 SDK로 회귀하게 된다고 설명한다.

이 글은 명시적 캐시 관리가 자동 캐싱보다 예상외로 우수하다고 지적하며, Anthropic의 수동 캐시 제어는 개발자가 대화를 분할하고, 컨텍스트를 편집하며, 시스템 프롬프트 이후와 대화 기록 전반에 캐시 포인트를 배치하여 비용을 더 정확하게 예측할 수 있게 한다고 설명한다.

Anthropic Claude 모델은 명시적 캐싱 전략을 통해 최대 90%의 비용 절감을 달성할 수 있지만, 에이전트 개발자들은 학습을 위한 상세한 실패 로깅의 이점과 모든 오류를 컨텍스트에 보존하는 데 따르는 토큰 비용 사이의 근본적인 긴장 관계에 직면한다.

댓글 0
전체 1,203 / 26 페이지
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
75 조회
0 추천
11.21 등록
Google은사용자가"이것이AI로생성된것인가요?"라고질문하여이미지가GoogleAI도구에의해생성되었거나수정되었는지확인할수있는기능을Gemini앱에추가하고있으며,향후에는이검증기능을동영상,오디오,그리고Google검색으로확대할계획입니다.​이기능은현재Google의독점적인보이지않는워터마킹기술인SynthID에기반하고있지만,앞으로는업계표준인C2PA(콘텐츠출처및진위연합)자격증명을지원하게되어,OpenAI의Sora를포함한더다양한AI도구에서생성된콘텐츠도탐지할수있습니다.​TikTok도이번주에AI생성콘텐츠에C2PA워터마킹을도입하겠다고발표했으나,이러한탐지시스템의보다광범위한활용은소셜미디어플랫폼이수동사용자검증이아니라자동플래그기능을개발하는데달려있습니다.
75 조회
0 추천
11.21 등록
음성AI스타트업Wispr은3천만달러규모의시리즈A투자를확보한지불과5개월만에NotableCapital이주도한2,500만달러를추가로유치하여총투자금을8,100만달러로늘렸으며,이는받아쓰기앱WisprFlow가전월대비40%의성장을경험하고있다고TechCrunch가보도했다.​회사는사용자들이3개월사용후앱을통해자신의문자의50%이상을작성한다고보고하며,WisprFlow는270개의Fortune500기업에도달했고125개기업이엔터프라이즈고객으로계약했으며,OpenAI의Whisper의27%및Apple의네이티브전사기능의47%와비교하여10%의오류율을달성했다.​Wispr은투자자HansTung이"워크플로우자동화를시작할수있는음성주도운영체제"라고부르는것으로받아쓰기를넘어진화하는것을목표로하며,YC지원Willow와Aqua,Superwhisper등을포함한경쟁이치열한시장에서경쟁하고있으며,음성인식기술시장은2034년까지500억달러를초과할것으로예상된다.
71 조회
0 추천
11.21 등록
Google은목요일새로운Gemini3Pro모델을기반으로구축된업그레이드된AI이미지생성도구인NanoBananaPro를출시하여,전문편집소프트웨어의경쟁자로자리매김할수있는향상된기능을제공합니다.​이번출시는화요일에공개된Gemini3Pro에이어나온것으로,8월에단4일만에1,300만명의신규사용자를유치하며입소문을탄원래NanoBanana모델의주요한계점을해결했습니다.업데이트된도구는이제2K및4K이미지해상도,16:9를포함한다양한화면비율을지원하며,최대5명의인물에대한캐릭터일관성을유지하거나14개의서로다른이미지를혼합할수있습니다.​추론능력이사용자경험을변화시킵니다Gemini2.5Flash로구동되었던이전버전과달리,NanoBananaPro는이미지를생성하기전에복잡한데이터를해석하기위해Gemini3Pro의추론능력을활용합니다."인포그래픽제작에탁월합니다.슬라이드프레젠테이션을생성할수있으며,캐릭터일관성을유지하면서최대14개의서로다른이미지또는5개의다른캐릭터를관리할수있습니다"라고GoogleLabs및Gemini의부사장인JoshWoodward가CNBC에말했습니다.​이모델은운동루틴,코드스니펫,데이터세트를분석하여시각화를생성할수있으며,단순한텍스트-이미지생성을넘어섭니다.AndroidAuthority의테스트에따르면,이도구는이제후속편집요청을효과적으로처리하는반면,원래버전은"마치디지털머리를벽에부딪히는것처럼동일한편집을반복했습니다".​OpenAI에대한전략적압박이번출시는11월12일GPT-5.1을발표한OpenAI와의경쟁이심화되는가운데이루어졌습니다.Google의Gemini앱은현재월활성사용자6억5천만명을보유하고있어,ChatGPT의주간사용자7억~8억명과의격차를좁히고있습니다.​NanoBananaPro는Gemini앱에서제한된무료할당량으로제공되며,사용자가할당량을모두소진하면원래모델로되돌아갑니다.유료구독자인GoogleAIPlus,Pro,Ultra사용자는더높은할당량을받으며,Ultra구독자는Flow비디오도구에서도액세스할수있고가시적워터마크가면제됩니다.이도구는NotebookLM,GoogleSlides,GoogleVids및GeminiAPI에도배포되고있습니다.​모든이미지에는검증목적으로Google의비가시적SynthID워터마크가포함되며,무료및Pro등급사용자에게는가시적인Gemini스파클워터마크가표시됩니다.
77 조회
0 추천
11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입