AI 뉴스

Claude 개발자 플랫폼의 고급 도구 사용 소개

xtalfi

2025.11.25 17:40

553

0

0

Anthropic은 Claude를 위한 세 가지 베타 기능인 Tool Search Tool, Programmatic Tool Calling, Tool Use Examples를 출시했습니다. 이는 AI 에이전트가 컨텍스트 윈도우를 과부하시키지 않고 수백 또는 수천 개의 도구를 사용할 수 있도록 하며, 개별 API 요청 대신 코드를 통해 도구를 호출하고, 스키마 정의만으로가 아닌 구체적인 예시를 통해 올바른 사용법을 학습하도록 설계되었습니다.

내부 테스트에서 Tool Search Tool은 토큰 사용량을 85% 감소시키는 동시에 대규모 도구 라이브러리에서 Opus 4.5의 정확도를 79.5%에서 88.1%로 향상시켰으며, Programmatic Tool Calling은 복잡한 연구 작업에서 37%의 토큰 절감을 달성하면서 이전에 도구 호출당 수백 밀리초가 필요했던 여러 추론 과정을 제거했습니다.

이 기능들은 GitHub, Slack, Sentry, Grafana, Splunk를 연결하는 기본 5개 서버 설정에서 대화가 시작되기 전에 약 55,000개의 토큰을 소비하는 중요한 확장성 문제를 해결합니다. Anthropic은 최적화 이전 프로덕션 환경에서 도구 정의가 최대 134,000개의 토큰을 소비하는 것을 관찰했습니다.

링크

https://www.anthropic.com/engineering/advanced-tool-use?utm_source=perplexity

397 회 연결

댓글 0

전체 1,366 / 52 페이지

AI 코딩 도구가 위험한 보안 결함 생성

인공지능코딩어시스턴트가개발자들사이에서인기를얻고있는가운데,새로운연구결과가우려스러운보안환경을드러냈습니다.애플리케이션보안기업EndorLabs의조사에따르면,AI코딩에이전트가권장하는종속성중단5분의1만이안전하게사용할수있는것으로나타났습니다.이번달발표된회사의2025종속성관리현황보고서에서는AI모델에따라코딩에이전트가가져온종속성의44-49%가알려진보안취약점을포함하고있다는것을발견했습니다.나머지안전하지않은종속성은"환각된"패키지로구성되어있었는데,이는그럴듯하게들리지만실제로는존재하지않는소프트웨어구성요소로서,"슬롭스쿼팅(slopsquatting)"이라고불리는새로운공급망공격의여지를만들어냅니다.보안우려는결함이있는종속성을넘어확장됩니다.IEEE의기술과사회에관한국제심포지엄에발표된연구에서는AI가생성한코드가연구자들이"피드백루프보안저하"라고부르는현상을경험한다는것을밝혔습니다.40라운드반복에걸친400개의코드샘플을분석한결과,이연구는AI주도코드개선의단5번의반복후중대한취약점이37.6%증가했다는것을문서화했습니다.후기반복은초기반복보다일관되게더많은취약점을생성했으며,이는반복적인개선이코드품질을향상시킨다는가정에의문을제기합니다.전통적인버그를넘어선설계결함아키텍처와의도를고려하는인간개발자와달리,AI모델은다음토큰을예측하여암호화라이브러리를교체하거나,토큰수명을변경하거나,인증로직을수정함으로써보안을약화시키는미묘한설계결함을도입합니다.학술연구에따르면AI가생성한코드의약3분의1이알려진취약점을포함하고있으며,Veracode의100개이상의대규모언어모델에대한종합분석에서는AI가생성한코드의45%가보안결함을도입하는것으로나타났습니다.이문제는프로그래밍언어전반에걸쳐나타나지만,심각도는다양합니다.Java는72%의보안실패율로가장높은위험을보이는반면,Python은62%의보안통과율을,JavaScript는57%,C#은55%를나타냅니다.크로스사이트스크립팅과로그인젝션은특히문제가되는데,AI모델이각각86%와88%의비율로안전하지않은코드를생성합니다.최근사건들은이러한위험을강조합니다.OXSecurity테스트에서Lovable,Base44,Bolt를포함한AI앱빌더가사용자가명시적으로보안애플리케이션을요청했을때조차기본적으로저장된크로스사이트스크립팅취약점이있는코드를생성하는것으로밝혀졌습니다.한편,연구자들은GitHubCopilot과GitLabDuo에서소스코드도용,프롬프트인젝션공격,자격증명탈취를가능하게하는심각한취약점을발견했습니다.새로운공격표면AI에이전트를타사도구및통합과연결하는ModelContextProtocol은또다른취약점벡터로부상했습니다.이번주정리된보안타임라인은샌드박스탈출,악성서버패키지,수천개의애플리케이션을노출시킨과도한권한의API토큰을포함하여2025년내내발생한여러MCP관련침해사례를문서화하고있습니다.EndorLabs연구원들은MCP서버의75%가개인개발자에의해구축되었으며,41%는라이선스정보가부족하고,82%는신중한보안통제가필요한민감한API를사용하고있다는것을발견했습니다."AI코딩에이전트는현대개발워크플로우의필수적인부분이되었습니다"라고EndorLabs의보안연구원HenrikPlate는말했습니다."충분한검증없이는악용을위한새로운경로를열수있습니다."AI코딩도구의확산은둔화될기미를보이지않습니다.StackOverflow의2025년개발자설문조사에따르면,개발자의84%가개발프로세스에서AI도구를사용중이거나사용할계획이며,전문개발자의51%가매일이를사용하고있습니다.그러나개발자신뢰는도입에뒤처지고있습니다:46%가AI도구출력의정확성을적극적으로불신하고있으며,이는전년도31%에서증가한수치이고,66%는"거의맞지만완전히맞지는않은AI솔루션"에대한불만을언급했습니다.

499

0

2025.11.27

KAIST, AI 의사결정 과정을 시각화하는 기술 공개

한국과학기술원(KAIST)의연구진은인공지능시스템내부를들여다보고개념이어떻게형성되는지시각화할수있는새로운방법을개발했으며,이는전문가들이AI가어떻게사고하는지를이해하는데있어중요한진전이라고평가하고있습니다.‘세분화개념회로(GranularConceptCircuits)’로불리는이기술은딥러닝모델의내부의사결정과정을설명하는오랜과제를해결했습니다.딥러닝모델은전통적으로이해하기어려운‘블랙박스’로작동해왔기때문입니다.KAIST는10월호놀룰루에서열린국제컴퓨터비전학회(InternationalConferenceonComputerVision)에서연구팀이이결과를발표한데이어,11월26일이번혁신을공식발표했습니다.뉴런에서회로로의전환KAIST김재철AI대학원최재식교수연구팀은기존의개별뉴런에서벗어나여러뉴런이협력하여개념을인식하는회로(신경망)를중심으로접근방법을확장하여해당방식을개발했다.기존방법들은"특정뉴런이특정개념을감지한다"고가정했지만,연구팀은딥러닝모델이사실상여러뉴런이협동하는구조적회로를통해개념을형성한다는사실을발견했다.시스템은뉴런이특정특징에얼마나강하게반응하는지를측정하는'뉴런감도'와,다음개념으로특징이얼마나강하게전달되는지를보여주는'의미흐름'이라는두가지핵심지표를계산하여이러한회로를자동으로추적한다.이측정을바탕으로색깔,질감등기초적인특징들이점진적으로더높은수준의개념으로조합되는과정을시각화할수있다.연구진은이러한발견을검증하기위해특정회로를비활성화하는실험을진행했다.특정개념을담당하는회로가꺼질때AI의예측결과가변하는현상이관찰되었고,이를통해해당회로가실제로예상했던인식기능을수행함을직접적으로입증했다.AI투명성의실용적적용Ph.D.후보자인권다희와이세현이공동제1저자로참여한이번연구는AI의사결정의투명성강화,오분류원인분석,편향탐지,모델디버깅및아키텍처개선등설명가능한AI영역전반에걸친응용가능성을시사한다.연구진은"이기술은AI가내부적으로형성하는개념구조를사람이이해할수있는방식으로보여준다"고밝히며,이번연구가"AI가어떻게생각하는지연구하는과학적출발점역할을한다"고덧붙였다.최교수는이번접근법이기존방식과는다르다고강조했다."복잡한모델을설명을위해단순화한기존접근법과달리,본연구는미세한회로수준에서모델내부를정밀하게해석하는최초의접근법이다"고말했다.

494

0

2025.11.27

AI 쇼핑 어시스턴트가 블랙 프라이데이 소매업 재편

이번주미국주요소매업체들은인공지능쇼핑어시스턴트를도입하며,휴일쇼핑수요를선점하기위한공동의노력을펼쳤습니다.이는모바일쇼핑도입이후전자상거래분야에서가장중요한변화로평가받고있습니다.아마존의AI어시스턴트루퍼스(Rufus)는연간100억달러이상의추가매출을창출할것으로예상되며,앤디재시(AndyJassy)CEO는지난달이도구를2025년까지2억5천만명의활성고객이사용할것이라고발표했습니다.루퍼스를사용하는고객은일반쇼핑객에비해구매를완료할확률이60%더높은것으로나타났습니다.타겟은11월25일ChatGPT연동기능을출시,고객들이OpenAI의챗봇내에서제품을탐색하고,여러상품으로장바구니를구성하며,바로구매까지완료할수있도록했습니다.타겟의최고정보및제품책임자인프랫베마나(PratVemana)는이번주직접해당기능을테스트해앱을통해수면복을구매했다고밝혔습니다.베마나는“ChatGPT,퍼플렉서티,제미니등어떤플랫폼이든,우리는고객이가진질문에답하는데함께하고싶다”고말했습니다.월마트는자체AI쇼핑어시스턴트스파키(Sparky)내에서광고를테스트해왔다고이사안에정통한관계자들이전했습니다.월마트는9월부터11월초까지일부광고주와함께“스폰서드프롬프트(SponsoredPrompt)”형식의광고실험을진행했습니다.관련소식이후월마트주가는2.07%상승했습니다.AI쇼핑도구출시붐세개의주요AI플랫폼이며칠간격으로경쟁적인쇼핑기능을공개했습니다.OpenAI는11월24일,명확한질문을하고맞춤형구매자가이드를생성하는GPT-5mini의특화버전으로구동되는ShoppingResearch도구를출시했습니다.Perplexity는11월25일PayPal통합이적용된쇼핑어시스턴트를선보였으며,5,000개가넘는가맹점에대한즉시결제를제공합니다.Google는11월중순AIMode와Gemini앱을통해자동가격추적과가까운매장에전화를걸어재고를확인할수있는기능등에이전트기반의쇼핑기능을도입했습니다.소매업체들,검색전략조정이러한변화는소매업체들이디지털존재감을재고하도록만들고있다."과거월3~4개의새로운블로그게시물을발행하던브랜드들이이제는100개또는200개를목표로하고있습니다"라고생성형엔진플랫폼Eune.ai의CEO인브라이언스템펙(BrianStempeck)은말했다.일부소매업체들은소비자에게는보이지않는웹사이트를구축하고있으며,이는AI스크래퍼가제품정보를추출할수있도록독점적으로설계되었다.현재ChatGPT로부터주요소매업체로의트래픽은10월센서타워(SensorTower)데이터에따르면전체사이트방문의1%미만을유지하고있다.그러나세일즈포스(Salesforce)는사이버위크(CyberWeek)기간동안AI가전세계매출730억달러에영향을미칠것으로예상하며,이는전체매출의22%에해당한다.

476

0

2025.11.27

중국 AI 모델이 전 세계 다운로드에서 미국을 앞질러

매사추세츠공과대학교(MassachusettsInstituteofTechnology)와허깅페이스(HuggingFace)의공동연구에따르면,중국인공지능(AI)모델이글로벌다운로드에서처음으로미국개발자를앞질러,시장점유율17%를차지한반면미국창작자는15.8%에머문것으로나타났습니다.이변화는AI의미래를형성하기위한경쟁에서중대한순간을의미하며,딥시크(DeepSeek)와알리바바그룹홀딩스(AliababaGroupHoldingLimited)의Qwen모델이주도하고있습니다.이모델들은자주업데이트되며비용효율적인대안을제공함으로써점차인기를얻고있습니다.보안취약점경고발령중국모델채택의급증은심각한보안우려를불러일으켰습니다.사이버보안기업CrowdStrike가11월20일발표한연구에따르면,DeepSeek의AI모델은티베트,위구르족또는베이징이문제시하는기타주제에대한정치적으로민감한참조가포함된프롬프트를받을때훨씬더많은안전하지않은코드를생성하는것으로나타났습니다.DeepSeek은중립적인경우19%의취약한코드를생성했지만,티베트의산업제어시스템용코드를작성하도록요청받았을때그수치는27.2%로급증했습니다.이러한결함은모델의추론프로세스가완료된후에나타나는것으로보이며,이는불량한훈련데이터가아닌내재된편향을시사합니다.연구들은또한중국공산당과의명확한이념적정렬을문서화했으며,모델들이대만이나천안문사건과같은민감한주제에대한콘텐츠생성을거부하는것으로나타났습니다.신미국안보센터(CenterforNewAmericanSecurity)의연구원JanetEgan은"중국이오픈모델분야에서상당한진전을이루고있다는사실은미국에경종을울려야합니다"라고말했습니다.전략적분기가경쟁을촉진하다중국의오픈소스전략은미국주요기술기업들의접근방식과뚜렷한대조를이룹니다.OpenAI,Google,그리고Anthropic은가장진보된모델에대해엄격한통제를유지하며,폐쇄형시스템을통한인공일반지능개발과구독을통한수익창출에집중해왔습니다.Meta는이전에Llama모델로오픈소스AI의선두주자였으나,"초지능"을추구하면서폐쇄형모델개발로방향을전환했습니다.한편,중국기업들은부분적으로Nvidia고급칩에대한미국의수출규제로인해오픈소스릴리스를추진하게되었습니다.이로인해중국개발자들은더혁신적인접근방식을채택하게되었으며,미국연구소들의전형적인반년또는연간주기와비교하여매주또는격주로모델변형을릴리스하고있습니다.AllenInstituteforAI는11월에Olmo3를미국의최신오픈소스AI기여작으로릴리스했지만,이는이분야에서몇안되는주요미국노력중하나를나타냅니다.벤처캐피털기업AndreessenHorowitz에투자제안을하는AI스타트업의최대80%가현재중국오픈소스모델을사용하고있다고파트너MartinCasado가밝혔으며,이는이분야에서중국의증가하는우위가미치는실질적인영향을강조합니다.

484

0

2025.11.27