Loading...

AI 뉴스

AI 에이전트의 수학적 한계... "신뢰성 100%는 불가능"

페이지 정보

작성자 symbolika
작성일 2026.01.25 10:12
447 조회
0 추천
0 비추천

본문

AI Agents Math

Executive Summary

• 최근 발표된 연구 논문에서 트랜스포머 기반 언어 모델(LLM)은 일정 수준 이상의 복잡한 계산 및 에이전트 작업을 수행할 수 없다는 수학적 증명을 제시
• AI 업계는 이에 반박하며, 환각(hallucination)은 불가피하지만 가드레일(guardrails)로 통제 가능하다고 주장
• 스타트업 Harmonic은 수학적 검증 방법론으로 AI 코딩의 신뢰성을 높이는 해법을 제시하며 벤치마크 선두 기록
• OpenAI도 자체 연구에서 "정확도 100%는 도달할 수 없다"고 인정했으나, 업계 전반은 에이전트 기술 발전에 낙관적 입장 유지
• 전문가들은 환각을 '버그'가 아닌 인간을 초월한 발상의 원천으로 재해석하는 시각도 제시


Background

2025년은 AI 업계에서 '에이전트의 해'로 기대됐지만, 실제로는 에이전트에 대한 논의만 무성했을 뿐 실질적 전환점은 2026년 이후로 미뤄졌다. 이러한 가운데 전 SAP CTO 비샬 시카(Vishal Sikka)와 그의 아들이 공동 저술한 논문이 LLM 기반 에이전트의 본질적 한계를 수학적으로 논증하며 업계에 파장을 일으켰다.


Impact & Implications

기술적 한계와 현실

해당 논문은 LLM이 순수한 단어 예측 메커니즘을 넘어서는 추론 모델조차도 근본적 한계를 극복할 수 없다고 주장한다. 논문 공저자 시카는 "순수 LLM에는 본질적 한계가 있지만, LLM 주변에 이를 보완하는 구성요소를 구축할 수 있다"며 완전한 비관론을 경계했다. 이는 원자력 발전소 같은 고위험 인프라의 AI 자동화는 당분간 현실적이지 않음을 시사한다.

업계의 대응과 해법 모색

스타트업 Harmonic은 수학적 검증 기법을 통해 AI 출력물의 신뢰성을 보장하는 접근법을 제시했다. 특히 검증 기능으로 유명한 Lean 프로그래밍 언어로 출력을 인코딩하는 방식이 핵심이다. 구글의 AI 수장 데미스 하사비스(Demis Hassabis)도 다보스 포럼에서 환각 최소화 연구의 돌파구를 발표하는 등 대형 테크 기업들도 해결책 마련에 속도를 내고 있다.

환각의 재해석: 버그인가, 혁신의 원천인가

Harmonic의 튜더 아킴(Tudor Achim)은 "환각은 LLM에 본질적이면서도 인간 지능을 초월하는 데 필수적"이라며 환각을 새로운 시각으로 재정의했다. 그에 따르면 시스템이 학습하는 방식 자체가 환각을 통한 것이며, 대부분 틀리지만 때로는 인간이 한 번도 생각하지 못한 것을 만들어낸다는 것이다.


Key Data & Facts

항목수치/내용
연구 주제트랜스포머 기반 LLM의 계산적·에이전트적 한계 수학적 증명
주요 논문 저자Vishal Sikka (전 SAP CTO, Vianai CEO)
Harmonic 창업자Vlad Tenev (Robinhood CEO), Tudor Achim
OpenAI 공식 입장"AI 모델의 정확도는 절대 100%에 도달하지 못할 것"
검증 기술Lean 프로그래밍 언어 기반 수학적 검증

Key Quote

"There is no way they can be reliable... you might have to resign yourself to some mistakes."
— Vishal Sikka, Vianai CEO 겸 전 SAP CTO
"I think hallucinations are intrinsic to LLMs and also necessary for going beyond human intelligence."
— Tudor Achim, Harmonic 공동창업자
댓글 0
전체 1,366 / 112 페이지
(퍼플렉시티가정리한기사)도쿄에본사를둔SakanaAI는시리즈B펀딩에서26억5천만달러의기업가치로1억3천5백만달러를확보하여일본에서가장가치있는민간AI스타트업으로서의입지를굳혔으며,올해일본에서가장큰규모의AI펀딩라운드중하나를기록했습니다.MitsubishiUFJFinancialGroup이주도한이번라운드로설립2년차인이회사의총펀딩규모는약3억7천9백만달러에달하게되었습니다.​투자자명단에는기존투자자인KhoslaVentures,NewEnterpriseAssociates,LuxCapital과함께MacquarieCapital,In-Q-Tel,MouroCapital과같은신규투자자가포함되어있습니다.CIA의벤처캐피털부문인In-Q-Tel의참여는국가안보응용분야에서Sakana기술의전략적중요성을시사합니다.​기업및방위산업으로의전략적확장2023년전Google연구원인DavidHa,LlionJones,RenIto가설립한SakanaAI는CEOHa가"주권AI(SovereignAI)"라고부르는분야—일본의언어,문화,규제환경에최적화된모델—에서선두주자로빠르게자리매김했습니다.Jones는현대AI시스템의기반이되는트랜스포머아키텍처를소개한획기적인논문"AttentionIsAllYouNeed"의공동저자입니다.​이회사의접근방식은OpenAI와Google같은미국거대기업들과달리"진화적모델병합(EvolutionaryModelMerge)"을사용하는데,이는대규모시스템을처음부터훈련하는대신기존모델들을결합하는기술입니다.이러한자연에서영감을받은방법은계산비용과에너지소비를줄여Sakana가일본기업을위한특화된AI솔루션을만들수있게합니다.​새로운자본을통해Sakana는2025년5월MUFG은행과체결한포괄적인다년계약을포함한현재의금융부문파트너십을넘어2026년까지국방,제조,정부부문으로확장을가속화할계획입니다.Ha는TechCrunch에"우리는AI모델개발을포함한R&D뿐만아니라일본내엔지니어링,영업및유통팀의인력확충을위해새로운자본을배치할계획입니다"라고말했습니다.​일본의AI야심이구체화되다이번자금지원은일본이2025년5월AI진흥법을통과시킨후국가AI전략을추진하는가운데이루어졌으며,이법안은국가의AI개발노력을조율하기위해총리가주도하는AI전략본부를설립했습니다.이법안은고령화인구로인한인력문제를해결하는동시에외국AI시스템에대한의존도를줄이려는일본의노력을반영합니다.​Sakana의급부상—2024년초3천만달러시드라운드에서현재26억5천만달러가치평가에이르기까지—은최근140억달러가치평가를달성한유럽의주권AI선두주자MistralAI의궤적과유사합니다.두회사모두국가적가치와규제요구사항을반영하는지역맞춤형AI솔루션을향한글로벌트렌드의성장을대표합니다.​"MUFG는처음부터SakanaAI의세계적수준의기술역량을인정해왔습니다"라고미쓰비시UFJ파이낸셜그룹의사장겸그룹CEO인카메자와히로노리가말했습니다."이번투자를통해AI의혜택이은행업무혁신을넘어일본의다양한산업으로확대되기를바랍니다".
1304 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)Amazon은월요일120억달러규모의회사채발행을시작했으며,이는블룸버그뉴스에따르면이전자상거래및클라우드컴퓨팅거대기업이3년만에미국달러채권시장으로복귀한것이라고합니다.이러한움직임은인공지능인프라구축경쟁을벌이고있는빅테크기업들의증가하는자본수요를강조합니다.​이번발행은단기부터40년까지만기가다양한6개트랜치로구성되어있으며,사안에정통한소식통에따르면최장기채권의초기가격논의는미국국채수익률대비약115베이시스포인트상회하는수준이라고합니다.FitchRatings는Amazon의강력한신용프로필을반영하여이채권에AA-등급을부여했습니다.​GoldmanSachs,JPMorganChase,그리고MorganStanley가이번발행을주관하고있습니다.조달자금은부채상환,인수합병및투자를포함할수있는일반기업목적으로사용될예정입니다.​AI지출이기술부채붐을부채질하다아마존의채권발행은AI데이터센터와인프라에대한대규모투자를위해자금을조달하는기술기업들의더큰차입물결의일부입니다.이회사의자본지출은2025년3분기에342억달러에달했으며,연초누계지출은899억달러에이릅니다.아마존은현재2025년전체자본지출이약1,250억달러에달할것으로예상하며,2026년에는추가증가가예상됩니다.​이번채권발행은기술기업들이9월과10월에만AI데이터센터지출을위해750억달러를차입한시점에이루어졌으며,이는지난10년간연평균의두배이상입니다.메타플랫폼스는10월말에300억달러를조달하여기록적인1,250억달러의주문을받았으며,알파벳은11월초유럽채권발행을통해최소30억유로를확보했습니다.​JP모건체이스는AI붐이미국투자등급채권발행을2026년기록적인1조8,100억달러로끌어올릴것으로예측하며,기술기업들만2,520억달러를차입할것으로예상됩니다.이는2025년수준보다61%증가한것입니다.JP모건전략가들은"인공지능에대한투자를위한자금조달을위한새로운지출물결"이급증을촉진할것이라고썼습니다.​유리한시장상황아마존은2025년11월초기준으로회사채스프레드가국채대비약81bp(베이시스포인트)로역사적으로타이트한수준을유지하고있는시장에진입하고있습니다.좁은스프레드는강력한투자자수요와우호적인신용조건을반영하지만,일부애널리스트들은불리한상황에대비한여유가거의없다고경고합니다.​아마존은2022년4월미국달러시장에서127억5천만달러를조달하며마지막으로채권을발행했습니다.아마존은약500억달러의미상환채권을보유하고있습니다.
1391 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)리바이스트라우스(LeviStrauss&Co.)와마이크로소프트(MicrosoftCorporation)는일요일,데님대기업의본사,소매점,물류창고전반의직원들을지원하기위한AI기반"슈퍼에이전트"를공동개발하는파트너십을발표했다.Azure기반오케스트레이터에이전트는MicrosoftTeams에내장되어있으며,이는175년역사의의류기업이직접소비자에게우선적으로접근하는소매업체로거듭나기위한전략의핵심이다.​직원생산성을위한AI오케스트레이션슈퍼에이전트는직원들이질문할수있는중앙집중식포털로서,이러한질문들이무대뒤에서운영되는전문서브에이전트들에게전달됩니다.리바이스트라우스는이번구현의일환으로Microsoft365Copilot,CopilotStudio,AzureAIFoundry,SemanticKernel을도입중이며,일부서브에이전트는이미가동중이고다른일부는개발중입니다.​"우리는리바이스트라우스앤컴퍼니를DTC(Direct-to-Consumer)중심,팬집착형소매업체로재구성해모든상호작용을더빠르고,더똑똑하며,더개인적으로만들고있습니다."라고리바이스트라우스의최고디지털및기술책임자제이슨고완스는성명에서밝혔습니다."AI는이러한변화의중심에있으며,혁신을촉진하고,직원들의창의력을높이고,생산성을향상시키며,우리팬들이계속해서다시찾아오게만드는연결된,기억에남는경험을제공하는데도움을주고있습니다."​또한회사는Windows11이탑재된SurfaceCopilot+PC도도입하고있는데,직원들은이로인해속도,신뢰성,데이터처리능력이향상되었다고보고하고있습니다.GitHubCopilot은가시성,품질엔지니어링,릴리스관리프로젝트의개발작업속도를높이고있습니다.​더넓은디지털전환의일부AI이니셔티브는리바이스트라우스가온프레미스데이터센터의애플리케이션워크로드를마이크로소프트애저(MicrosoftAzure)로이전하는과정에동반되었습니다.회사는AzureMigrate와GitHubCopilot을사용하여클라우드내사설데이터센터환경통합을계획했습니다.AzureAIFoundry와SemanticKernel은보안에이전트와정책오케스트레이션을지원하여제로트러스트보안모델을유지하면서AI기반혁신의확장을가능하게합니다.​리바이스트라우스는2024년순매출64억달러를기록했으며,약120개국에서3,200개소매점및숍인숍(shop-in-shops)을통해제품을판매했습니다.회사의다이렉트투컨슈머(Direct-to-Consumer)채널은현재미국시장의40%이상을차지합니다.​“리바이스트라우스앤코(LeviStrauss&Co.)는아이코닉브랜드가클라우드및AI기술로어떻게스스로를재창조할수있는지보여주는모범입니다.”라고마이크로소프트의전세계소매및소비재산업부문부사장인키스머시에(KeithMercier)는말했습니다.이파트너십은소매업체들이에이전틱(Agentic)AI시스템을점점더채택하고있는가운데이루어졌으며,맥킨지(McKinsey)가11월초에발표한설문조사에따르면전체조직의23%가이미이러한기술을기업전반에확장하고있다고합니다.
1259 조회
0 추천
2025.11.18 등록
(퍼플렉시티가정리한기사)서울에본사를둔BoneAI는인공지능기반방위로보틱스를구축하기위해1,200만달러의시드펀딩을확보했으며,690억달러규모의아시아방산기성산업에도전하는신생아시아방산기술스타트업물결에합류했다.​뉴욕벤처회사ThirdPrime이주도하고한국산업대기업코오롱그룹의전략적투자가참여한이번라운드는,기존제조업체들이지배하는지역에서방산혁신에대한이례적인투자를나타낸다.이전에위조방지스타트업MarqVision을공동창립한BoneAI창립자DKLee는이번라운드에150만달러를개인적으로투자했으며,이는전체투자액의10퍼센트이상을차지한다.​아시아방위산업거대기업들과의경쟁서울과팔로알토에기반을둔이스타트업은국방및정부고객을위해자율드론,지상차량,해양시스템을개발하고있으며,초기에는물류지원,산불감지,안티드론방어를위한항공드론에집중하고있습니다.운영첫해에본(Bone)은300만달러의매출을올렸고,7자리수의정부계약을확보했다고테크크런치는전했습니다.​이대표(Lee)는출시6개월만에한국드론제조업체D-Makers를인수해회사의하드웨어지식재산권을본의AI플랫폼에즉시통합함으로써회사의성장을가속화했습니다.이스타트업은자율주행차량을도입하는한국정부주도의종단간(end-to-end)물류프로그램에선정되었습니다.​이번투자는2024년말기준국내방산대기업들의주문잔고가약690억달러에이르는가운데이뤄졌으나,2024년11월유럽연합-한국안보및방위파트너십체결이후서울이유럽나토회원국들의두번째로큰무기공급국이됐음에도불구하고한국의방산테크스타트업생태계는여전히미흡한실정입니다.미국의방산테크기업안듀릴(Anduril)은305억달러의기업가치를기록했고,유럽의헬싱(Helsing)은120억유로(138억달러)에달하지만,아시아에서는이와견줄만한기업이아직나오지않았습니다.​“아시아는아직동일한수준의채택을보지못했습니다.”라고ThirdPrime의제너럴파트너마이클킴(MichaelKim)은말하며,본이“주권AI,다극화,재산업화의교차점”에위치하고있다고강조했습니다.킴은“한국의고품질,비용경쟁력있는하드웨어제조산업”과본의인수전략이결합한다면“제품성숙도와상업적성과를더욱가속화할수있을것”이라고언급했습니다
1328 조회
0 추천
2025.11.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입