AI 뉴스

중국 스타트업, 오픈소스 AI가 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.08 14:59
1,202 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581565_2634.jpg
 

(퍼플렉시티가 정리한 기사)


중국 스타트업 Moonshot AI는 목요일 Kimi K2 Thinking 모델을 출시하며, 1조 개의 매개변수를 가진 이 오픈소스 시스템이 추론, 코딩 및 자율 에이전트 작업에 대한 여러 벤치마크에서 OpenAI의 GPT-5, Anthropic의 Claude Sonnet 4.5, 그리고 이전 오픈소스 선두주자인 MiniMax-M2를 능가한다고 주장했다.​

이번 출시는 Nvidia CEO Jensen Huang이 중국이 "AI에서 미국보다 나노초 뒤처져 있다"고 경고하며 미국의 개발 가속화 필요성을 강조한 시점에 이루어졌다. 이 타이밍은 OpenAI CFO Sarah Friar가 미국 정부가 1.4조 달러를 초과하는 AI 인프라 투자에 대해 "안전망"을 제공해야 한다고 제안한 발언으로 인한 최근 논란을 고려할 때 특히 주목할 만하다—이 발언은 그녀와 CEO Sam Altman이 신속히 철회했다.​


벤치마크 성능이 독점 모델에 도전하다

Kimi K2 Thinking은 AI가 발전함에 따라 계속 도전적으로 유지되도록 설계된 2,500개의 전문가 검증 질문으로 구성된 최전선 수준의 벤치마크인 Humanity's Last Exam에서 44.9%를 달성했습니다. 이 모델은 GPT-5가 54.9%를 기록하고 Claude Sonnet 4.5가 24.1%에 도달한 웹 연구 벤치마크인 BrowseComp에서 60.2%를 기록했습니다. 실제 소프트웨어 엔지니어링 문제 해결을 테스트하는 SWE-Bench Verified에서 K2 Thinking은 71.3%를 기록했습니다.​

제3자 평가 기관인 Artificial Analysis에 따르면, K2 Thinking은 도구 사용이 필요한 고객 서비스 시나리오에서 AI 성능을 측정하는 Tau2 Bench Telecom 에이전트 벤치마크에서 최고 점수를 달성했습니다. 이 모델은 인간의 개입 없이 수백 단계에 걸쳐 일관된 추론을 유지하면서 200-300개의 순차적 도구 호출을 자율적으로 실행할 수 있습니다.​


독점 시스템 대비 비용 우위

Moonshot AI는 K2 Thinking의 API 가격을 캐시된 입력의 경우 백만 토큰당 $0.15, 캐시 미스의 경우 백만 토큰당 $0.60, 출력의 경우 백만 토큰당 $2.50로 책정했습니다. 이는 GPT-5의 백만 입력 토큰당 $1.25, 백만 출력 토큰당 $10의 가격과 비교됩니다. Claude Sonnet 4.5는 백만 입력 토큰당 $3, 백만 출력 토큰당 $15입니다.​

CNBC가 인용한 소식통에 따르면 훈련 비용은 총 460만 달러로 보고되었습니다. 이는 OpenAI와 다른 미국 기업들이 모델 개발에 지출한 수십억 달러와 대조를 이룹니다.​


수정된 MIT 라이선스 하의 오픈 액세스

이 모델은 Hugging Face에서 수정된 MIT 라이선스로 제공되며, 한 가지 조건과 함께 완전한 상업적 및 파생 권리를 제공합니다: 월간 활성 사용자 100만 명을 초과하거나 월 2천만 달러 이상의 수익을 창출하는 제품은 사용자 인터페이스에 "Kimi K2"를 눈에 띄게 표시해야 합니다. 개발자들은 Moonshot의 플랫폼인 platform.moonshot.ai와 kimi.com을 통해 모델에 접근할 수 있습니다.​

이번 출시는 중국 기업들이 오픈소스 AI를 배포하여 서구의 독점 시스템에 도전하는 패턴을 확장합니다. Airbnb CEO 브라이언 체스키(Brian Chesky)는 최근 자신의 회사가 AI 고객 서비스를 위해 Alibaba의 Qwen 모델에 "크게 의존"하고 있으며, ChatGPT에 비해 "매우 좋고" "또한 빠르고 저렴하다"고 칭찬했습니다.​

2023년에 설립되고 Alibaba와 Tencent의 지원을 받는 Moonshot AI는 2024년 2월에 25억 달러 기업 가치로 10억 달러를 조달했고, 2024년 8월에는 추가로 3억 달러를 조달했습니다.

댓글 0
전체 1,366 / 97 페이지
(퍼플렉시티가정리한기사)LG생활건강은화요일자사의웨어러블뷰티기기인하이퍼리쥬버네이팅아이패치(HyperRejuvenatingEyePatch)가뷰티테크부문에서CES2026혁신상을수상했다고발표했으며,이는세계최대소비자가전전시회에서동사가받은첫번째수상이다.이번수상은뷰티브랜드들이인공지능과웨어러블기술을스킨케어솔루션에점점더통합하고있는가운데이루어졌다.​이기기는AI기반피부분석,생체모방패치기술,그리고제어된LED광치료를결합하여눈가의노화징후를타겟으로한다.60,000명의데이터베이스를활용하여AI기반진단프로그램을통해주름,색소침착및다크서클을분석한후,맞춤형화장품성분을추천하고문어흡반을모방한음압패치를통해전달한다.​문어에서영감을받은기술이기기의핵심은성균관대학교교수가설립한스타트업Mimetics와의파트너십을통해개발된음압패치입니다.Nature및ACSNano에게재된연구에따르면,문어빨판의원리를사용하여피부손상없이흡수를강화하는이패치기술은기존화장품보다5~6배높은흡수율을자랑합니다.이기술은4월LG생활건강의럭셔리브랜드TheHistoryofWhoo에서SkinActivatorPatch라는이름으로처음시장에출시되었습니다.​핸즈프리밴드형기기는또한1mm미만두께의유연한LED패치를통합하여더깊은피부층에최적화된광치료를제공합니다.공식CES설명에따르면,이시스템은눈주위영역을마이크로존으로세분화하고개인피부분석을기반으로정밀하게제어된광프로토콜을제공합니다.​광범위한뷰티테크추진이번수상은LG생활건강이스킨롱제버티(SkinLongevity)이니셔티브하에개인맞춤형뷰티기술에대한집중을확대하고있음을반영한다.강내규최고기술책임자(CTO)는회사가"미래뷰티기술연구를통해새로운고객경험을제공하기위해차세대웨어러블기기와개인맞춤형솔루션을지속적으로통합할것"이라고밝혔다.JournalofInvestigativeDermatology에발표된최근연구는연령과유전적소인모두를기반으로맞춤화를가능하게하는6가지주요노화지표와10가지유전바이오마커를확인했다.​LG생활건강은AI뷰티기술분야에서경쟁에직면해있다.아모레퍼시픽은MIT와함께개발한전자피부플랫폼으로노화원인을실시간으로분석하는스킨사이트(Skinsight)로올해7년연속CES혁신상을수상했다.​CES2026혁신상프로그램은36개부문에서3,600개이상의출품작을접수했으며,AI,디지털헬스,지속가능성부문이가장많은출품작을받았다.수상자들은1월6일부터9일까지라스베이거스에서열리는CES2026에서자사제품을선보일예정이다.
942 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)구글이18일(현지시간)차세대인공지능(AI)모델'제미나이3'를공개하고핵심서비스인검색에출시당일부터즉시적용하는파격적인행보를보였다.이는구글이신규AI모델을검색엔진에첫날부터통합한첫사례로,AI경쟁에서공세적전략으로전환했음을시사한다.​순다르피차이구글최고경영자(CEO)는"제미나이3는전례없는수준의깊이와뉘앙스를이해할수있도록설계된최첨단추론능력을갖춘가장지능적인모델"이라고밝혔다.제미나이2.5출시이후약8개월만에등장한이번모델은주요AI성능지표에서오픈AI의GPT-5와앤스로픽의클로드를제치고1위를차지했다.​벤치마크성적으로경쟁사압도제미나이3프로는사용자직접평가방식인LM아레나리더보드에서1501점을기록해그록4.1(1484점)과클로드소넷4.5(1449점)를앞질렀다.박사급추론능력을측정하는'인류마지막시험'벤치마크에서는도구사용없이37.5%를달성해GPT-5프로의30.7%를크게상회했다.고난도수학문제로구성된매스아레나에이펙스에서는23.4%를기록하며GPT-5.1의1%를압도적으로넘어섰다.​코딩능력평가인웹데브아레나리더보드에서도제미나이3는1487점으로GPT-5(1473점)와클로드오퍼스4.1(1451점)을제쳤다.구글은더강화된추론모드인'제미나이3딥싱크'도공개했는데,이모델은인류마지막시험에서41%의정답률로역대최고기록을세웠다.​검색통합으로실용성강화구글은제미나이3프로를출시와동시에검색엔진의'AI모드',제미나이앱,AI스튜디오및버텍스AI등주요제품전반에즉시적용했다.구글의최고AI설계책임자인코라이카부크쿠오글루는"제미나이가모델출시속도뿐아니라사용자에게전달되는속도면에서도새로운기준을세웠다"고말했다.​미국내유료구독자는검색창에서'AI모드'탭을통해제미나이3의복잡한추론능력과새로운동적경험을즉시활용할수있다.구글은또한AI에이전트가소프트웨어작업을자율적으로계획하고실행할수있는개발플랫폼'안티그래비티'도함께공개했다.​구글이마이크로소프트의연례개발자회의'이그나이트2025'개최일에맞춰제미나이3출시를발표한것은경쟁기술기업견제목적이있는것으로풀이된다.인디펜던트분석기관아티피셜애널리시스는"제미나이3프로가현재시장을선도하고있으며GPT-5.1보다3점높은점수를기록했다"고평가했다.
854 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)"에이전틱AI"라는용어는최근몇주동안기술분야를휩쓸었으며,기업들이자율적인인공지능시스템을중심으로자사제품을포지셔닝하기위해서두르면서업계컨퍼런스와마케팅자료를지배하고있다.그러나이용어의급속한확산은이것이진정한기술적변화를나타내는것인지,아니면단순히기존AI기능의리브랜딩에불과한것인지에대한논쟁을촉발시켰다.MIT슬론리뷰(MITSloanReview)에따르면,"합의된정의는없지만,에이전틱AI는일반적으로지속적인인간의감독없이결정을내리고,행동을취하며,역동적인환경에적응함으로써자율적으로목표를추구할수있는AI시스템을의미한다".AP통신은월요일에거대기술기업과스타트업들이자사제품설명에"에이전틱"을포함시키면서이표현이"마케팅과장과실제가능성의혼합"이되었다고보도했다.​산업모멘텀형성주요기술기업들이이번달업계행사에서주목할만한에이전트AI발표를진행했습니다.Microsoft는11월17일Ignite컨퍼런스에서Agent365를공개하며,이를플랫폼전반에걸쳐AI에이전트를관리하는"제어플레인"이라고설명했습니다.Google은11월에프로덕션급에이전트시스템의표준을확립하는54페이지분량의기술가이드라인을발표했으며,Amazon은11월16일자율에이전트를위한엔터프라이즈인프라를제공하는AmazonBedrockAgentCore를소개했습니다.​Salesforce는10월Dreamforce컨퍼런스에서AI제품을"Agentforce"로리브랜딩하며,"인간과AI에이전트를연결하도록설계된세계최초의플랫폼"을제공한다고자사를포지셔닝했습니다.IBM도WatsonxOrchestrate플랫폼에서에이전트기능을마찬가지로강조해왔습니다.​시장전망및채택산업분석가들은에이전트AI기술의상당한성장을전망하고있습니다.딜로이트는생성형AI를사용하는기업의25%가2025년에에이전트AI파일럿을시작할것이며,2027년에는도입률이50%로두배증가할것으로예측했습니다.가트너는2026년까지기업용애플리케이션의40%가작업별AI에이전트를통합할것으로예상하며,이는현재5%미만에서증가한수치입니다.​맥킨지연구에따르면에이전트AI는2030년까지연간4,500억달러에서6,500억달러의추가매출을창출할수있으며,구글클라우드는시장규모가2035-2040년까지1조달러에달할수있을것으로전망합니다.그러나가트너는10월에현재에이전트AI제품의공급이수요를크게초과하고있으며시장통합을예측한다고경고했습니다.​비평가들은기업들이진정한자율기능을제공하지않으면서기본적인AI워크플로우를에이전트로표시하는"에이전트워싱"에대한우려를제기했습니다.포브스는"에이전트워싱은기업들이현재의과대광고사이클을이용하는데도움이될수있지만비용이따른다"고지적하며,"사용자를혼란스럽게하고,고객을실망시키며,진정으로혁신적인도구를채택하는과정을방해한다"고경고했습니다.
828 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)Microsoft는화요일샌프란시스코에서열린Ignite2025컨퍼런스에서Agent365를공개하며,조직이운영전반에걸쳐확산되는AI에이전트를추적,보호및관리할수있도록설계된중앙집중식플랫폼을선보였습니다.​이플랫폼은리서치기업IDC에따르면2028년까지전세계적으로배포되는AI에이전트수가13억개로급증하면서중요한과제가될것으로애널리스트들이예측하는문제를해결합니다.Agent365는IT관리자에게Microsoft의도구로구축되었든타사플랫폼으로구축되었든관계없이조직내에서작동하는모든AI에이전트를모니터링할수있는통합대시보드를제공합니다.​"Agent365는에이전트를위한제어플레인으로,사람을관리하기위해신뢰하는인프라를에이전트로확장합니다"라고Microsoft의AIatWork최고마케팅책임자인JaredSpataro가블로그게시물에작성했습니다.​에이전트인력관리이플랫폼은다섯가지핵심기능을포함합니다:모든에이전트를추적하는레지스트리,MicrosoftEntra를통한고유에이전트ID로접근제어,에이전트와데이터간의연결을보여주는시각화대시보드,Microsoft365앱과의상호운용성,그리고MicrosoftDefender와Purview를통한보안보호.​"신규직원이나계약직근로자에게신원을제공하는것과같은방식으로,에이전트에게도신원과접근제어를제공하게될것입니다"라고Microsoft상업사업부의CEO인JudsonAlthoff가CNBC에말했습니다.​Agent365는Microsoft의CopilotStudio와Foundry로구축된에이전트뿐만아니라Adobe,ServiceNow,Workday와같은파트너및Genspark과같은신흥스타트업의에이전트도지원합니다.전MicrosoftBing팀멤버인EricJing이설립한이스타트업은2025년4월SuperAgent플랫폼출시후5개월만에연간반복수익5천만달러를달성했습니다.​기업도입시작세계최대회계법인중하나인EY는이미AI에이전트의내부카탈로그를구축했지만,현재는더나은감독을얻기위해Agent365를구현하고있다고회사의전무이사인MarkLuquire가밝혔다.​Agent365는Microsoft365Copilot라이선스를보유한고객에게AI혁신에대한조기액세스를제공하는Microsoft의Frontier프로그램을통해이용할수있다.이플랫폼은IT팀이새로운에이전트를승인하고,사용량을모니터링하며,보안위협을식별하고,조직정책을준수하지않는에이전트를비활성화할수있도록한다.​Microsoft의비즈니스앱및에이전트부문사장인CharlesLamanna는이플랫폼이"조직이에이전트를구축하고,보안을유지하며,확장하는방식에있어새로운장을여는것"이라고말했다.
809 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입