Loading...

AI 뉴스

중국 스타트업, 오픈소스 AI가 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.08 14:59
1,476 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581565_2634.jpg
 

(퍼플렉시티가 정리한 기사)


중국 스타트업 Moonshot AI는 목요일 Kimi K2 Thinking 모델을 출시하며, 1조 개의 매개변수를 가진 이 오픈소스 시스템이 추론, 코딩 및 자율 에이전트 작업에 대한 여러 벤치마크에서 OpenAI의 GPT-5, Anthropic의 Claude Sonnet 4.5, 그리고 이전 오픈소스 선두주자인 MiniMax-M2를 능가한다고 주장했다.​

이번 출시는 Nvidia CEO Jensen Huang이 중국이 "AI에서 미국보다 나노초 뒤처져 있다"고 경고하며 미국의 개발 가속화 필요성을 강조한 시점에 이루어졌다. 이 타이밍은 OpenAI CFO Sarah Friar가 미국 정부가 1.4조 달러를 초과하는 AI 인프라 투자에 대해 "안전망"을 제공해야 한다고 제안한 발언으로 인한 최근 논란을 고려할 때 특히 주목할 만하다—이 발언은 그녀와 CEO Sam Altman이 신속히 철회했다.​


벤치마크 성능이 독점 모델에 도전하다

Kimi K2 Thinking은 AI가 발전함에 따라 계속 도전적으로 유지되도록 설계된 2,500개의 전문가 검증 질문으로 구성된 최전선 수준의 벤치마크인 Humanity's Last Exam에서 44.9%를 달성했습니다. 이 모델은 GPT-5가 54.9%를 기록하고 Claude Sonnet 4.5가 24.1%에 도달한 웹 연구 벤치마크인 BrowseComp에서 60.2%를 기록했습니다. 실제 소프트웨어 엔지니어링 문제 해결을 테스트하는 SWE-Bench Verified에서 K2 Thinking은 71.3%를 기록했습니다.​

제3자 평가 기관인 Artificial Analysis에 따르면, K2 Thinking은 도구 사용이 필요한 고객 서비스 시나리오에서 AI 성능을 측정하는 Tau2 Bench Telecom 에이전트 벤치마크에서 최고 점수를 달성했습니다. 이 모델은 인간의 개입 없이 수백 단계에 걸쳐 일관된 추론을 유지하면서 200-300개의 순차적 도구 호출을 자율적으로 실행할 수 있습니다.​


독점 시스템 대비 비용 우위

Moonshot AI는 K2 Thinking의 API 가격을 캐시된 입력의 경우 백만 토큰당 $0.15, 캐시 미스의 경우 백만 토큰당 $0.60, 출력의 경우 백만 토큰당 $2.50로 책정했습니다. 이는 GPT-5의 백만 입력 토큰당 $1.25, 백만 출력 토큰당 $10의 가격과 비교됩니다. Claude Sonnet 4.5는 백만 입력 토큰당 $3, 백만 출력 토큰당 $15입니다.​

CNBC가 인용한 소식통에 따르면 훈련 비용은 총 460만 달러로 보고되었습니다. 이는 OpenAI와 다른 미국 기업들이 모델 개발에 지출한 수십억 달러와 대조를 이룹니다.​


수정된 MIT 라이선스 하의 오픈 액세스

이 모델은 Hugging Face에서 수정된 MIT 라이선스로 제공되며, 한 가지 조건과 함께 완전한 상업적 및 파생 권리를 제공합니다: 월간 활성 사용자 100만 명을 초과하거나 월 2천만 달러 이상의 수익을 창출하는 제품은 사용자 인터페이스에 "Kimi K2"를 눈에 띄게 표시해야 합니다. 개발자들은 Moonshot의 플랫폼인 platform.moonshot.ai와 kimi.com을 통해 모델에 접근할 수 있습니다.​

이번 출시는 중국 기업들이 오픈소스 AI를 배포하여 서구의 독점 시스템에 도전하는 패턴을 확장합니다. Airbnb CEO 브라이언 체스키(Brian Chesky)는 최근 자신의 회사가 AI 고객 서비스를 위해 Alibaba의 Qwen 모델에 "크게 의존"하고 있으며, ChatGPT에 비해 "매우 좋고" "또한 빠르고 저렴하다"고 칭찬했습니다.​

2023년에 설립되고 Alibaba와 Tencent의 지원을 받는 Moonshot AI는 2024년 2월에 25억 달러 기업 가치로 10억 달러를 조달했고, 2024년 8월에는 추가로 3억 달러를 조달했습니다.

댓글 0
전체 1,366 / 63 페이지
워너뮤직그룹은화요일AI음악스타트업Suno와합의에도달하여,라이선스파트너십을통해플랫폼이AI생성음악을만드는방식을재정의하게될논쟁적인저작권소송을종결했습니다.이번거래에는Suno가워너로부터콘서트플랫폼Songkick을인수하는것도포함되어있으며,이는음악거대기업이일주일도채안되어이룬두번째주요합의입니다.​소송에서협력으로이번합의는Warner,UniversalMusicGroup,그리고SonyMusicEntertainment가2024년6월Suno와경쟁사Udio를상대로제기한5억달러규모의저작권침해소송중Warner의부분을해결합니다.레이블들은두AI회사가허가나보상없이저작권이있는음원으로음악생성모델을훈련시켰다고비난했습니다.​합의에따라Suno는2026년에현재제공되는서비스를대체할새로운라이선스기반AI모델을출시할예정이며,기존서비스는단계적으로중단됩니다.이파트너십은Warner소속아티스트와작곡가들에게옵트인시스템을통해자신들의이름,이미지,목소리,작곡이AI생성음악에사용될수있는지여부에대한완전한통제권을부여합니다.​WarnerCEORobertKyncl은성명에서"Suno와의이획기적인협약은모두에게이익이되는창작커뮤니티의승리입니다"라고말했습니다."Suno가사용자와수익화측면에서빠르게성장하고있는가운데,우리는수익을확대하고새로운팬경험을제공하는모델을구축할이기회를포착했습니다."​이번거래는Warner의11월19일Udio와의합의및Universal의10월같은회사와의합의에이어이루어졌습니다.Sony는두AI스타트업을상대로여전히소송을진행중인유일한메이저레이블로남아있습니다.​플랫폼변화와산업전환2026년부터Suno는오디오다운로드를위해유료계정을요구할예정이며,무료등급사용자들은자신이만든콘텐츠를플랫폼내에서재생하고공유하는것만가능하게됩니다.유료구독자는월별다운로드제한이있으며,추가다운로드를구매할수있는옵션도제공됩니다.​이합의는Suno가MenloVentures가주도한2억5천만달러규모의시리즈C펀딩라운드를발표한지며칠만에이루어진것으로,이번펀딩으로회사가치는24억5천만달러로평가받았습니다.이번라운드에는Nvidia의벤처부서인NVentures등도참여했습니다.​더넓은협의의일환으로,Suno는Warner의라이브음악발견플랫폼인Songkick을미공개금액에인수했습니다.Warner는2017년에Songkick의앱과브랜드를인수했으며,그후LiveNation이해당티켓팅사업을인수했습니다.
740 조회
0 추천
2025.11.26 등록
일리야수츠케버는**SafeSuperintelligenceInc.**의공동창립자이자전OpenAI수석과학자로서,DwarkeshPatel과의인터뷰에서AI개발이단순히사전학습을대규모로확장하던시대(2020-2025)가한계에도달했으며,이제는"연구의시대"에진입했다고주장한다.그는근본적인과제가모델들이인상적인벤치마크성과에도불구하고"사람보다일반화가현저하게더잘되지않는다"는점이라고설명한다.​수츠케버는현재의강화학습접근법이평가벤치마크에편협하게집중해훈련함으로써의도치않게"보상해킹(rewardhacking)"을하고있을수있다고설명한다.이는마치모델을경쟁프로그래밍대회만을위해10,000시간을연습한학생과비교하는것인데,넓은판단력과취향을가진100시간연습한학생과는다르다는비유로설명한다.이것이모델들이테스트에서는뛰어나지만현실세계의기본적인과제(예:같은두버그사이를번갈아처리하는것)에서는어려움을겪는이유가될수있다.​SSI는2024년9월50억달러가치로10억달러를투자받았으며,2025년3월에는매출없이직원이대략20명임에도불구하고300억달러가치에도달했다.이는여러AI회사들이사전학습확장법칙이점차수익성이감소하고,사용가능한고품질훈련데이터가점점부족해지고있다는증거에직면했기때문이다.
751 조회
0 추천
2025.11.26 등록
Anthropic은화요일에현세대AI모델이미국연간노동생산성성장률을1.8%증가시킬수있다고추정하는연구결과를발표했습니다.이는2019년이후평균성장률을사실상두배로높이는수치입니다.이연구는AI안전기업인Anthropic이발표했으며,Claude챗봇과의실제대화10만건을분석하여기술이광범위하게채택되었을때의잠재적경제영향을계산했습니다.​연구에따르면AI는작업완료시간을평균80%단축시키며,의료지원업무에서는최대90%까지시간절감효과가있었습니다.연구결과에따르면,사람들은일반적으로Claude를복잡한작업에사용하며,이러한작업은인간이수행할경우약1.4시간이소요되고노동비용으로는55달러가듭니다.만약AI가10년내에미국경제전반에완전히확산되고노동이전체생산성의60%를차지한다고가정하면,연구진은전반적인총요소생산성(TFP)이연간1.1%증가할것으로전망했습니다.​"이는전반적인총요소생산성이연1.1%증가한다는것을의미합니다."라고연구자AlexTamkin과PeterMcCrory는썼으며,이는AI가전체경제성장에기여하는정도를근사한다고밝혔습니다.이추정치는최근전망중에서도높은편에해당하며,총요소생산성증가는2000년대초반이후연1%미만에머무는경우가많았습니다.​방법론및한계이연구는AI지원이있을때와없을때작업에소요되는시간을추정하기위해Claude자체를사용하는독특한접근방식을채택했습니다.연구자들은기존임금데이터와작업중요도가중치를사용하여이러한시간절감효과를더넓은경제전반에확대적용했습니다.​이연구는몇가지한계를인정하고있습니다.가장주목할만한점은,AI로절약한시간을근로자들이개인활동이아닌추가적인생산노동에모두사용한다고가정하며,AI결과물을검증하는데소요되는시간을고려하지않는다는것입니다.또한이추정치는AI역량이향후10년간현재수준에머물것이라고가정하여,미래의개선가능성을과소평가할수있습니다.​연구자들은"우리의접근방식은사람들이Claude의결과물을완성된상태로다듬기위해수행해야하는추가작업을고려하지않습니다"라고밝혔습니다.이전의무작위대조시험들은일반적으로더작은시간절감효과를발견했으며,여기에는고객서비스직원의14%생산성향상과전문적인글쓰기작업의40%시간단축이포함됩니다.​더넓은맥락이연구결과는MIT의다론아제모글루(DaronAcemoglu)와같은보수적인경제학자들의추정치와대조를이룬다.아제모글루는AI가향후10년간미국의생산성을0.5%만증가시키고GDP는누적으로약1%증가시킬것으로예측했다.아제모글루는AI가현재경제업무의약5%에만적용된다고주장해왔다.​​연방준비제도부의장필립제퍼슨(PhilipJefferson)은11월에생성형AI를채택한근로자의비율이2024년12월30.1%에서2025년중반까지45.9%로증가했다고언급했다.최근미국노동생산성데이터는2025년2분기에2.4%성장을보였으며,이는2019년이후평균1.8%와비교된다.
772 조회
0 추천
2025.11.26 등록
TeslaCEO일론머스크는화요일,경쟁자동차제조업체들이자율주행기능없이는구식이될위험이있다는반복적인제안과경고에도불구하고회사의완전자율주행(FullSelf-Driving)기술라이선스를거부하고있다며불만을표출했다.​머스크는X에"나는그들에게경고하려고했고심지어TeslaFSD라이선스를제공하겠다고제안했지만,그들은원하지않는다!미쳤다"고썼다.그는기존자동차제조업체들이연락을취할때"그들은5년후소규모프로그램에FSD를구현하는것을미온적으로논의하며Tesla에게는실행불가능한요구사항을제시하기때문에무의미하다"고덧붙였다.​경쟁자들이대안파트너를선택하다경쟁사들이자체자율주행전략을추진하면서저항이나타나고있습니다.Toyota는4월에개인소유차량을위한자율주행기술개발을위해Waymo와의파트너십을발표했습니다.10월에는Uber가Nuro의자율주행기술이장착된Lucid차량을사용하여2026년후반샌프란시스코에서로보택시를출시할계획을밝혔습니다.​FordCEOJimFarley는6월에Tesla의기술라이선싱에대한추측을일축하며,Waymo의접근방식이카메라외에LiDAR센서를사용하기때문에"더합리적"이라고밝혔습니다.Farley는AspenIdeasFestival에서"우리는라이다가임무수행에필수적이라고진정으로믿습니다"라고말했습니다.​제한적채택과규제감시테슬라의FSD추진은라이선싱을넘어선과제들에직면해있습니다.회사의3분기실적에따르면현재테슬라운전자중12%만이이기술에대해비용을지불하고있습니다.FSD수익은3억2,600만달러를창출했던2024년동기대비2025년3분기에감소했습니다.​이기술은또한규제당국의조사를받고있습니다.10월에미국도로교통안전국(NHTSA)은신호위반및역주행을포함한FSD관련교통위반58건의보고를받아288만대의테슬라차량에대한조사를시작했습니다.이조사는시스템의안전성능에대한여러다른조사들에이어진행되었습니다.​이러한좌절에도불구하고머스크는연말까지오스틴에서테슬라의로보택시서비스에서안전모니터를제거하겠다는계획을추진하고있습니다.
765 조회
0 추천
2025.11.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입