Loading...

AI 뉴스

중국 스타트업, 오픈소스 AI가 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.08 14:59
1,453 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581565_2634.jpg
 

(퍼플렉시티가 정리한 기사)


중국 스타트업 Moonshot AI는 목요일 Kimi K2 Thinking 모델을 출시하며, 1조 개의 매개변수를 가진 이 오픈소스 시스템이 추론, 코딩 및 자율 에이전트 작업에 대한 여러 벤치마크에서 OpenAI의 GPT-5, Anthropic의 Claude Sonnet 4.5, 그리고 이전 오픈소스 선두주자인 MiniMax-M2를 능가한다고 주장했다.​

이번 출시는 Nvidia CEO Jensen Huang이 중국이 "AI에서 미국보다 나노초 뒤처져 있다"고 경고하며 미국의 개발 가속화 필요성을 강조한 시점에 이루어졌다. 이 타이밍은 OpenAI CFO Sarah Friar가 미국 정부가 1.4조 달러를 초과하는 AI 인프라 투자에 대해 "안전망"을 제공해야 한다고 제안한 발언으로 인한 최근 논란을 고려할 때 특히 주목할 만하다—이 발언은 그녀와 CEO Sam Altman이 신속히 철회했다.​


벤치마크 성능이 독점 모델에 도전하다

Kimi K2 Thinking은 AI가 발전함에 따라 계속 도전적으로 유지되도록 설계된 2,500개의 전문가 검증 질문으로 구성된 최전선 수준의 벤치마크인 Humanity's Last Exam에서 44.9%를 달성했습니다. 이 모델은 GPT-5가 54.9%를 기록하고 Claude Sonnet 4.5가 24.1%에 도달한 웹 연구 벤치마크인 BrowseComp에서 60.2%를 기록했습니다. 실제 소프트웨어 엔지니어링 문제 해결을 테스트하는 SWE-Bench Verified에서 K2 Thinking은 71.3%를 기록했습니다.​

제3자 평가 기관인 Artificial Analysis에 따르면, K2 Thinking은 도구 사용이 필요한 고객 서비스 시나리오에서 AI 성능을 측정하는 Tau2 Bench Telecom 에이전트 벤치마크에서 최고 점수를 달성했습니다. 이 모델은 인간의 개입 없이 수백 단계에 걸쳐 일관된 추론을 유지하면서 200-300개의 순차적 도구 호출을 자율적으로 실행할 수 있습니다.​


독점 시스템 대비 비용 우위

Moonshot AI는 K2 Thinking의 API 가격을 캐시된 입력의 경우 백만 토큰당 $0.15, 캐시 미스의 경우 백만 토큰당 $0.60, 출력의 경우 백만 토큰당 $2.50로 책정했습니다. 이는 GPT-5의 백만 입력 토큰당 $1.25, 백만 출력 토큰당 $10의 가격과 비교됩니다. Claude Sonnet 4.5는 백만 입력 토큰당 $3, 백만 출력 토큰당 $15입니다.​

CNBC가 인용한 소식통에 따르면 훈련 비용은 총 460만 달러로 보고되었습니다. 이는 OpenAI와 다른 미국 기업들이 모델 개발에 지출한 수십억 달러와 대조를 이룹니다.​


수정된 MIT 라이선스 하의 오픈 액세스

이 모델은 Hugging Face에서 수정된 MIT 라이선스로 제공되며, 한 가지 조건과 함께 완전한 상업적 및 파생 권리를 제공합니다: 월간 활성 사용자 100만 명을 초과하거나 월 2천만 달러 이상의 수익을 창출하는 제품은 사용자 인터페이스에 "Kimi K2"를 눈에 띄게 표시해야 합니다. 개발자들은 Moonshot의 플랫폼인 platform.moonshot.ai와 kimi.com을 통해 모델에 접근할 수 있습니다.​

이번 출시는 중국 기업들이 오픈소스 AI를 배포하여 서구의 독점 시스템에 도전하는 패턴을 확장합니다. Airbnb CEO 브라이언 체스키(Brian Chesky)는 최근 자신의 회사가 AI 고객 서비스를 위해 Alibaba의 Qwen 모델에 "크게 의존"하고 있으며, ChatGPT에 비해 "매우 좋고" "또한 빠르고 저렴하다"고 칭찬했습니다.​

2023년에 설립되고 Alibaba와 Tencent의 지원을 받는 Moonshot AI는 2024년 2월에 25억 달러 기업 가치로 10억 달러를 조달했고, 2024년 8월에는 추가로 3억 달러를 조달했습니다.

댓글 0
전체 1,366 / 66 페이지
VentureBeat기사는스스로를"AI우선"이라고선언하는대부분의기업들이진정한도입보다는형식적인혁신에몰두하고있다고주장하며,진정한AI도입은하향식기업지시가아닌호기심많은직원들이조용히실험하는과정에서자연스럽게나타난다고설명합니다.​이기사는직접프로토타입을만들고자신의실패를공유하는리더와금요일까지AI계획을요구하는Slack메시지로단순히규정준수를강요하는리더를구분하며,전자는실질적인추진력을조성하는반면후자는반감을낳는다고설명합니다.​기사는재무및운영부서의직원들이일반적으로이사회프레젠테이션에등장하는고가의엔터프라이즈플랫폼이아닌"그냥ChatGPT"를사용한다고인정한다고언급하며,최근설문조사에따르면광범위한도입의무에도불구하고직원의5%만이AI를최대한활용하여업무를혁신하고있다고밝힙니다.
816 조회
0 추천
2025.11.25 등록
Microsoft는사용자의PC에서직접시각적스크린샷을해석하고마우스및키보드동작을제어하여작업을수행하는70억개의매개변수를가진AI에이전트Fara-7B를공개했으며,이는데이터처리를로컬에유지하여개인정보보호를강화하고HIPAA및GLBA와같은규정을준수할수있는클라우드기반모델의대안을제공합니다.​WebVoyager웹탐색벤치마크에서Fara-7B는69.5%의작업성공률을달성하여GPT-4o의65.1%성능을능가했으며,유사한크기의모델이필요로하는41단계에비해약16단계만에작업을완료했습니다.​이모델은Microsoft의Magentic-One다중에이전트프레임워크에의해생성된145,000개의합성작업궤적을사용하여훈련되었으며,현재MIT라이선스하에HuggingFace에서사용할수있습니다.다만Microsoft는이모델이여전히실험적이며프로덕션배포보다는파일럿프로젝트에가장적합하다고주의를당부하고있습니다.
811 조회
0 추천
2025.11.25 등록
TheAIGRID비디오는TheInformation의보도를바탕으로OpenAICEOSamAltman이Google의부활한Gemini3모델이경쟁력을확보함에따라"험난한분위기"와일시적인경제적역풍에대해직원들에게경고한내부메모를분석합니다.​Anthropic은더늦게출시했음에도불구하고2025년동안API수익에서OpenAI를추월할것으로예상되며,OpenAI의생성형AI트래픽점유율은지난1년간Google이5.6%에서13.7%로상승하면서하락했습니다.​​SalesforceCEOMarcBenioff는3년간의일일사용끝에ChatGPT를포기하고Gemini3로전환한다고발표하며이를"놀라운"도약이라고평가했으며,OpenAI는2029년까지1,150억달러의현금소진이예상되는반면Google은연간700억달러의잉여현금흐름을보유하고있습니다.
804 조회
0 추천
2025.11.25 등록
OpenAI는월요일에ChatGPT의새로운쇼핑리서치기능을출시하여,무료계정부터유료구독까지모든사용자에게블랙프라이데이쇼핑러시직전에제품발견과비교를간소화하도록설계된AI기반쇼핑어시스턴트에대한액세스를제공했습니다.​이기능은OpenAI의커머스분야로의가장과감한진출을나타내며,이미수억명의소비자가제품조사를위해ChatGPT를이용하는수익성높은온라인쇼핑시장에서Amazon및Google과직접경쟁할수있는위치에회사를놓았습니다.온라인쇼핑에대한새로운접근ShoppingResearch는제품검색을대화형상호작용으로전환하여,리뷰사이트,소매업체목록,Reddit과같은커뮤니티포럼에서최신정보를검색하기전에명확한질문을던집니다.사용자는"작은아파트를위한가장조용한무선스틱청소기찾기"와같이자연어로자신의요구사항을설명할수있으며,몇분안에맞춤형구매가이드를받을수있습니다.​이도구는강화학습을사용하여쇼핑작업에특화되도록훈련된GPT-5mini의특수버전으로구동됩니다.OpenAI는이모델이사용자쿼리의모든측면과일치하는항목을정확하게식별하는비율이64%로,이전ChatGPT버전의37%에서향상되었다고주장합니다.이기능은전자제품,뷰티제품,가전제품,스포츠장비와같이세부정보가많은카테고리에서뛰어난성능을발휘합니다.​연휴쇼핑객을지원하기위해OpenAI는시즌내내모든계정유형에서거의무제한사용을제공하고있습니다.사용자는항목을"관심없음"또는"이와유사하게"로표시하여실시간으로검색을개선할수있으며,AI는그에따라추천을조정합니다.​심화되는경쟁이번출시는기술대기업들이AI기반상거래지배를두고경쟁하는가운데이루어졌습니다.지난주아마존은루퍼스(Rufus)쇼핑어시스턴트를업그레이드하여가격이력추적과목표가격에도달하면자동으로상품을구매하는기능을추가했습니다.구글또한11월중순에현지매장에전화해상품재고와가격을확인하는AI등유사한도구들을도입했습니다.​오픈AI의접근방식은단일소매업체의재고가아닌전체웹을스캔하는점에서차별화됩니다.그러나현재이기능은아마존상품목록은제외하며,사용자가아마존사이트에서직접재고를확인하도록안내합니다.오픈AI는추천이"유기적이며광고지원이아닌",특정소매업체를우대하지않는다는점을강조합니다.​현재ShoppingResearch는사용자가구매를위해외부소매업체웹사이트로연결되지만,오픈AI는이미Walmart와Target과의파트너십을맺고있어InstantCheckout기능을통해앱내에서바로결제가가능합니다.이기능은결국새로운도구와통합될예정입니다.​소비자데이터에따르면stakes는상당히높습니다.ChatGPT는이미매일약5천만건의쇼핑관련질의를처리하며,이는25억건의총일일프롬프트중약2%에해당합니다.웹분석기업Similarweb에따르면,ChatGPT는이제Walmart,Etsy,Target등주요소매업체로넘어가는레퍼럴트래픽의20%이상을유도하고있습니다.
786 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입