Loading...

AI 뉴스

중국 스타트업, 오픈소스 AI가 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.08 14:59
1,258 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581565_2634.jpg
 

(퍼플렉시티가 정리한 기사)


중국 스타트업 Moonshot AI는 목요일 Kimi K2 Thinking 모델을 출시하며, 1조 개의 매개변수를 가진 이 오픈소스 시스템이 추론, 코딩 및 자율 에이전트 작업에 대한 여러 벤치마크에서 OpenAI의 GPT-5, Anthropic의 Claude Sonnet 4.5, 그리고 이전 오픈소스 선두주자인 MiniMax-M2를 능가한다고 주장했다.​

이번 출시는 Nvidia CEO Jensen Huang이 중국이 "AI에서 미국보다 나노초 뒤처져 있다"고 경고하며 미국의 개발 가속화 필요성을 강조한 시점에 이루어졌다. 이 타이밍은 OpenAI CFO Sarah Friar가 미국 정부가 1.4조 달러를 초과하는 AI 인프라 투자에 대해 "안전망"을 제공해야 한다고 제안한 발언으로 인한 최근 논란을 고려할 때 특히 주목할 만하다—이 발언은 그녀와 CEO Sam Altman이 신속히 철회했다.​


벤치마크 성능이 독점 모델에 도전하다

Kimi K2 Thinking은 AI가 발전함에 따라 계속 도전적으로 유지되도록 설계된 2,500개의 전문가 검증 질문으로 구성된 최전선 수준의 벤치마크인 Humanity's Last Exam에서 44.9%를 달성했습니다. 이 모델은 GPT-5가 54.9%를 기록하고 Claude Sonnet 4.5가 24.1%에 도달한 웹 연구 벤치마크인 BrowseComp에서 60.2%를 기록했습니다. 실제 소프트웨어 엔지니어링 문제 해결을 테스트하는 SWE-Bench Verified에서 K2 Thinking은 71.3%를 기록했습니다.​

제3자 평가 기관인 Artificial Analysis에 따르면, K2 Thinking은 도구 사용이 필요한 고객 서비스 시나리오에서 AI 성능을 측정하는 Tau2 Bench Telecom 에이전트 벤치마크에서 최고 점수를 달성했습니다. 이 모델은 인간의 개입 없이 수백 단계에 걸쳐 일관된 추론을 유지하면서 200-300개의 순차적 도구 호출을 자율적으로 실행할 수 있습니다.​


독점 시스템 대비 비용 우위

Moonshot AI는 K2 Thinking의 API 가격을 캐시된 입력의 경우 백만 토큰당 $0.15, 캐시 미스의 경우 백만 토큰당 $0.60, 출력의 경우 백만 토큰당 $2.50로 책정했습니다. 이는 GPT-5의 백만 입력 토큰당 $1.25, 백만 출력 토큰당 $10의 가격과 비교됩니다. Claude Sonnet 4.5는 백만 입력 토큰당 $3, 백만 출력 토큰당 $15입니다.​

CNBC가 인용한 소식통에 따르면 훈련 비용은 총 460만 달러로 보고되었습니다. 이는 OpenAI와 다른 미국 기업들이 모델 개발에 지출한 수십억 달러와 대조를 이룹니다.​


수정된 MIT 라이선스 하의 오픈 액세스

이 모델은 Hugging Face에서 수정된 MIT 라이선스로 제공되며, 한 가지 조건과 함께 완전한 상업적 및 파생 권리를 제공합니다: 월간 활성 사용자 100만 명을 초과하거나 월 2천만 달러 이상의 수익을 창출하는 제품은 사용자 인터페이스에 "Kimi K2"를 눈에 띄게 표시해야 합니다. 개발자들은 Moonshot의 플랫폼인 platform.moonshot.ai와 kimi.com을 통해 모델에 접근할 수 있습니다.​

이번 출시는 중국 기업들이 오픈소스 AI를 배포하여 서구의 독점 시스템에 도전하는 패턴을 확장합니다. Airbnb CEO 브라이언 체스키(Brian Chesky)는 최근 자신의 회사가 AI 고객 서비스를 위해 Alibaba의 Qwen 모델에 "크게 의존"하고 있으며, ChatGPT에 비해 "매우 좋고" "또한 빠르고 저렴하다"고 칭찬했습니다.​

2023년에 설립되고 Alibaba와 Tencent의 지원을 받는 Moonshot AI는 2024년 2월에 25억 달러 기업 가치로 10억 달러를 조달했고, 2024년 8월에는 추가로 3억 달러를 조달했습니다.

댓글 0
전체 1,366 / 85 페이지
기술억만장자일론머스크는수요일워싱턴D.C.에서열린미국-사우디투자포럼에서인공지능과로봇공학이향후10년에서20년내에돈을"무의미하게"만들고일을선택적활동으로변화시킬것이라고예측했다."제생각에는,충분히먼미래를내다본다면,AI와로봇공학의지속적인발전이있을것으로보이는데,미래의어느시점에서돈은더이상의미가없어질것입니다"라고머스크는11월19일케네디센터에서열린패널토론에서말했다."전력과같은에너지와질량에대한제약은여전히존재할것입니다"라고그는덧붙였다."하지만어느시점에서는화폐가무의미해질것이라고생각합니다."​AI영향력에대한대조적인비전Tesla,SpaceX,그리고xAI를이끄는머스크는NvidiaCEO젠슨황과함께AI주도경제에서의업무와생산성의미래에대해논의하기위해나타났다.머스크가일이없는미래에대한광범위한비전을제시한반면,황은보다신중한관점을제시했다.​황은여러매체에따르면"모든사람의직업이달라질것이며,그것은확실하다고생각한다"고말했다.그는AI가업무를완전히없애기보다는사람들을더생산적으로만들것이라고제안하며,"엘론은AI의결과로더바빠질것이라는것이내추측이다.나도AI의결과로더바빠질것이다"라고예측했다.​사우디왕세자무함마드빈살만의백악관방문과동시에열린이포럼에서는양국간확대된투자약속에대한발표가있었다.같은날,Nvidia는월스트리트예상을뛰어넘는570억달러의3분기매출을보고했다.​​선택적여가로서의일머스크는미래의고용에대한자신의비전을여가활동에비유했다."그것은스포츠나비디오게임을하는것과비슷할것입니다,"라고그는말했다."당신은상점에가서채소를그냥살수도있고,집뒤뜰에서채소를직접키울수도있습니다.집에서채소를기르는것은훨씬더어렵지만,어떤사람들은채소를기르는것을좋아해서여전히그렇게합니다.앞으로의일은이런식이될것입니다:선택적입니다".​테슬라CEO는자신의회사옵티머스휴머노이드로봇이"빈곤을없앨것"이라고여러차례주장했다.그는긍정적인AI미래가어떨지보여주는예시로1987년부터2012년까지쓰여진SF작가이언뱅크스의컬처시리즈를언급했다.​머스크는10월에조로건과의인터뷰에서보편적기본소득(universalbasicincome)이아니라"보편적고소득(universalhighincome)"을옹호하며말했다:"누구나원하는제품이나서비스를가질수있습니다.하지만그과정에는많은트라우마와혼란이있을것입니다".
804 조회
0 추천
2025.11.21 등록
일론머스크는이번주에태양광인공지능위성을궤도에배치하겠다는야심찬비전을제시하면서,이러한위성들이인공지능컴퓨팅의에너지수요를충족시키고지구에도달하는태양복사량을정밀하게제어함으로써지구온난화를방지할수있다고주장했다.수요일열린미-사우디투자포럼에서머스크는스페이스X의스타십로켓이“연간약300GW,어쩌면500GW정도의태양광인공지능위성을궤도에쏘아올릴수있을것”이라고말했다.그는세일즈포스(Salesforce,Inc.)의CEO마크베니오프가머스크가우주기반데이터센터가지상시설대비비용효율성이높다고논의하는영상을공유한것에답변했다.​이제안은기술업계리더들이급증하는AI의전력수요문제를해결하기위해경쟁하는가운데나왔다.머스크는AI의전력수요가미국전체에너지소비의“3분의2”에도달할수있다고언급했으며,이는연방에너지규제위원회(FERC)데이터에따르면현재약473GW에해당한다.포럼에서머스크와함께무대에오른엔비디아(NVIDIACorporation)CEO젠슨황은현재AI슈퍼컴퓨터가랙당2톤이넘고,그중“1.95톤은아마도냉각을위한것”이라고말했다.머스크는우주가냉각목적으로"매우매력적인장소가될것"이라며동의했고,"우주에서는항상해가비치기때문에배터리가필요없다"고덧붙였다.​우주기반컴퓨팅경쟁가열머스크의발언은궤도컴퓨팅인프라를향한업계전반의움직임과일치한다.알파벳(AlphabetInc.)은11월3일,플래닛랩스(PlanetLabs)와협력해2027년초까지텐서프로세싱유닛이탑재된두대의프로토타입위성을발사하는'프로젝트선캐처(ProjectSuncatcher)'를발표했다.이프로젝트는대기간섭없이태양광을이용해궤도에서머신러닝워크로드를테스트하는것이목표다.​블루오리진(BlueOrigin)CEO인제프베조스는지난달이탈리아테크위크에서"향후10에서20년내에기가와트규모의데이터센터가우주에건설될것"이라고예측했다.베조스는자동차및항공우주애플리케이션에초점을맞춘새로운AI하드웨어스타트업인프로젝트프로메테우스(ProjectPrometheus)도지원하고있는것으로알려졌다.​이달초머스크는"대형태양광AI위성군집을이용해지구에도달하는태양에너지를미세하게조정함으로써지구온난화를방지하자"고제안했다.이개념은'태양복사관리(solarradiationmanagement)'로알려져있으며,기후를인위적으로통제하는것은예기치못한부작용이있을수있다고경고하는과학자들사이에서논쟁을불러일으키고있다.​하지만머스크는칩생산을"해결해야할가장큰퍼즐조각"이라고지적했다.그는테슬라(Tesla,Inc.)가AI프로세서수요를충족하기위해인텔(IntelCorporation)과개발중인것으로알려진자체'테라팹(TeraFab)'파운드리를지어야할수도있다고밝혔다.
762 조회
0 추천
2025.11.21 등록
알리바바는Qwen대규모언어모델을매우허가친화적인오픈소스라이선스로공개함으로써궁극적으로자사의클라우드컴퓨팅및전자상거래비즈니스에이로운광범위한AI도입을이끌것이라고전망하고있으며,이는회사의AI전략에대한BismarckBrief의분석에근거한것이다.​에어비앤비CEO브라이언체스키는자사가고객서비스에Qwen모델을적극적으로활용한다고밝혔으며,그이유로"우수함","빠른속도","합리적인비용"을꼽았고,플랫폼통합요구사항에"완전히준비되지않은"ChatGPT대신선택했다고설명했다.​Qwen오픈소스모델은전세계적으로6억회이상다운로드됐으며,현재아마존,애플등미국대형기업의AI시스템에도적용되어,알리바바가세계최대오픈소스AI생태계를구축하게되었다.
812 조회
0 추천
2025.11.21 등록
Microsoft는 파일 정리 및 이메일 전송과 같은 작업을 자동화하도록 설계된 새로운 Copilot Actions AI 기능이 장치를 손상시키고 민감한 데이터를 훔칠 수 있다는 경고를 발표했으며, 이는 빅테크 기업들이 보안 위험을 완전히 이해하기 전에 기능을 출시한다는 비판을 다시 불러일으켰습니다.회사는 특히 공격자가 웹사이트, 이력서 또는 이메일에 악의적인 명령을 삽입할 수 있는 프롬프트 인젝션 취약점에 대해 사용자들에게 경고했으며, 대규모 언어 모델은 이를 정당한 사용자 지시와 구별할 수 없습니다.Open Worldwide Application Security Project는 2025년 LLM 애플리케이션 상위 10대 보안 위험에서 프롬프트 인젝션을 1위 보안 위험으로 선정했으며, 이는 AI 에이전트가 제어 명령과 사용자 데이터를 구분하지 못하는 근본적인 무능력에 대한 업계 전반의 우려를 반영합니다.
844 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입