Loading...

AI 뉴스

중국 스타트업, 오픈소스 AI가 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.08 14:59
1,621 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762581565_2634.jpg
 

(퍼플렉시티가 정리한 기사)


중국 스타트업 Moonshot AI는 목요일 Kimi K2 Thinking 모델을 출시하며, 1조 개의 매개변수를 가진 이 오픈소스 시스템이 추론, 코딩 및 자율 에이전트 작업에 대한 여러 벤치마크에서 OpenAI의 GPT-5, Anthropic의 Claude Sonnet 4.5, 그리고 이전 오픈소스 선두주자인 MiniMax-M2를 능가한다고 주장했다.​

이번 출시는 Nvidia CEO Jensen Huang이 중국이 "AI에서 미국보다 나노초 뒤처져 있다"고 경고하며 미국의 개발 가속화 필요성을 강조한 시점에 이루어졌다. 이 타이밍은 OpenAI CFO Sarah Friar가 미국 정부가 1.4조 달러를 초과하는 AI 인프라 투자에 대해 "안전망"을 제공해야 한다고 제안한 발언으로 인한 최근 논란을 고려할 때 특히 주목할 만하다—이 발언은 그녀와 CEO Sam Altman이 신속히 철회했다.​


벤치마크 성능이 독점 모델에 도전하다

Kimi K2 Thinking은 AI가 발전함에 따라 계속 도전적으로 유지되도록 설계된 2,500개의 전문가 검증 질문으로 구성된 최전선 수준의 벤치마크인 Humanity's Last Exam에서 44.9%를 달성했습니다. 이 모델은 GPT-5가 54.9%를 기록하고 Claude Sonnet 4.5가 24.1%에 도달한 웹 연구 벤치마크인 BrowseComp에서 60.2%를 기록했습니다. 실제 소프트웨어 엔지니어링 문제 해결을 테스트하는 SWE-Bench Verified에서 K2 Thinking은 71.3%를 기록했습니다.​

제3자 평가 기관인 Artificial Analysis에 따르면, K2 Thinking은 도구 사용이 필요한 고객 서비스 시나리오에서 AI 성능을 측정하는 Tau2 Bench Telecom 에이전트 벤치마크에서 최고 점수를 달성했습니다. 이 모델은 인간의 개입 없이 수백 단계에 걸쳐 일관된 추론을 유지하면서 200-300개의 순차적 도구 호출을 자율적으로 실행할 수 있습니다.​


독점 시스템 대비 비용 우위

Moonshot AI는 K2 Thinking의 API 가격을 캐시된 입력의 경우 백만 토큰당 $0.15, 캐시 미스의 경우 백만 토큰당 $0.60, 출력의 경우 백만 토큰당 $2.50로 책정했습니다. 이는 GPT-5의 백만 입력 토큰당 $1.25, 백만 출력 토큰당 $10의 가격과 비교됩니다. Claude Sonnet 4.5는 백만 입력 토큰당 $3, 백만 출력 토큰당 $15입니다.​

CNBC가 인용한 소식통에 따르면 훈련 비용은 총 460만 달러로 보고되었습니다. 이는 OpenAI와 다른 미국 기업들이 모델 개발에 지출한 수십억 달러와 대조를 이룹니다.​


수정된 MIT 라이선스 하의 오픈 액세스

이 모델은 Hugging Face에서 수정된 MIT 라이선스로 제공되며, 한 가지 조건과 함께 완전한 상업적 및 파생 권리를 제공합니다: 월간 활성 사용자 100만 명을 초과하거나 월 2천만 달러 이상의 수익을 창출하는 제품은 사용자 인터페이스에 "Kimi K2"를 눈에 띄게 표시해야 합니다. 개발자들은 Moonshot의 플랫폼인 platform.moonshot.ai와 kimi.com을 통해 모델에 접근할 수 있습니다.​

이번 출시는 중국 기업들이 오픈소스 AI를 배포하여 서구의 독점 시스템에 도전하는 패턴을 확장합니다. Airbnb CEO 브라이언 체스키(Brian Chesky)는 최근 자신의 회사가 AI 고객 서비스를 위해 Alibaba의 Qwen 모델에 "크게 의존"하고 있으며, ChatGPT에 비해 "매우 좋고" "또한 빠르고 저렴하다"고 칭찬했습니다.​

2023년에 설립되고 Alibaba와 Tencent의 지원을 받는 Moonshot AI는 2024년 2월에 25억 달러 기업 가치로 10억 달러를 조달했고, 2024년 8월에는 추가로 3억 달러를 조달했습니다.

댓글 0
전체 1,366 / 32 페이지
• OpenAI는 Apple Music이 ChatGPT와 통합되어 사용자가 자연어 프롬프트를 통해 재생목록을 만들고 음악 추천을 받을 수 있게 될 것이라고 간략히 발표했으나, 이후 애플리케이션 CEO Fidji Simo의 게시물에서 해당 내용을 삭제했다.• 이 통합은 10월에 출시된 ChatGPT의 기존 Spotify 기능과 유사하게 작동하여, 사용자가 “Apple Music, 운동용 재생목록 만들어줘”와 같은 프롬프트로 대화를 시작하여 재생목록을 생성할 수 있게 한다.• 수정된 발표는 시기상조의 공개를 시사하며, OpenAI의 확장되는 앱 생태계의 일부로 음악 스트리밍 기능이 언제 출시될지에 대한 공식 일정은 제공되지 않았다.
831 조회
0 추천
2025.12.17 등록
• Google의 Gemini [GOOG -0.51%] AI 어시스턴트는 이번 주에 새로운 자동 화면 컨텍스트 기능의 출시를 시작했으며, 이 기능은 사용자가 관련 질문을 할 때 화면의 콘텐츠를 자동으로 캡처하고 분석하여 “화면에 대해 물어보기” 버튼을 수동으로 탭할 필요를 없애줍니다• 이 기능은 언어 단서를 사용하여 “이 오류는 무엇을 의미하나요?” 또는 “이 글을 요약해 주세요”와 같은 화면 관련 프롬프트를 감지하며, 앱, 이미지 및 동영상 전반에서 작동합니다. 다만 초기 테스트 결과 이러한 쿼리를 약 50%의 정확도로 식별하는 것으로 나타났습니다.• 사용자는 Gemini 설정을 통해 자동 스크린샷 기능을 비활성화할 수 있으며, Android의 FLAG_SECURE 보호 기능은 뱅킹 앱, 스트리밍 서비스 및 비공개 브라우징 모드가 캡처에서 제외되도록 보장합니다.
803 조회
0 추천
2025.12.17 등록
• Google [GOOG -0.51%]은 12월 16일 Opal 워크플로우 빌더를 Gemini 웹 앱에 통합하여, 사용자들이 Super Gems라는 새로운 기능을 통해 코딩 없이 AI 기반 미니 애플리케이션을 만들 수 있도록 했습니다.• 이 통합은 Opal을 Gemini의 Gems Manager에 통합하며, 자연어 설명을 자동 생성된 단계와 인터페이스 요소가 포함된 시각적 워크플로우로 변환하는 Workflow Builder를 제공하고, 이는 공유 가능한 링크를 통해 게시될 수 있습니다.• 현재 출시는 미국 사용자로 제한되어 있으며, 이는 Google이 Gemini를 맞춤형 AI 도구 구축을 위한 중앙 플랫폼으로 포지셔닝하면서 다른 Labs 통합과 동일한 단계적 접근 방식을 따르고 있습니다.
859 조회
0 추천
2025.12.17 등록
• Jeff Li는 Super Data Science 팟캐스트에서 Netflix, Spotify, DoorDash에서 데이터 과학자로 근무한 경험을 바탕으로, 워크플로우에 대한 사전 인간 숙달 없이는 AI 자동화가 실패한다고 주장합니다 (https://www.youtube.com/watch?v=T7zG5-9-zIw).• Li가 AI 이미지 생성을 사용하여 광고 제작을 자동화하려던 시도는 크리에이티브 디자인에 대한 전문 지식이 부족하여 실패했으며, 그의 기술적 역량과 광고 업계 배경에도 불구하고 고객들은 제작된 광고를 “형편없다”고 평가했습니다[big-agile +1].• 여러 산업 분야의 연구는 AI 시스템이 새로운 실패와 예외 상황을 처리하기 위해 인간의 판단과 도메인 전문 지식을 필요로 한다는 것을 확인하며, 운영자가 효과적으로 개입할 수 있는 조직적 지식이 부족할 때 자동화가 불충분하다는 것을 입증합니다[big-agile +1].
811 조회
0 추천
2025.12.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입