AI 뉴스

xAI, 비용 98% 절감한 Grok 4 Fast 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.21 13:33
835 조회
0 추천
0 비추천

본문

5b93fb42c510c8986f85668180eba6f7YZKc.jpg

(퍼플렉시티가 정리한 기사)

일론 머스크의 xAI는 2025년 9월 19일에 Grok 4 Fast를 공개하며, 인공지능 모델을 비용 효율적인 추론 기술의 혁신으로 자리매김했습니다. 이 모델은 최대 200만 토큰의 컨텍스트 윈도우를 제공하며, 이전 모델보다 40% 적은 토큰을 사용하면서도 유사한 수준의 성능을 유지합니다.

새로운 모델은 추론 및 비추론 기능을 하나의 프레임워크에 통합한 통합 아키텍처를 제시하며, 개발자들이 정확도를 희생하지 않고 연산 노력을 조절할 수 있도록 합니다. xAI의 내부 테스트에 따르면 Grok 4 Fast는 Grok 4와 동일한 벤치마크 성능을 달성할 때 비용을 98%까지 줄이는 것으로 나타났습니다.

 

경쟁 테스트에서 뛰어난 성능

 

Grok 4 Fast는 여러 평가 플랫폼에서 인상적인 결과를 보여주었습니다. 코드네임 "Menlo"로 운영되는 이 모델은 LMArena의 Search Arena에서 Elo 점수 1,163으로 1위를 차지하며, 가장 가까운 경쟁자인 o3-search를 17점 차이로 앞섰습니다. 또한 Text Arena에서는 8위를 기록하여, 더 큰 모델들과 비교했을 때 지능 밀도를 과시했습니다.

Artificial Analysis의 독립적인 분석에서 Grok 4 Fast는 경쟁력 있는 위치를 확인받았으며, GPT-5, Gemini 2.5 Pro, Claude 4.1 Opus 등과 함께 순위에 오르는 동시에 Grok 4에 비해 약 47배 낮은 비용으로 운영되는 것으로 평가되었습니다. 이 모델은 AIME 2025에서 92%, HMMT 2025에서 93.3%, GPQA Diamond에서는 85.7% 등 의미 있는 벤치마크 점수를 달성했습니다.

 

고급 교육 및 도구 통합

 

이 모델은 코드 실행과 웹 브라우징 기능을 포함하여 도구 사용에 대한 자율적 의사 결정을 가능하게 하는 종단 간 강화 학습 훈련을 통합하고 있습니다. 이러한 훈련 방식은 Grok 4 Fast가 X의 멀티미디어 콘텐츠를 분석하고 실시간 정보를 효율적으로 종합할 수 있게 해줍니다.

xAI는 두 가지 구별되는 변형을 제공합니다: grok-4-fast-reasoning과 grok-4-fast-non-reasoning이며, 두 가지 모두 2백만 토큰 컨텍스트 창을 지원합니다. 이 모델은 초당 296.8 토큰의 속도로 작동하며 최초 토큰 생성까지 2.57초가 걸려, 동급 평균 모델에 비해 더 빠른 성능을 제공합니다.

 

접근성 및 가격 구조

 

Grok 4 Fast는 모든 사용자에게 grok.com, iOS, Android 애플리케이션의 Fast 및 Auto 모드를 통해 즉시 제공됩니다. 한정된 기간 동안, 이 모델은 OpenRouter와 Vercel AI Gateway 플랫폼을 통해 무료로 제공됩니다.

xAI API의 요금 구조는 128,000 토큰 미만의 요청에 대해 백만 입력 토큰당 $0.20에서 시작하며, 더 큰 요청의 경우 백만 당 $0.40까지 올라갑니다. 출력 토큰의 경우, 소규모 요청은 백만 당 $0.50이고, 대규모 사용 시 백만 당 $1.00입니다. 캐시된 입력 토큰은 백만 당 $0.05로 책정되어 있습니다.

댓글 0
전체 781 / 128 페이지
페이스북 데이팅 기능이 스와이핑으로 파트너를 찾는 피로함을 해결하기 위해 AI 를 도입한다고 밝혔다.페이스북은 "데이트 어시스턴트"와 "밋 큐트(Meet Cute)"라는 두 가지 새로운 기능을 자사의데이팅 서비스에 도입해, 반복적인 스와이프 방식에 지친 사용자들을 돕고자 한다고 발표했다데이트 어시스턴트는 사용자의 취향과 관심사를 바탕으로 맞춤형 추천을 제공하는 채팅 기반 도우미로,전통적인 키, 교육 수준 등의 기준뿐 아니라 '브루클린에 사는 IT 업계 여성 찾아줘'처럼 구체적인 요청도 가능하다이 어시스턴트는 매칭 탭에서 이용할 수 있으며, 미국과 캐나다에서 순차적으로 도입될 예정이다밋 큐트는 사용자의 선호도에 따라 매주 자동으로 새로운 상대와 매칭해주는 기능으로, 매칭된 상대와 대화를 나누거나 필요시 매칭을 해제할 수 있다페이스북은 이러한 기능들이 반복적인 스와이프로 인해 피로감을 느끼던 사용자들에게 새로운 만남의 기회를 제공하고, 쉽고 재미있는 만남을 이어갈 수 있도록 서비스를 계속 개선해 나가겠다고 밝혔다.
755 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)구글 딥마인드 는 화요일에 자사의 가장 진보된 AI 로봇 모델을 공개했으며, 이러한 시스템은 복잡한 작업을 실행하기 전에 “생각”을 할 수 있고 문제 해결을 위해 실시간 정보 검색까지 할 수 있습니다.새로운 두 모델인 Gemini Robotics 1.5와 Gemini Robotics-ER 1.5는, 구글 딥마인드 로보틱스 책임자인 Carolina Parada에 따르면, 광범위한 재프로그래밍 없이 새로운 환경에 적응할 수 있는 다재다능한 로봇을 만드는 데 있어 상당한 진전을 보여줍니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.
729 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)일론 머스크의 인공지능 스타트업 xAI는 수요일 캘리포니아 연방법원에 경쟁사인 오픈AI를 상대로 소송을 제기했으며, 오픈AI가 전 xAI 직원을 고용해 Grok 챗봇과 관련된 영업 비밀을 훔치는 “심각하게 우려스러운 패턴”에 관여했다는 주장을 하고 있다. 이번 소송은 머스크와 그가 2015년에 공동 설립한 회사 간의 ongoing한 법적 분쟁에서 최근의 격화된 조치다.소장은 오픈AI가 “xAI의 핵심 기술과 사업 계획에 대한 지식을 가진 인물들을 표적으로 삼고, xAI의 소스 코드와 데이터 센터 개시에 있어서의 운영상 강점 등을 포함하여, 그러한 직원들이 xAI에 대한 비밀 유지 및 기타 의무를 불법적인 수단을 통해 위반하도록 유도했다”고 주장하고 있다.사건의 중심에 선 전직 엔지니어이번 소송은 특히 전 xAI 엔지니어 쉬에천 리(Xuechen Li)의 사례를 강조하고 있습니다. 그는 OpenAI에 합류하기 전에 회사의 전체 Grok 코드베이스를 무단 유출한 혐의를 받고 있습니다. 리는 2024년 스탠포드 대학교에서 컴퓨터 과학 박사 학위를 받았으며, xAI의 첫 20명의 엔지니어 중 한 명으로 Grok 챗봇 개발에 직접 참여했습니다.법원 문서에 따르면 리는 2025년 7월 OpenAI에 직위를 수락한 직후 약 700만 달러 상당의 xAI 주식을 매도했습니다. 2025년 7월 25일, 마지막 주식 매각 대금 220만 달러를 수령한 바로 그날, 리는 회사에서 지급한 노트북에서 개인 시스템으로 기밀 정보를 “고의적이고 악의적으로” 복사한 혐의를 받고 있습니다. 그는 3일 뒤 사직했으며, 8월 19일에 OpenAI에서 근무를 시작할 예정이었습니다.연방 판사는 9월 2일 임시 금지 명령을 내려, xAI가 모든 기밀 정보가 반환되었거나 삭제되었음을 확인할 때까지 리가 OpenAI에서 생성형 AI 프로젝트에 참여하는 것을 금지시켰습니다. 해당 명령은 리가 OpenAI 직원과 생성형 AI에 관해 논의하는 것도 제한합니다.더욱 치열해진 AI 인재 전쟁이 사건은 실리콘 밸리에서 특히 중국계 전문가들 사이에서 치열한 경쟁이 벌어지고 있는 엘리트 AI 엔지니어 인재 확보전을 강조한다. xAI에는 유화이 토니 우(Yuhuai Tony Wu)를 비롯해 여러 저명한 중국계 엔지니어들이 핵심 역할을 맡고 있는데, 그는 머스크와 함께 Grok 제품 출시 행사에 자주 등장한다.이번 소송은 머스크가 오픈AI(OpenAI)와 벌이고 있는 지속적인 법적 분쟁에 추가되는 것으로, 8월에 오픈AI와 애플를 상대로 제기된 별도의 반독점 소송도 포함된다. AI 챗봇 시장에서의 독점 행위가 주장되고 있다. 오픈AI는 머스크에게 괴롭힘 혐의로 역소송을 제기했다. 오픈AI와 두 회사의 대변인은 이번 최신 사건에 대한 논평 요청에 즉각적으로 답변하지 않았다.
728 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)구글 은 30억 달러 규모의 인공지능 데이터 센터 계약의 일환으로 지분 5.4%를 인수할 예정입니다. 이번 계약은 기술 대기업의 AI 인프라에 대한 공격적인 진출과 암호화폐 채굴 산업의 고성능 컴퓨팅 분야로의 전환을 부각시킵니다.수요일 발표된 10년 계약에 따르면, 구글은 약 2,400만 주의 사이퍼 주식 매입 워런트를 받게 되며, 동시에 AI 클라우드 플랫폼 플루이드스택(Fluidstack)의 임대 의무 14억 달러도 보증합니다. 사이퍼는 텍사스주 콜로라도 시티에 위치한 바버레이크(Barber Lake) 사이트에서 중요 IT 부하 168메가와트를 공급할 예정이며, 운영은 2026년 9월까지 시작될 것으로 예상됩니다.비트코인에서 인공지능 컴퓨팅까지이번 계약은 전통적인 비트코인 채굴 사업에서 급성장하는 AI 분야를 겨냥한 이중 목적의 인프라 제공업체로 발전한 사이퍼(Cipher)에게 극적인 변화를 의미합니다. 회사의 이러한 변화는 기존의 전력을 활용하고 냉각 기술 전문성을 바탕으로 더 고부가가치인 AI 워크로드를 확보하려는 암호화폐 채굴업계의 광범위한 트렌드를 반영합니다.사이퍼의 CEO 타일러 페이지(Tyler Page)는 “우리는 Fluidstack과 함께 고성능 컴퓨팅(HPC) 데이터 센터를 개발하게 되어 매우 기쁩니다. 구글을 사이퍼의 투자자로 맞이할 날을 기대하고 있습니다”라고 말했습니다. 이번 거래를 통해 사이퍼는 2.4기가와트의 고성능 컴퓨팅 우선 파이프라인을 앞세운 주요 AI 데이터 센터 개발업체로 자리매김하게 되었습니다.2017년에 설립된 플루이드스택(Fluidstack)은 AI 학습과 추론을 위한 GPU 클러스터의 온디맨드 접근을 제공하며, 주요 테크 기업과 AI 연구소를 포함한 고객에게 서비스를 제공하고 있습니다. 런던에 기반을 둔 이 스타트업은 최근 프랑스 정부와 110억 달러 규모의 계약을 체결해 원자력 기반 AI 슈퍼컴퓨터를 구축하기로 했습니다.AI 인프라 투자 급증이번 파트너십은 AI 인프라에 대한 전례 없는 투자가 이뤄지는 가운데 체결되었습니다. 전 세계 AI 인프라 지출은 2025년에 3,750억 달러, 2026년에는 5,000억 달러에 이를 것으로 전망됩니다. 맥킨지는 AI 연산 수요를 충족하기 위해 2030년까지 전 세계 데이터 센터에 6.7조 달러의 투자가 필요할 것으로 추정하고 있습니다.구글의 투자는 기존의 인프라 확장 전략과 맞물려 있습니다. 최근 버지니아에 90억 달러, 영국에 50억 파운드의 AI 및 클라우드 시설 투자 약속도 포함됩니다. 사이퍼와의 계약은 2회의 5년 연장 옵션이 행사될 경우 최대 70억 달러로 확대될 수 있습니다.이번 발표 이후 사이퍼 주가는 장전 거래에서 11% 급등하며, 연초 대비 205%의 수익률에 추가 상승세를 보였습니다. 이번 파트너십은 비트코인 채굴업체들이 보유한 전력 용량과 기술 전문성을 활용해 급성장하는 인공지능 산업에서 수익을 창출하려는 전략적 전환을 입증하는 사례입니다.
771 조회
0 추천
2025.09.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입