Loading...

AI 뉴스

xAI, 비용 98% 절감한 Grok 4 Fast 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.21 13:33
2,917 조회
0 추천
0 비추천

본문

5b93fb42c510c8986f85668180eba6f7YZKc.jpg

(퍼플렉시티가 정리한 기사)

일론 머스크의 xAI는 2025년 9월 19일에 Grok 4 Fast를 공개하며, 인공지능 모델을 비용 효율적인 추론 기술의 혁신으로 자리매김했습니다. 이 모델은 최대 200만 토큰의 컨텍스트 윈도우를 제공하며, 이전 모델보다 40% 적은 토큰을 사용하면서도 유사한 수준의 성능을 유지합니다.

새로운 모델은 추론 및 비추론 기능을 하나의 프레임워크에 통합한 통합 아키텍처를 제시하며, 개발자들이 정확도를 희생하지 않고 연산 노력을 조절할 수 있도록 합니다. xAI의 내부 테스트에 따르면 Grok 4 Fast는 Grok 4와 동일한 벤치마크 성능을 달성할 때 비용을 98%까지 줄이는 것으로 나타났습니다.

 

경쟁 테스트에서 뛰어난 성능

 

Grok 4 Fast는 여러 평가 플랫폼에서 인상적인 결과를 보여주었습니다. 코드네임 "Menlo"로 운영되는 이 모델은 LMArena의 Search Arena에서 Elo 점수 1,163으로 1위를 차지하며, 가장 가까운 경쟁자인 o3-search를 17점 차이로 앞섰습니다. 또한 Text Arena에서는 8위를 기록하여, 더 큰 모델들과 비교했을 때 지능 밀도를 과시했습니다.

Artificial Analysis의 독립적인 분석에서 Grok 4 Fast는 경쟁력 있는 위치를 확인받았으며, GPT-5, Gemini 2.5 Pro, Claude 4.1 Opus 등과 함께 순위에 오르는 동시에 Grok 4에 비해 약 47배 낮은 비용으로 운영되는 것으로 평가되었습니다. 이 모델은 AIME 2025에서 92%, HMMT 2025에서 93.3%, GPQA Diamond에서는 85.7% 등 의미 있는 벤치마크 점수를 달성했습니다.

 

고급 교육 및 도구 통합

 

이 모델은 코드 실행과 웹 브라우징 기능을 포함하여 도구 사용에 대한 자율적 의사 결정을 가능하게 하는 종단 간 강화 학습 훈련을 통합하고 있습니다. 이러한 훈련 방식은 Grok 4 Fast가 X의 멀티미디어 콘텐츠를 분석하고 실시간 정보를 효율적으로 종합할 수 있게 해줍니다.

xAI는 두 가지 구별되는 변형을 제공합니다: grok-4-fast-reasoning과 grok-4-fast-non-reasoning이며, 두 가지 모두 2백만 토큰 컨텍스트 창을 지원합니다. 이 모델은 초당 296.8 토큰의 속도로 작동하며 최초 토큰 생성까지 2.57초가 걸려, 동급 평균 모델에 비해 더 빠른 성능을 제공합니다.

 

접근성 및 가격 구조

 

Grok 4 Fast는 모든 사용자에게 grok.com, iOS, Android 애플리케이션의 Fast 및 Auto 모드를 통해 즉시 제공됩니다. 한정된 기간 동안, 이 모델은 OpenRouter와 Vercel AI Gateway 플랫폼을 통해 무료로 제공됩니다.

xAI API의 요금 구조는 128,000 토큰 미만의 요청에 대해 백만 입력 토큰당 $0.20에서 시작하며, 더 큰 요청의 경우 백만 당 $0.40까지 올라갑니다. 출력 토큰의 경우, 소규모 요청은 백만 당 $0.50이고, 대규모 사용 시 백만 당 $1.00입니다. 캐시된 입력 토큰은 백만 당 $0.05로 책정되어 있습니다.

댓글 0
전체 1,366 / 177 페이지
(퍼플렉시티가정리한기사)NvidiaCEO젠슨황이오늘영국기술부장관리즈켄달과만났으며,이는영국정부가글로벌AI리더로자리매김하고자하는가운데회사와영국간의확대되는파트너십에서중요한단계를나타냅니다.이번회동은황이케임브리지유니언소사이어티에서연설하고퀸엘리자베스공학상을수상하기위해영국을방문한가운데이루어졌습니다.논의는AI인프라개발과기술협력,특히정부의AI성장지역이니셔티브를중심으로진행되었습니다.​영국AI야심에대한전략적투자이번회담은Nvidia의최근영국시장에대한상당한투자약속을기반으로합니다.9월에이회사는영국의AI스타트업생태계를특별히목표로하는20억파운드의투자를발표했으며,Accel,AirStreetCapital,Balderton을포함한벤처캐피털기업들과협력하여혁신을가속화하고있습니다.이는2026년말까지최대120,000개의첨단GPU를배치하겠다는초기110억파운드약속에이어진것입니다.​Huang은올해초SkyNews와의인터뷰에서"영국은새로운산업혁명의정점에있었다"고말하며,영국을"인공지능의기원의본고장"이라고설명했습니다.​이러한투자는영국에서진행되는미국기술기업들의광범위한투자흐름의일부이며,기업들은AI인프라확장에400억달러이상을투자하고있습니다.Microsoft는2028년까지300억달러를약속했으며,Google은50억파운드의투자를발표했습니다.​AI성장지역이지역발전을주도하다논의의중심은지정된지역에서AI인프라배치를가속화하기위해고안된영국의AI성장구역전략이었습니다.정부는옥스퍼드셔의컬햄과북동부에구역을설정했으며,블라이스와코발트파크부지는5,000개이상의일자리를창출하고최대300억파운드의투자를유치할것으로예상됩니다.​북동부구역은OpenAI및영국기업Nscale과협력하여"스타게이트UK"프로젝트를진행하며,수천개의GPU를배치하여주권적AI인프라를구축합니다.블랙스톤은이미블라이스부지에100억파운드를투자하기로약속했으며,향후파트너로부터추가로200억파운드를투자받을가능성이있습니다.​켄달은이러한투자를긴축재정상황속에서경제성장에필수적인것으로자리매김했습니다."과학,기술및혁신을최우선으로하지않고는평균이상의성장을이룰수있는길이없습니다"라고그녀는말하며,지난주기록적인550억파운드규모의R&D자금패키지를발표했습니다.​그러나특히정부가AI구현을통해450억파운드의공무원비용절감을목표로하면서,AI가고용에미치는영향에대한우려가지속되고있습니다.업계관계자들은영국의AI초강대국야망을저해할수있는"극도로제한적인"에너지가격에대한정부의조치를요구해왔습니다.
1654 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)아마존은오늘고급AI어시스턴트AlexaPlus를iOS및Android기기의AmazonMusic앱에출시했으며,이는대화형인공지능을주류소비자경험에통합하려는회사의가장대담한시도입니다.​현재AlexaPlusEarlyAccess프로그램사용자를위한모든AmazonMusic구독등급에서사용가능한이기능은음악발견을기본음성명령에서자연스러운대화로전환합니다.사용자는앱의오른쪽하단에있는"a"버튼을탭하고기존검색기능으로는어려운요청을하여AI어시스턴트에액세스할수있습니다.​대화를통한향상된음악발견AlexaPlus는사용자가단편적인가사를사용하여노래를식별하거나,특정연도의차트순위에대해질문하거나,"보이밴드를제외한마돈나같은아티스트의90년대팝"과같은매우구체적인플레이리스트를요청할수있게합니다.이어시스턴트는또한노래의의미를설명하고,샘플의출처를추적하며,아티스트의영향력과디스코그래피에대한상세한지식을제공할수있습니다.​아마존은AlexaPlus를사용하는고객이기존어시스턴트보다3배더많이음악을탐색하며,추천을원하는사용자는거의70%더많은음악을듣는다고보고합니다.이통합은음악스트리밍이AI기능경쟁으로변화함에따라경쟁사들과경쟁하기위한아마존의전략을나타냅니다.​산업AI추진에대한경쟁적대응이번출시는Spotify가10월에ChatGPT기능을통합하여사용자들이대화형프롬프트를통해개인맞춤형음악추천을받을수있게된지불과몇주만에이루어졌습니다.Apple이2026년봄출시예정으로향상된Siri기능을계속개발하고있는동안,Amazon은음악발견을"지식이풍부한친구와의대화"처럼느껴지도록만들어경쟁사들을뛰어넘는위치를점하고있습니다.​AlexaPlus는궁극적으로Prime회원에게무료로제공될예정이며,얼리액세스기간이종료된후Prime비가입자는월$19.99에이용할수있습니다.이통합은주요스트리밍서비스내에서생성형AI어시스턴트의첫번째주요배포중하나입니다.
1817 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Microsoft는Azure클라우드플랫폼에서단일랙시스템으로초당110만토큰이라는전례없는성능을달성하며AI처리장벽을무너뜨렸습니다.이는백만토큰임계값을처음으로돌파한것으로,AI추론성능에대한새로운업계벤치마크를확립했습니다.​NVIDIA의최첨단GB300GPU로구동되는AzureNDGB300v6가상머신을사용하여달성한이이정표는GB200시스템으로달성한Microsoft의이전기록인초당865,000토큰대비27%향상된수치입니다.이성능테스트는업계표준인Llama270B모델을사용한80분간의벤치마크실행동안Signal65에의해독립적으로검증되었습니다.​엔터프라이즈AI를위한획기적인성능이성과는AI배포의경제성을근본적으로변화시켜,기업들이엄격한규정준수요구사항을유지하면서수천명의동시사용자를지원할수있게합니다.각NVIDIAGB300GPU는초당15,200개의토큰을처리하여이전세대H100칩보다5배의처리량을제공하며,Signal65가"엘리트AI성능"이라고부른것이이제접근가능한유틸리티로제공됨을보여줍니다.​Microsoft의이혁신은회사가대규모AI인프라투자를가속화하는시기에나왔습니다.이기술대기업은월요일에세건의별도수십억달러규모AI거래를발표했으며,여기에는추가NVIDIAGB300용량을위한IRENLimited와의97억달러규모파트너십과수만개의GPU배포를위한Lambda와의별도계약이포함됩니다.​AI군비경쟁에서의인프라리더십이기록적인성능은이전세대대비50%더많은메모리와16%높은열용량을포함한향상된사양을갖춘72개의GPU를탑재한단일NVIDIAGB300NVL72랙에걸쳐18개의가상머신을사용하여달성되었습니다.이시스템은가상머신당초당평균61,163개의토큰처리량으로놀라운일관성을보여주었습니다.​"이성능이정표는NVIDIA와의지속적인협력을보여주며프로덕션환경에서광범위한AI워크로드를관리하는Azure의능력을강조합니다"라고MicrosoftCEO사티아나델라는말하며,이성과가Azure를엔터프라이즈AI추론을위한최고의플랫폼으로자리매김하게한다고강조했습니다.이이정표는단순한기술적성과이상을의미합니다.산업규모의AI처리가클라우드에도입되었음을알리며,대규모내부인프라투자없이도주류기업들이정교한AI기능에접근할수있게되었습니다.
1681 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Anyscale과Microsoft는오늘Azure에서새로운AI네이티브컴퓨팅서비스를출시하기위한파트너십을발표했으며,즉시비공개프리뷰에진입하고Ray의분산컴퓨팅기능을엔터프라이즈규모의클라우드서비스로대폭확장하는계기가되었습니다.​완전관리형퍼스트파티Azure서비스는Anyscale이만든오픈소스분산컴퓨팅프레임워크인Ray를기반으로하며,기업들이AI워크로드를확장할때레거시컴퓨팅시스템으로직면하는한계를해결합니다.이서비스는코드변경없이도자체관리형Ray에비해최대10배빠른성능을제공합니다.​엔터프라이즈급AI컴퓨팅솔루션"AI는모든산업을재정의하고있지만,이를확장하는것은여전히가장어려운과제중하나입니다"라고Anyscale의CEO인KeertiMelkote는말했습니다."Microsoft와함께,우리는기업들이대규모로AI를구축하고실행하는것을획기적으로더쉽게만들고있습니다—Ray를위해특별히제작된Anyscale의플랫폼과Azure의신뢰할수있는인프라를결합하여기업들이인프라관리가아닌혁신에집중할수있도록합니다".​새로운서비스는AzureKubernetesService(AKS)에서직접실행되며,AzurePortal을통한간소화된클러스터배포,대화형개발환경,그리고배치처리와저지연서빙모두를위한장애허용Ray클러스터를기업에제공합니다.Azure고객들은통합청구의혜택을받을수있으며,기존MicrosoftAzureConsumptionCommitments를이서비스에적용할수있습니다.​Ray의성장하는엔터프라이즈도입Ray는월간2,700만건이상의다운로드와39,000개의GitHub스타를기록하며AI인프라의핵심기술로부상했습니다.Uber,Spotify,Canva,Coinbase를포함한주요기업들이이미분산AI컴퓨팅을위해Ray를활용하고있습니다.이프레임워크는단일파이프라인에서CPU와GPU와같은특수가속기전반에걸쳐데이터처리,모델학습및추론을통합함으로써현대AI의복잡성을해결합니다.​Microsoft의클라우드네이티브컴퓨팅담당CorporateVicePresident이자Kubernetes공동창시자인BrendanBurns는"기업들은AI워크로드를확장할때유연성과제어권을원합니다"라고말했습니다."Azure의Anyscale을통해Ray를AzureKubernetesService에도입함으로써,우리는개발자들에게익숙한클라우드네이티브패턴을사용하여AI애플리케이션을구축하고확장할수있는능력을제공하고있습니다".​이서비스는AzurePortal을통해비공개프리뷰로유지되며,2026년에정식출시될예정입니다.
1672 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입