Loading...

AI 뉴스

xAI, 비용 98% 절감한 Grok 4 Fast 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.21 13:33
206 조회
0 추천
0 비추천

본문

5b93fb42c510c8986f85668180eba6f7YZKc.jpg

(퍼플렉시티가 정리한 기사)

일론 머스크의 xAI는 2025년 9월 19일에 Grok 4 Fast를 공개하며, 인공지능 모델을 비용 효율적인 추론 기술의 혁신으로 자리매김했습니다. 이 모델은 최대 200만 토큰의 컨텍스트 윈도우를 제공하며, 이전 모델보다 40% 적은 토큰을 사용하면서도 유사한 수준의 성능을 유지합니다.

새로운 모델은 추론 및 비추론 기능을 하나의 프레임워크에 통합한 통합 아키텍처를 제시하며, 개발자들이 정확도를 희생하지 않고 연산 노력을 조절할 수 있도록 합니다. xAI의 내부 테스트에 따르면 Grok 4 Fast는 Grok 4와 동일한 벤치마크 성능을 달성할 때 비용을 98%까지 줄이는 것으로 나타났습니다.

 

경쟁 테스트에서 뛰어난 성능

 

Grok 4 Fast는 여러 평가 플랫폼에서 인상적인 결과를 보여주었습니다. 코드네임 "Menlo"로 운영되는 이 모델은 LMArena의 Search Arena에서 Elo 점수 1,163으로 1위를 차지하며, 가장 가까운 경쟁자인 o3-search를 17점 차이로 앞섰습니다. 또한 Text Arena에서는 8위를 기록하여, 더 큰 모델들과 비교했을 때 지능 밀도를 과시했습니다.

Artificial Analysis의 독립적인 분석에서 Grok 4 Fast는 경쟁력 있는 위치를 확인받았으며, GPT-5, Gemini 2.5 Pro, Claude 4.1 Opus 등과 함께 순위에 오르는 동시에 Grok 4에 비해 약 47배 낮은 비용으로 운영되는 것으로 평가되었습니다. 이 모델은 AIME 2025에서 92%, HMMT 2025에서 93.3%, GPQA Diamond에서는 85.7% 등 의미 있는 벤치마크 점수를 달성했습니다.

 

고급 교육 및 도구 통합

 

이 모델은 코드 실행과 웹 브라우징 기능을 포함하여 도구 사용에 대한 자율적 의사 결정을 가능하게 하는 종단 간 강화 학습 훈련을 통합하고 있습니다. 이러한 훈련 방식은 Grok 4 Fast가 X의 멀티미디어 콘텐츠를 분석하고 실시간 정보를 효율적으로 종합할 수 있게 해줍니다.

xAI는 두 가지 구별되는 변형을 제공합니다: grok-4-fast-reasoning과 grok-4-fast-non-reasoning이며, 두 가지 모두 2백만 토큰 컨텍스트 창을 지원합니다. 이 모델은 초당 296.8 토큰의 속도로 작동하며 최초 토큰 생성까지 2.57초가 걸려, 동급 평균 모델에 비해 더 빠른 성능을 제공합니다.

 

접근성 및 가격 구조

 

Grok 4 Fast는 모든 사용자에게 grok.com, iOS, Android 애플리케이션의 Fast 및 Auto 모드를 통해 즉시 제공됩니다. 한정된 기간 동안, 이 모델은 OpenRouter와 Vercel AI Gateway 플랫폼을 통해 무료로 제공됩니다.

xAI API의 요금 구조는 128,000 토큰 미만의 요청에 대해 백만 입력 토큰당 $0.20에서 시작하며, 더 큰 요청의 경우 백만 당 $0.40까지 올라갑니다. 출력 토큰의 경우, 소규모 요청은 백만 당 $0.50이고, 대규모 사용 시 백만 당 $1.00입니다. 캐시된 입력 토큰은 백만 당 $0.05로 책정되어 있습니다.

댓글 0
전체 374 / 1 페이지
(퍼플렉시티가 정리한 기사)Apple은 컴퓨터 비전 스타트업 Prompt AI의 인재와 기술을 자체적으로 확보하기 위한 acquihire 방식의 거래를 마무리하고 있으며, 이는 홈 보안 카메라에 AI 감지 및 자연어 요약 기능을 제공하는 회사의 Seemour 앱을 중심으로 한 움직임이라고 CNBC 및 관련 보도를 인용한 매체들이 전했다. 2023년에 설립되어 500만 달러의 시드 라운드 투자를 받은 11명 규모의 이 스타트업은 전체 회의에서 일부 직원은 Apple에 합류하고 다른 직원들은 급여가 삭감되며 공개 채용 지원을 권장받을 것이며, 투자자들은 부분적인 수익을 받게 될 것이라고 직원들에게 통보했다고 보도는 전한다. 이 기술은 Apple의 HomeKit 스마트 홈 플랫폼과 더 광범위한 컴퓨터 비전 노력을 강화할 것으로 예상된다.Prompt AI가 가져오는 것Prompt AI의 Seemour는 가정용 보안 카메라와 통합되어 특정 인물, 반려동물, 차량, 물체를 식별하고, 알림을 보내며, 카메라에 포착된 활동에 대한 텍스트 설명이나 답변을 생성합니다. 경영진은 직원들에게 앱과 기술은 잘 작동하지만 비즈니스 모델이 작동하지 않았다고 말했으며, 그 결과 회사는 Seemour를 종료하고 사용자들에게 개인정보 보호를 위해 데이터가 삭제될 것임을 통지할 계획입니다. 경영진은 또한 회의 내용에 따르면, 스타트업이 Apple과 진행하기 전에 Elon Musk의 xAI 및 Neuralink로부터 관심을 받았다고 말했습니다.왜 중요한가이번 거래는 화려한 인수합병보다는 역량 구축을 위한 타겟 인재 영입을 선호하는 애플의 전략을 반영하며, 많은 대형 기술 기업들이 규제 마찰을 피하면서 AI 로드맵을 가속화하기 위해 사용해온 전략입니다. Prompt AI의 팀과 모델을 애플로 영입하는 것은 HomeKit의 “주변 지능(ambient intelligence)” 목표를 강화할 수 있으며, 이는 Seemour의 기능이 애플의 스마트 홈 부서에 통합될 가능성이 높다는 보고서와 일치합니다. 또한 이는 iPhone의 객체 및 인물 인식부터 Vision Pro에 이르기까지 애플의 컴퓨터 비전 분야 실적과도 일치하는데, 이 분야에서 애플은 일부 생성형 AI 기능이 더디게 출시되더라도 인상적인 성과를 보여왔습니다.다음은 무엇인가요Apple과 Prompt AI 모두 아직 마무리되지 않은 것으로 보도된 거래에 대해 공개적으로 언급하지 않았습니다. 거래가 확정되면 인력 이동과 Seemour의 종료에 따라 앞으로 몇 주 내에 세부 사항이 드러날 수 있습니다. 소비자들에게는 Seemour의 서비스 종료 및 데이터 삭제 공지가 가장 명확한 단기 신호가 될 것입니다. Apple 관찰자들의 관심은 회사가 Prompt의 컴퓨터 비전 스택을 HomeKit 및 관련 기기에 얼마나 빠르게 통합하는지로 향하고 있습니다.
2 조회
0 추천
23:02 등록
(퍼플렉시티가 정리한 기사)구글 은 내비게이션 중 구글 어시스턴트를 더 발전된 Gemini AI로 교체하는 구글 맵스의 중요한 업그레이드를 조용히 테스트하고 있다고, 베타 버전 25.41.03.815390258에서 해당 기능을 활성화한 여러 기술 분석가들의 보고서에 따르면 전해졌다. 이번 통합은 월 20억 명 이상의 사용자를 보유한 세계에서 가장 많이 사용되는 내비게이션 앱 중 하나에서 대화형 AI로의 중대한 전환을 나타낸다.자연어 명령을 통한 향상된 내비게이션Gemini 통합은 내비게이션 중 운전자가 Google Maps와 상호작용하는 방식을 혁신적으로 변화시킵니다. 단순한 음성 명령 대신, 사용자는 AI 어시스턴트와 자연스러운 대화를 나눌 수 있습니다. Android Authority의 테스트에 따르면, 운전자는 이제 Gemini에게 “고속도로나 통행료를 피하도록 경로를 변경해줘”라고 요청할 수 있으며, 시스템은 수동 메뉴 탐색 없이 자동으로 조정을 수행합니다.이번 업그레이드는 기본적인 경로 안내를 넘어섭니다. 사용자는 경로상의 날씨 상태에 대해 질문하거나, 레스토랑 추천을 요청하거나, 운전에 집중하면서 일반적인 질문을 할 수 있습니다. 활성화되면, 익숙한 마이크 아이콘이 Gemini의 독특한 반짝이는 심볼로 변환되어 더 강력한 AI가 듣고 있음을 알립니다.Ask Maps 기능으로 홈페이지에 챗봇 경험 도입별도로, Google은 Gemini의 대화형 인터페이스를 앱 홈페이지에 직접 도입하는 확장된 “Ask Maps” 기능을 개발하고 있습니다. 이 기능은 메인 검색창 아래에 칩으로 나타나며 Gemini 앱과 유사한 하단 시트 인터페이스를 엽니다.초기 테스트 결과 이 시스템은 “카운터 좌석과 훌륭한 사케가 있는 심야 스시 맛집이 근처에 어디 있어?“와 같은 복잡한 질문을 처리하면서 동시에 지도상에 관련 위치를 표시할 수 있는 것으로 나타났습니다. 그러나 일부 테스터들이 중복된 답변과 위치 불일치를 보고하는 등 이 기능은 여전히 버그가 있는 상태입니다.광범위한 생태계 전환 및 자동차 응용 분야이 지도 통합은 Google이 전체 생태계에서 Google Assistant를 Gemini로 빠르게 교체하고 있음을 나타냅니다. 회사는 이미 2025년 10월부터 스마트 홈 기기를 Gemini로 전환하기 시작했으며, Android Auto의 Google Assistant 참조도 조용히 업데이트되었습니다.자동차 분야의 영향은 모바일 앱을 넘어 확장됩니다.Google과 Mercedes-Benz는 Google 캠퍼스에서 진행된 시승에서 곧 출시될 CLA 모델의 Gemini 통합을 시연했습니다. 이 시스템은 이탈리아 레스토랑 찾기, 와인 리스트 확인, 직접 전화 걸기 제안 등 복잡한 대화 작업을 처리했으며, 이는 기존 음성 비서에 비해 상당한 발전을 의미합니다.Mercedes CLA는 2025년 말 이전에 미국에서 출시될 때 Gemini 기술이 통합된 최초의 양산 차량이 될 것입니다. 이러한 발전은 Google이 Maps 및 YouTube와 같은 인기 서비스에 Gemini를 번들로 제공하려는 의도에 대해 법적 문제에 직면한 가운데 이루어졌으며, 법무부는 최근 법정 심리에서 이러한 관행에 반대하고 있습니다.
4 조회
0 추천
17:57 등록
(퍼플렉시티가 정리한 기사)SoftBank Group은 CEO 손정의의 공격적인 인공지능 투자 캠페인의 최신 움직임으로, 반도체 자회사 Arm Holdings 의 주식을 담보로 50억 달러의 마진론을 확보하기 위해 글로벌 은행들과 최종 협상 중입니다.제안된 대출은 SoftBank의 Arm 주식 담보 총 차입금을 185억 달러로 늘리게 되며, 이는 2025년 3월 기준으로 이미 확보한 135억 달러의 마진론(이중 50억 달러는 아직 미인출)을 기반으로 합니다. 이 문제에 정통한 소식통들은 해당 자금이 2025년 내내 OpenAI에 대한 추가 투자를 지원할 것이라고 밝혔으며, 손 회장은 이 일본 대기업을 글로벌 AI 붐의 중심에 위치시키고 있습니다.전략적 AI 확장 가속화소프트뱅크의 대규모 차입은 일련의 주요 AI 중심 인수 및 파트너십과 동시에 이루어지고 있습니다. 불과 이틀 전, 회사는 ABB Ltd.의 로보틱스 부문을 54억 달러에 인수하는 계약을 발표했으며, 손 대표는 “소프트뱅크의 개척지는 AI”라고 선언하고 “인공 초지능과 로보틱스의 융합” 계획을 강조했습니다.대출 협상은 손 대표가 OpenAI에 최대 300억 달러를 약속하고, OpenAI 및 과의 합작 투자인 5,000억 달러 규모의 야심찬 Stargate 프로젝트에서 리더십 역할을 맡은 이후 진행되고 있습니다. 이 프로젝트는 미국 전역에 AI 데이터 센터를 구축하는 것을 목표로 합니다. Stargate 이니셔티브는 이미 4,000억 달러 이상의 투자 약속을 확보했으며, 예정보다 앞서 2025년 말까지 전체 자금 목표를 달성할 예정입니다.시장 성과가 신뢰를 높이다Arm의 주가는 올해 38% 급등했으며, 이는 SoftBank에게 차입 전략을 위한 추가 담보 능력을 제공했습니다. 이 반도체 설계업체의 강력한 실적은 손 대표의 자금 조달 방식에 힘을 실어주었으며, 이는 회사의 AI 야망을 위한 자금 조달에 있어 자산 매각보다는 마진 대출에 크게 의존하고 있습니다.Bloomberg Intelligence 애널리스트 Sharon Chen은 Ampere Computing의 잠재적 인수와 지속적인 Stargate 투자를 포함한 보류 중인 거래를 고려할 때 SoftBank의 총 자금 조달 필요액이 300억 달러를 초과할 수 있다고 추정합니다. 그러나 애널리스트들은 회사가 25% 담보대출비율(loan-to-value) 한계치에 접근하고 있을 수 있다고 경고하며, JPMorgan 추정에 따르면 AI 관련 부채가 전 세계적으로 1.2조 달러로 급증함에 따라 회사의 신용 프로필에 대한 우려가 제기되고 있습니다.
4 조회
0 추천
17:55 등록
(퍼플렉시티가 정리한 기사)메타 는 메타버스 사업부에 운영 방식을 대대적으로 개편하도록 지시하며, 직원들이 업무의 모든 측면에 인공지능을 통합하여 5배의 생산성 향상을 달성할 것을 요구하고 있다. 여러 매체가 입수한 내부 커뮤니케이션을 통해 공개된 이 야심찬 이니셔티브는 고전하고 있는 회사의 가상현실 사업부에 중요한 전환점을 의미한다.메타의 메타버스 담당 부사장인 비샬 샤(Vishal Shah)는 내부 메시지를 통해 “AI4P”(생산성을 위한 AI) 프로그램을 공개하며 직원들에게 “5%가 아닌 5배로 생각하라”고 촉구했다 — 이는 점진적 개선이 아닌 혁신적 변화를 강조하는 것이다. 이 지시는 메타가 제한적인 대중 채택만을 가져온 메타버스 투자에 대한 수십억 달러 규모의 정당성을 입증해야 한다는 압박이 커지는 가운데 나온 것이다.전사적 AI 통합 추진이 이니셔티브는 전통적인 엔지니어링 역할을 넘어 제품 관리자, 디자이너 및 교차 기능 파트너까지 포괄하며, Shah는 모든 팀원이 “소매를 걷어붙이고 프로토타입을 구축하고, 버그를 수정하며, 가능한 것의 경계를 넓혀야 한다”고 강조했습니다. Meta는 전용 교육 프로그램과 “AI 학습의 날”을 통해 연말까지 메타버스 인력의 80%가 일상 업무에 AI를 통합할 것으로 기대하고 있습니다.이러한 메타버스 중심의 추진은 회사의 광범위한 트렌드와 일치합니다. Meta는 직원의 AI 사용을 모니터링하기 위한 추적 대시보드를 구현했으며, 채택을 장려하기 위해 “Level Up”이라는 게임화된 시스템을 만들었습니다. Reality Labs 부서는 특히 현재 70%의 비율에서 75% 이상으로 AI 도구 사용을 늘리는 것을 목표로 하고 있습니다.전략적 맥락 및 산업에 미치는 영향이 방침은 메타에서 AI의 역할에 대한 CEO 마크 저커버그의 더 큰 비전을 반영합니다. 그는 이전에 인공지능이 12-18개월 내에 회사 코드의 대부분을 작성할 것이라고 예측했으며, 메타는 현재 채용 지원자들이 코딩 인터뷰 중에 AI를 사용할 수 있도록 허용하고 있습니다. 회사는 2025년 AI 인프라에 600억~650억 달러를 투자하고 있으며, 여기에는 대규모 데이터 센터 건설과 130만 개 이상의 GPU 배포가 포함됩니다.그러나 이러한 공격적인 목표는 엔지니어들 사이에서 코드 품질과 AI 생성 시스템 유지보수의 어려움에 대한 우려를 불러일으켰습니다. 일부 개발자들은 기술 부채 생성과 자신이 작성하지 않은 코드를 디버깅하는 어려움에 대해 걱정하고 있으며, 이는 소프트웨어 개발 품질에 대한 AI의 영향에 관한 광범위한 업계 논쟁을 반영하고 있습니다.
5 조회
0 추천
17:52 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입