Loading...

AI 뉴스

xAI, 비용 98% 절감한 Grok 4 Fast 출시

페이지 정보

작성자 xtalfi
작성일 2025.09.21 13:33
1,333 조회
0 추천
0 비추천

본문

5b93fb42c510c8986f85668180eba6f7YZKc.jpg

(퍼플렉시티가 정리한 기사)

일론 머스크의 xAI는 2025년 9월 19일에 Grok 4 Fast를 공개하며, 인공지능 모델을 비용 효율적인 추론 기술의 혁신으로 자리매김했습니다. 이 모델은 최대 200만 토큰의 컨텍스트 윈도우를 제공하며, 이전 모델보다 40% 적은 토큰을 사용하면서도 유사한 수준의 성능을 유지합니다.

새로운 모델은 추론 및 비추론 기능을 하나의 프레임워크에 통합한 통합 아키텍처를 제시하며, 개발자들이 정확도를 희생하지 않고 연산 노력을 조절할 수 있도록 합니다. xAI의 내부 테스트에 따르면 Grok 4 Fast는 Grok 4와 동일한 벤치마크 성능을 달성할 때 비용을 98%까지 줄이는 것으로 나타났습니다.

 

경쟁 테스트에서 뛰어난 성능

 

Grok 4 Fast는 여러 평가 플랫폼에서 인상적인 결과를 보여주었습니다. 코드네임 "Menlo"로 운영되는 이 모델은 LMArena의 Search Arena에서 Elo 점수 1,163으로 1위를 차지하며, 가장 가까운 경쟁자인 o3-search를 17점 차이로 앞섰습니다. 또한 Text Arena에서는 8위를 기록하여, 더 큰 모델들과 비교했을 때 지능 밀도를 과시했습니다.

Artificial Analysis의 독립적인 분석에서 Grok 4 Fast는 경쟁력 있는 위치를 확인받았으며, GPT-5, Gemini 2.5 Pro, Claude 4.1 Opus 등과 함께 순위에 오르는 동시에 Grok 4에 비해 약 47배 낮은 비용으로 운영되는 것으로 평가되었습니다. 이 모델은 AIME 2025에서 92%, HMMT 2025에서 93.3%, GPQA Diamond에서는 85.7% 등 의미 있는 벤치마크 점수를 달성했습니다.

 

고급 교육 및 도구 통합

 

이 모델은 코드 실행과 웹 브라우징 기능을 포함하여 도구 사용에 대한 자율적 의사 결정을 가능하게 하는 종단 간 강화 학습 훈련을 통합하고 있습니다. 이러한 훈련 방식은 Grok 4 Fast가 X의 멀티미디어 콘텐츠를 분석하고 실시간 정보를 효율적으로 종합할 수 있게 해줍니다.

xAI는 두 가지 구별되는 변형을 제공합니다: grok-4-fast-reasoning과 grok-4-fast-non-reasoning이며, 두 가지 모두 2백만 토큰 컨텍스트 창을 지원합니다. 이 모델은 초당 296.8 토큰의 속도로 작동하며 최초 토큰 생성까지 2.57초가 걸려, 동급 평균 모델에 비해 더 빠른 성능을 제공합니다.

 

접근성 및 가격 구조

 

Grok 4 Fast는 모든 사용자에게 grok.com, iOS, Android 애플리케이션의 Fast 및 Auto 모드를 통해 즉시 제공됩니다. 한정된 기간 동안, 이 모델은 OpenRouter와 Vercel AI Gateway 플랫폼을 통해 무료로 제공됩니다.

xAI API의 요금 구조는 128,000 토큰 미만의 요청에 대해 백만 입력 토큰당 $0.20에서 시작하며, 더 큰 요청의 경우 백만 당 $0.40까지 올라갑니다. 출력 토큰의 경우, 소규모 요청은 백만 당 $0.50이고, 대규모 사용 시 백만 당 $1.00입니다. 캐시된 입력 토큰은 백만 당 $0.05로 책정되어 있습니다.

댓글 0
전체 1,203 / 247 페이지
(퍼플렉시티가 정리한 기사)구글 클라우드가 AI 에이전트가 사용자를 대신해 안전하게 결제를 처리할 수 있는 새로운 개방형 표준 ’에이전트 결제 프로토콜(AP2)’을 17일(현지시간) 공개했다. AP2는 기존 결제 시스템이 사람의 직접 승인을 전제로 설계된 한계를 넘어 AI 에이전트 기반 상거래의 신뢰와 보안을 강화하는 프레임워크를 제공한다.60개 이상 글로벌 기업과 협력한 새로운 결제 표준AP2는 구글 클라우드가 주요 결제 및 기술 기업과 공동 개발한 것으로, 기존 에이전트-투-에이전트(A2A) 및 모델 컨텍스트 프로토콜(MCP)의 확장판이다. 마스터카드, 아메리칸 익스프레스, 페이팔, 코인베이스, 세일즈포스 등 60개 이상의 글로벌 기업이 개발과 도입에 참여했다.아시아 지역에서는 한국사이버결제(NHN KCP), 에어월렉스(Airwallex), 피우(Fiuu), 라자다(Lazada), 쇼피(Shopee), 잘로라(ZALORA) 등이 참여해 글로벌 확산 기반을 마련했다.암호화된 디지털 위임장으로 신뢰성 확보AP2의 핵심은 위·변조가 불가하고 암호화 방식으로 서명된 디지털 계약인 ‘위임장(Mandate)’ 시스템이다. 이는 사용자의 구매 권한 부여와 진짜 의도 보장, 문제 발생 시 책임 규명이라는 AI 에이전트 결제의 핵심 과제를 해결한다.위임장은 두 가지 방식으로 작동한다. 실시간 구매 시에는 사용자가 “흰색 러닝화 찾아줘”라고 요청하면 ‘구매 의사 위임장’이 생성되고, 에이전트가 찾은 상품을 사용자가 승인하면 ‘장바구니 위임장’이 서명돼 변경 불가능한 거래 기록이 완성된다. 사용자 부재 시에는 가격 한도와 구매 조건을 담은 상세한 위임장을 사전에 설정해 에이전트가 조건 충족 시 자동으로 결제를 진행할 수 있다.신용카드부터 암호화폐까지 다양한 결제 지원AP2는 신용카드, 체크카드, 실시간 계좌이체 등 기존 결제 방식은 물론 스테이블코인과 같은 암호화폐까지 지원하는 결제 방식 중립적 프레임워크를 제공한다. 특히 구글은 코인베이스, 이더리움 재단, 메타마스크 등과 협력해 에이전트 기반 암호화폐 결제를 위한 A2A x402 확장 기능을 출시했다.구글 클라우드 비즈니스 애플리케이션 플랫폼 담당 라오 수라파네니 부사장은 “AP2는 에이전트와 판매업체 간 안전한 준법 거래를 위한 공통 언어를 제공해 생태계 분열을 방지한다”며 “사용자와 판매자에게 일관되고 안전하며 확장 가능한 경험을 보장한다”고 설명했다.AP2는 항공권과 호텔 예약을 동시에 처리하거나, 품절 상품의 재입고 시 자동 구매 등 완전히 새로운 커머스 경험을 가능하게 한다고 구글은 설명했다. 이 프로토콜의 전체 기술 명세는 깃허브를 통해 공개돼 개발자와 기업들이 활용할 수 있다.
1407 조회
0 추천
2025.09.18 등록
손목밴드에서 조정을 하는 것 같고 전작과 많이 달라졌습니다.AI 기능으로 번역도 가능하네요..https://www.meta.com/kr/ai-glasses/meta-ray-ban-display/
1403 조회
0 추천
2025.09.18 등록
조금 전 메타가 AI 기능이 있는 안경을 비롯하여 중요한 키노트를 진행하였습니다.CNET이 준비한 키노트 요약입니다.RAYBAN 과 새로 제작한 안경이 큰 화제입니다.
1499 조회
0 추천
2025.09.18 등록
마이크로소프트가 코파일럿 메모장과 그림판 연동기능을 제공하기 시작했으며이 기능은 오피스365를 사용하지 않아도 코파일럿을 이욯하면 이용할 수 있다.예를 들어 메모장은 다음과 같은 기능을 갖게 된다.-요약: 긴 텍스트를 간략하게 요점만 추려내고, 문서의 핵심을 빠르게 파악할 수 있습니다.- 쓰기: 프롬프트나 선택한 텍스트를 활용해 새로운 문장을 AI로 쉽고 빠르게 작성합니다.- 다시 쓰기: 선택한 내용을 AI가 어투, 길이, 명확성 등 다양한 스타일로 변환해 줍니다.또한 그림판은 다음과 같은 기능을 추가하게 된다.- 프로젝트 파일 저장 기능: 그림판에서 작업을 .paint 파일로 저장해 언제든 이어서 편집이 가능.- 불투명도(Opacity) 슬라이더: 연필 및 브러시 도구의 투명도를 원하는 대로 조절해 더 섬세한 혼합이나 레이어링 효과 주기.- 크기 및 불투명도 슬라이더 병행 사용: 두 슬라이더를 활용해 부드럽게 배합하고 다양한 질감의 그림 그리기.
1429 조회
0 추천
2025.09.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입