Loading...

AI 뉴스

xAI, 환각 현상이 감소된 Grok 4.1 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.18 16:19
1,143 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1763450380_4053.jpg
 

(퍼플렉시티가 정리한 기사)


엘론 머스크의 인공지능 스타트업 xAI는 2025년 11월 17일 Grok 4.1을 출시하며 정확도에서 극적인 개선을 이루고 업계에서 가장 경쟁이 치열한 벤치마크 중 하나에서 선두 자리를 차지했습니다. 이 모델은 AI가 거짓이거나 무의미한 정보를 생성하는 환각 현상을 이전 버전에 비해 약 3분의 2 감소시켰습니다.​

xAI에 따르면, Grok 4.1의 환각 비율은 Grok 4 Fast의 12.09%에서 단 4.22%로 감소했으며, FActScore 지표는 9.89%에서 2.97%로 개선되었습니다. 이 모델은 현재 LMArena의 Text Arena 리더보드에서 사고 모드로 1483의 Elo 점수로 1위를 차지하고 있으며, 빠른 모드에서는 1465점으로 2위를 기록하고 있습니다—이는 가장 가까운 비xAI 모델보다 31점 앞선 수치입니다.​


감성 지능과 창의적 성장

정확도 향상을 넘어, Grok 4.1은 감성 지능 분야에서 EQ-Bench3에서 1586점, Creative Writing v3에서 1722점의 기록적인 점수를 달성했으며, 이는 xAI의 이전 최고 기록 대비 600점 향상된 수치입니다. 회사는 이러한 발전이 성격 일관성과 미묘한 의도 감지에 초점을 맞춘 강화 학습 시스템 덕분이라고 밝혔습니다.​

11월 1일부터 14일까지 진행된 조용한 출시 기간 동안, xAI는 모델을 실제 트래픽에 노출시키고 지속적인 블라인드 선호도 테스트를 실시했으며, Grok 4.1은 이전 프로덕션 모델 대비 64.8%의 선호도를 기록했습니다. Arena Expert 리더보드에서 씽킹 버전은 1510점을 기록했으며, 표준 버전은 1437점으로 19위를 차지했습니다.​


프리미엄 옵션이 포함된 무료 액세스

이 모델은 grok.com, X, 모바일 앱을 통해 전 세계 모든 사용자에게 무료로 제공되며, 이는 유료 장벽 없이 최첨단 모델을 제공하는 xAI의 패턴을 이어가고 있습니다. X Premium+ 구독자를 포함한 프리미엄 등급은 더 높은 사용 한도를 받습니다. 회사는 테네시주 멤피스에 있는 Colossus 슈퍼컴퓨터를 사용하여 Grok 4.1을 구축했으며, 이 시스템은 200,000개 이상의 GPU를 보유하고 있으며 세계 최대 AI 훈련 시스템으로 간주됩니다.​

이번 출시는 AI 부문에서 경쟁이 심화되는 가운데 이루어졌으며, Google이 연말까지 Gemini 3.0 출시를 준비하고 있는 것으로 알려졌습니다. OpenAI는 최근 자체 성능 개선과 함께 GPT 5.1을 출시했습니다.

댓글 0
전체 1,366 / 8 페이지
구글 동영상 ai 서비스 veo3 가 업데이트 되었네요..https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video/아래 예는 일관성 부분해상도 개선과 숏폼 형태 (세로) 지원등도 소개되어 있습니다.
441 조회
0 추천
2026.01.14 등록
Executive Summary• 앤스로픽(Anthropic)이 최고제품책임자(CPO) 마이크 크리거를 내부 인큐베이터 '랩스(Labs)' 팀 공동 리더로 전환 배치• 2024년 중반 2명으로 시작한 랩스 팀, 향후 6개월 내 인원 2배 확대 계획• 인스타그램 공동창업자 출신 크리거, "AI 활용 방식을 결정할 수 있는 결정적 시기" 강조• 애플·구글 등 빅테크와 AI 스타트업 간 경쟁 심화 속 조직 개편 단행Background앤스로픽은 2024년 중반 내부 인큐베이터 '랩스' 팀을 창설해 실험적 제품 개발에 착수했다. 클로드(Claude) AI 모델로 주목받는 앤스로픽은 빅테크 기업들과의 경쟁 속에서 조직 혁신을 통해 시장 대응력을 강화하고 있다.Impact & Implications경쟁 구도 변화애플과 구글이 AI 분야에서 방어선을 강화하는 가운데, 앤스로픽의 이번 조직 개편은 AI 업계 경쟁 심화를 반영한다. 인스타그램 공동창업자 출신인 크리거의 제품 개발 역량을 실험적 프로젝트에 집중 투입함으로써, 앤스로픽은 빠르게 변화하는 AI 시장에서 선제적 대응을 꾀하고 있다.기술적 의미크리거는 "AI 모델의 역량이 너무 빠르게 발전해 활용 방식을 결정할 수 있는 시간이 바로 지금"이라고 밝혔다. 이는 AI 기술의 급속한 발전 속에서 제품화 속도가 경쟁력의 핵심이 되고 있음을 시사한다.산업/시장 영향다니엘라 아모데이(Daniela Amodei) 앤스로픽 사장은 "AI 발전 속도가 기존과 다른 방식의 구축, 조직, 집중을 요구한다"고 강조했다. 랩스 팀 확대는 앤스로픽이 실험적 제품을 통해 새로운 시장 기회를 선점하려는 전략으로 해석된다.Key Data & Facts항목수치/내용인물마이크 크리거 (Mike Krieger)이전 직책최고제품책임자 (CPO)신규 역할랩스 팀 공동 리더랩스 창설2024년 중반초기 인원2명확대 계획6개월 내 2배 증원Key Quote"We've reached a watershed moment in AI—model capabilities are advancing so fast that the window to shape how they're used is now."— 마이크 크리거, 앤스로픽 랩스 팀 공동 리더
932 조회
0 추천
2026.01.14 등록
Executive Summary• 앤스로픽이 파일 시스템과 직접 상호작용하는 AI 에이전트 기능 'Claude Cowork'를 연구 프리뷰로 공개• 기존 Claude Code의 기능을 비개발자도 활용할 수 있도록 확장한 것이 핵심• 사용자 컴퓨터의 폴더에 접근해 파일을 읽고, 편집하고, 생성하는 자율적 작업 수행 가능• Claude Max 구독자 대상 우선 제공, 일반 사용자는 대기자 명단 등록 필요BackgroundAI 업계는 단순 질의응답을 넘어 실질적인 업무를 수행하는 'AI 에이전트' 개발 경쟁이 치열하다. 앤스로픽은 지난 10월 'Skills for Claude'를 통해 개인화된 작업 학습 기능을 선보인 바 있으며, 이번 Cowork는 그 연장선에서 더욱 광범위한 자율 작업 능력을 부여한 것이다.Impact & Implications기술적 의미Claude Cowork는 AI가 사용자의 로컬 파일 시스템에 직접 접근해 문서 정리, 파일 편집, 콘텐츠 생성 등을 수행한다. 기존 Claude Code가 개발자 중심이었다면, Cowork는 비개발자도 활용할 수 있는 범용 AI 에이전트로 포지셔닝된다. 사용자가 지속적으로 컨텍스트를 제공하거나 출력물을 별도로 변환할 필요 없이, AI가 작업 중간에도 피드백을 반영하며 진행할 수 있다는 점이 특징이다.경쟁 구도 변화OpenAI, Google 등 빅테크 기업들도 AI 에이전트 개발에 박차를 가하는 상황에서, 앤스로픽의 선제적 출시는 시장 주도권 확보를 위한 전략으로 해석된다. 특히 macOS 앱 사이드바에서 바로 접근 가능한 UX는 일상적 업무 통합을 노린 것으로 보인다.사용자 영향 및 리스크앤스로픽은 발표와 함께 AI 에이전트의 잠재적 위험성도 경고했다. 명확하지 않은 지시가 있을 경우, Claude가 예상치 못한 행동을 할 수 있다는 점을 명시했다. 파일 시스템에 대한 광범위한 접근 권한이 부여되는 만큼, 보안과 프라이버시 측면에서 사용자의 주의가 필요하다.Key Data & Facts항목수치/내용기능명Claude Cowork출시 형태연구 프리뷰(Research Preview)이용 대상Claude Max 구독자 우선, 일반 사용자 대기자 등록플랫폼macOS 앱선행 기능Skills for Claude (2025년 10월 발표)Key Quote"Cowork can take on many of the same tasks that Claude Code can handle, but in a more approachable form for non-coding tasks."— Anthropic
482 조회
0 추천
2026.01.13 등록
으아.. 애플이 아이폰에 제미나이를 쓰겠다고 하네요..그럼 정말 안드로이드 폰하고 뭐가 달라질라나...Apple picks Google’s Gemini AI for its big Siri upgrade애플은 올해 출시될 더욱 개인화된 시리(Siri)에 구글의 제미니(Gemini) AI 모델을 적용할 예정이다.구글과 애플은 월요일에 "신중한 평가 끝에 애플은 구글의 AI 기술이 애플 파운데이션 모델(Foundation Models)에 가장 적합한 기반을 제공한다고 판단했으며,이를 통해 애플 사용자들에게 혁신적인 새로운 경험을 제공할 수 있게 되어 기쁘다"고 발표했다 .최초 보도는 cnbchttps://www.cnbc.com/2026/01/12/apple-google-ai-siri-gemini.html“After careful evaluation, we determined that Google’s technology provides the most capable foundation for Apple Foundation Models and we’re excited about the innovative new experiences it will unlock for our users,” Apple said in astatementMonday.
460 조회
0 추천
2026.01.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입