AI 뉴스

xAI, 환각 현상이 감소된 Grok 4.1 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.18 16:19
967 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1763450380_4053.jpg
 

(퍼플렉시티가 정리한 기사)


엘론 머스크의 인공지능 스타트업 xAI는 2025년 11월 17일 Grok 4.1을 출시하며 정확도에서 극적인 개선을 이루고 업계에서 가장 경쟁이 치열한 벤치마크 중 하나에서 선두 자리를 차지했습니다. 이 모델은 AI가 거짓이거나 무의미한 정보를 생성하는 환각 현상을 이전 버전에 비해 약 3분의 2 감소시켰습니다.​

xAI에 따르면, Grok 4.1의 환각 비율은 Grok 4 Fast의 12.09%에서 단 4.22%로 감소했으며, FActScore 지표는 9.89%에서 2.97%로 개선되었습니다. 이 모델은 현재 LMArena의 Text Arena 리더보드에서 사고 모드로 1483의 Elo 점수로 1위를 차지하고 있으며, 빠른 모드에서는 1465점으로 2위를 기록하고 있습니다—이는 가장 가까운 비xAI 모델보다 31점 앞선 수치입니다.​


감성 지능과 창의적 성장

정확도 향상을 넘어, Grok 4.1은 감성 지능 분야에서 EQ-Bench3에서 1586점, Creative Writing v3에서 1722점의 기록적인 점수를 달성했으며, 이는 xAI의 이전 최고 기록 대비 600점 향상된 수치입니다. 회사는 이러한 발전이 성격 일관성과 미묘한 의도 감지에 초점을 맞춘 강화 학습 시스템 덕분이라고 밝혔습니다.​

11월 1일부터 14일까지 진행된 조용한 출시 기간 동안, xAI는 모델을 실제 트래픽에 노출시키고 지속적인 블라인드 선호도 테스트를 실시했으며, Grok 4.1은 이전 프로덕션 모델 대비 64.8%의 선호도를 기록했습니다. Arena Expert 리더보드에서 씽킹 버전은 1510점을 기록했으며, 표준 버전은 1437점으로 19위를 차지했습니다.​


프리미엄 옵션이 포함된 무료 액세스

이 모델은 grok.com, X, 모바일 앱을 통해 전 세계 모든 사용자에게 무료로 제공되며, 이는 유료 장벽 없이 최첨단 모델을 제공하는 xAI의 패턴을 이어가고 있습니다. X Premium+ 구독자를 포함한 프리미엄 등급은 더 높은 사용 한도를 받습니다. 회사는 테네시주 멤피스에 있는 Colossus 슈퍼컴퓨터를 사용하여 Grok 4.1을 구축했으며, 이 시스템은 200,000개 이상의 GPU를 보유하고 있으며 세계 최대 AI 훈련 시스템으로 간주됩니다.​

이번 출시는 AI 부문에서 경쟁이 심화되는 가운데 이루어졌으며, Google이 연말까지 Gemini 3.0 출시를 준비하고 있는 것으로 알려졌습니다. OpenAI는 최근 자체 성능 개선과 함께 GPT 5.1을 출시했습니다.

댓글 0
전체 1,366 / 43 페이지
삼성전자가 차세대 고대역폭메모리(HBM4)의 내부 성능 테스트를 마치고 12월 2일 생산준비승인(PRA)을 통과하며 본격 양산 준비를 완료했다.삼성은 10나노 6세대 D램과 4나노 파운드리 공정을 활용해 엔비디아가 요구한 동작 속도 초당 11기가비트 이상을 달성했으며, 지난달 국제고체회로학회에서 36GB 용량과 초당 3.3TB 대역폭의 HBM4를 공개했다.현재 엔비디아 등 주요 고객사에 샘플을 보내 품질 테스트를 진행 중이며, 업계는 이르면 이달 내 최종 승인을 받아 내년 차세대 GPU ‘루빈’에 납품될 것으로 전망하고 있다.
504 조회
0 추천
2025.12.04 등록
Googl은 Drive에 “Gemini의 인사이트” 패널을 도입했습니다. 이 패널은 폴더 콘텐츠의 요약을 자동으로 생성하며, 사용자가 폴더를 열 때 표시되는 기존의 가로형 “넛지(nudges)“를 AI 기반의 능동적 개요로 대체합니다.이 기능은 Rapid Release 도메인의 경우 12월 2일부터 출시되기 시작했으며, Scheduled Release 도메인의 경우 12월 9일부터 시작됩니다. Google Docs, Sheets, Slides, PDF 및 하위 폴더를 분석할 수 있으며, 사용자는 “Gemini로 탐색” 사이드 패널을 통해 후속 질문을 할 수 있습니다.액세스는 Google Workspace Business 및 Enterprise 등급, Google One AI Premium, Google AI Pro for Education 사용자를 포함한 유료 구독자로 제한되며, 이는 AI 검색 기능을 프리미엄 페이월 뒤에 배치하는 업계의 광범위한 추세를 따릅니다.
499 조회
0 추천
2025.12.04 등록
• 현대자동차·기아가 3일 일본 도쿄에서 열린 세계 3대 로봇 박람회 ’일본 국제 로봇 전시회 2025(IREX)’에서 차세대 자율주행 로봇 플랫폼 ’모베드(MobED)’의 양산형 모델을 최초 공개했다.• 모베드는 2022년 CES에서 콘셉트로 처음 선보인 후 약 3년간 개발을 거쳐 양산 단계에 도달했으며, 자체 개발한 ‘DnL’ 모듈을 통해 경사로나 최대 20cm 높이의 연석 구간에서도 균형을 유지하며 주행할 수 있다.• 현대차·기아는 베이직과 프로 두 모델로 출시되는 모베드를 내년 상반기부터 판매할 예정이며, 물류·배송·촬영 등 다양한 산업 분야에서 활용될 것으로 기대된다.
545 조회
0 추천
2025.12.03 등록
YouTube는 수백만 명의 크리에이터를 대상으로 AI 딥페이크 감지 도구를 확대 적용했으며, 크리에이터들에게 정부 발급 신분증과 생체 인식 얼굴 영상을 제출하도록 요구해 AI가 생성한 콘텐츠에서 본인 이미지의 무단 사용 여부를 식별하게 했습니다[cnbc +1].전문가들은 Google의 개인정보 처리방침 문구가 회사가 크리에이터의 생체 정보를 AI 모델 학습에 사용할 수 있도록 허용할 수도 있다고 경고했으나, YouTube는 CNBC에 해당 방식으로 사용한 적이 없으며 도구의 문구를 검토 중이지만 기본 정책은 유지하고 있다고 밝혔습니다[cnbc].인물 유사성 보호업체인 Vermillio와 Loti는 고객들에게 해당 프로그램 등록을 자제하라고 권고했으며, 경영진은 AI 시대에 크리에이터들이 가장 중요한 자산이 될 수 있는 자신의 이미지 통제권을 잃을 위험이 있다고 주의했습니다[cnbc].
543 조회
0 추천
2025.12.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입