Loading...

AI 뉴스

xAI, 환각 현상이 감소된 Grok 4.1 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.18 16:19
1,086 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1763450380_4053.jpg
 

(퍼플렉시티가 정리한 기사)


엘론 머스크의 인공지능 스타트업 xAI는 2025년 11월 17일 Grok 4.1을 출시하며 정확도에서 극적인 개선을 이루고 업계에서 가장 경쟁이 치열한 벤치마크 중 하나에서 선두 자리를 차지했습니다. 이 모델은 AI가 거짓이거나 무의미한 정보를 생성하는 환각 현상을 이전 버전에 비해 약 3분의 2 감소시켰습니다.​

xAI에 따르면, Grok 4.1의 환각 비율은 Grok 4 Fast의 12.09%에서 단 4.22%로 감소했으며, FActScore 지표는 9.89%에서 2.97%로 개선되었습니다. 이 모델은 현재 LMArena의 Text Arena 리더보드에서 사고 모드로 1483의 Elo 점수로 1위를 차지하고 있으며, 빠른 모드에서는 1465점으로 2위를 기록하고 있습니다—이는 가장 가까운 비xAI 모델보다 31점 앞선 수치입니다.​


감성 지능과 창의적 성장

정확도 향상을 넘어, Grok 4.1은 감성 지능 분야에서 EQ-Bench3에서 1586점, Creative Writing v3에서 1722점의 기록적인 점수를 달성했으며, 이는 xAI의 이전 최고 기록 대비 600점 향상된 수치입니다. 회사는 이러한 발전이 성격 일관성과 미묘한 의도 감지에 초점을 맞춘 강화 학습 시스템 덕분이라고 밝혔습니다.​

11월 1일부터 14일까지 진행된 조용한 출시 기간 동안, xAI는 모델을 실제 트래픽에 노출시키고 지속적인 블라인드 선호도 테스트를 실시했으며, Grok 4.1은 이전 프로덕션 모델 대비 64.8%의 선호도를 기록했습니다. Arena Expert 리더보드에서 씽킹 버전은 1510점을 기록했으며, 표준 버전은 1437점으로 19위를 차지했습니다.​


프리미엄 옵션이 포함된 무료 액세스

이 모델은 grok.com, X, 모바일 앱을 통해 전 세계 모든 사용자에게 무료로 제공되며, 이는 유료 장벽 없이 최첨단 모델을 제공하는 xAI의 패턴을 이어가고 있습니다. X Premium+ 구독자를 포함한 프리미엄 등급은 더 높은 사용 한도를 받습니다. 회사는 테네시주 멤피스에 있는 Colossus 슈퍼컴퓨터를 사용하여 Grok 4.1을 구축했으며, 이 시스템은 200,000개 이상의 GPU를 보유하고 있으며 세계 최대 AI 훈련 시스템으로 간주됩니다.​

이번 출시는 AI 부문에서 경쟁이 심화되는 가운데 이루어졌으며, Google이 연말까지 Gemini 3.0 출시를 준비하고 있는 것으로 알려졌습니다. OpenAI는 최근 자체 성능 개선과 함께 GPT 5.1을 출시했습니다.

댓글 0
전체 1,366 / 25 페이지
• Google은 디스플레이 하단에 단일 행의 떠 있는 입력 상자를 배치한 새로운 Gemini 인터페이스를 테스트하고 있다. 이 디자인은 첨부 파일, 모델 선택기 같은 고급 도구들을 통합된 플러스(Plus) 버튼 뒤로 모아 시각적 혼잡을 줄이는 방식이며, 이는 Google 앱 16.51.52 버전 코드에서 발견된 내용에 따른 것이다.• “Gemini UX 2.0”으로 명명된 이번 전면 개편은 점진적 공개(pr​ogressive disclosure) 원칙을 따르며, 기본 상태에서는 인터페이스를 최소화하되 Deep Research, Canvas와 같은 기능들을 새로운 Tools 아이콘 아래에 배치해, 고급 제어 기능이 필요할 때에만 접근 가능하도록 한다.• 코드 문자열에 따르면, 실험적 기능을 위한 새로운 Gemini Labs 설정 영역이 추가되었으며, 이는 Google Labs와 Search Labs를 반영한 형태다. 초기 테스트 사용자들은 이 영역에서 완성되지 않은 기능들의 토글을 전환하고, 더 넓은 범위로 공개되기 전에 피드백을 제공할 수 있다.
492 조회
0 추천
2025.12.25 등록
• 엑서터 대학교(University of Exeter) 연구진은 AI 챗봇이 평판 훼손, 정서적 피해, 사회적 혼란을 야기하는 “야생형(feral)” 가십을 만들어 퍼뜨리고 있으며, 인간 의사소통을 조절하는 사회적 규범의 통제를 받지 않은 채 작동하고 있다고 경고했다.• Ethics and Information Technology에 게재된 이 연구는 AI 시스템들 사이에서 빠르게 확산되는 위험한 “봇-투-봇(bot-to-bot)” 가십을 강조하며, 챗봇이 **호주 시장 브라이언 후드(Brian Hood)**에게 뇌물 수수 혐의를, 라디오 진행자 **마크 월터스(Mark Walters)**에게 횡령 혐의를 거짓으로 뒤집어씌운 사례 등을 문서화했다.• 연구진은 기술 기업들이 메모리 기능, 음성 모드와 같은 개인화 기능을 갖춘 챗봇을 설계함에 따라, AI 가십이 더욱 만연해질 것이며, 그 결과 이용자들이 신뢰할 만한 정보와 함께 근거 없는 비난도 더 쉽게 수용하게 될 것이라고 예측한다.
514 조회
0 추천
2025.12.25 등록
• 애플은 2026년 말 공개를 목표로, 코드명 N50인 AI 기반 스마트 글라스를 개발 중이며, 이는 메타의 레이밴(Ray-Ban) 협업 제품과 경쟁하게 될 것으로 알려졌다. 이 제품은 개편된 시리를 통한 음성 기반 AI와, 디스플레이 없이도 시각 지능을 구현하기 위한 다수의 카메라를 탑재할 예정이라고 사안에 정통한 관계자들은 전했다.• 회사는 글라스 프로젝트에 자원을 집중하기 위해 더 가벼운 버전의 비전 프로(Vision Pro) 후속 모델 계획을 보류했으며, 이 스마트 글라스는 애플 워치처럼 아이폰과 페어링되고, 전력 효율에 최적화된 S-클래스 칩을 사용할 예정이다. 출하는 2027년 시작이 예상된다.• 애플은 또한 비주얼 룩 업(Visual Look Up)과 상황 인지형 알림 등 기능을 갖춘 AI 강화 에어팟(AirPods)을 선보일 계획이며, 이 시장에서 현재 메타가 약 60%의 점유율을 차지하고 있고, 애널리스트들은 AI 글라스 분야가 2030년까지 매년 100% 이상 성장할 것으로 전망하고 있다.
496 조회
0 추천
2025.12.22 등록
삼성전자가 엔비디아의 차세대 HBM4 테스트에서 구동 속도와 전력 효율 면에서 ‘최우수’ 평가를 받으며, 내년 공급 물량의 30% 이상을 차지할 것으로 전망된다.삼성전자의 HBM4는 초당 11Gbps 이상의 속도를 구현하고 전력 효율을 전 세대 대비 40% 개선했으며, 올해 3분기 HBM 시장 점유율 22%로 마이크론을 제치고 2위를 탈환했다.HBM4는 내년 하반기 출시 예정인 엔비디아의 차세대 AI 가속기 ‘베라 루빈’에 탑재될 핵심 부품으로, 삼성전자는 1분기 정식 계약 체결 후 2분기부터 본격 공급을 시작할 예정이다.
495 조회
0 추천
2025.12.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입