(퍼플렉시티가정리한기사)엘론머스크의인공지능스타트업xAI는2025년11월17일Grok4.1을출시하며정확도에서극적인개선을이루고업계에서가장경쟁이치열한벤치마크중하나에서선두자리를차지했습니다.이모델은AI가거짓이거나무의미한정보를생성하는환각현상을이전버전에비해약3분의2감소시켰습니다.xAI에따르면,Grok4.1의환각비율은Grok4Fast의12.09%에서단4.22%로감소했으며,FActScore지표는9.89%에서2.97%로개선되었습니다.이모델은현재LMArena의TextArena리더보드에서사고모드로1483의Elo점수로1위를차지하고있으며,빠른모드에서는1465점으로2위를기록하고있습니다—이는가장가까운비xAI모델보다31점앞선수치입니다.감성지능과창의적성장정확도향상을넘어,Grok4.1은감성지능분야에서EQ-Bench3에서1586점,CreativeWritingv3에서1722점의기록적인점수를달성했으며,이는xAI의이전최고기록대비600점향상된수치입니다.회사는이러한발전이성격일관성과미묘한의도감지에초점을맞춘강화학습시스템덕분이라고밝혔습니다.11월1일부터14일까지진행된조용한출시기간동안,xAI는모델을실제트래픽에노출시키고지속적인블라인드선호도테스트를실시했으며,Grok4.1은이전프로덕션모델대비64.8%의선호도를기록했습니다.ArenaExpert리더보드에서씽킹버전은1510점을기록했으며,표준버전은1437점으로19위를차지했습니다.프리미엄옵션이포함된무료액세스이모델은grok.com,X,모바일앱을통해전세계모든사용자에게무료로제공되며,이는유료장벽없이최첨단모델을제공하는xAI의패턴을이어가고있습니다.XPremium+구독자를포함한프리미엄등급은더높은사용한도를받습니다.회사는테네시주멤피스에있는Colossus슈퍼컴퓨터를사용하여Grok4.1을구축했으며,이시스템은200,000개이상의GPU를보유하고있으며세계최대AI훈련시스템으로간주됩니다.이번출시는AI부문에서경쟁이심화되는가운데이루어졌으며,Google이연말까지Gemini3.0출시를준비하고있는것으로알려졌습니다.OpenAI는최근자체성능개선과함께GPT5.1을출시했습니다.
812 조회
0 추천
2025.11.18 등록