(퍼플렉시티가정리한기사)바이두는11월11일ERNIE-4.5-VL-28B-A3B-Thinking을공개했다.이는오픈소스멀티모달AI모델로,중국기술대기업은이모델이여러벤치마크에서OpenAI의GPT-5와구글의Gemini2.5Pro를능가한다고주장한다.이번출시는중국과서구기술기업간격화되는인공지능경쟁에서중요한확대를의미한다.허용적인Apache2.0라이선스로공개된이모델은총280억개의파라미터를가진전문가혼합(Mixture-of-Experts)아키텍처를사용하지만,추론당30억개만활성화하여높은성능을유지하면서도계산비용을획기적으로줄인다.바이두의발표에따르면,이모델은문서및차트이해분야의VQA,MMBench,SEED-Bench평가에서Gemini2.5Pro를능가한다.효율성과성능의만남경량설계를통해ERNIE-4.5-VL은비슷한수준의전체매개변수모델보다2~3배빠른추론속도를제공하면서도훨씬적은메모리를요구합니다.이모델은이미지의특정영역을확대하고,잘라낸뷰를분석하며,국소적관찰을종합적인답변으로통합할수있는혁신적인"이미지를통한사고(ThinkingwithImages)"기능을도입했습니다.바이두연구진은동적난이도샘플링을적용한GSPO및IcePop을포함한고급강화학습전략을활용하여대규모시각-언어추론데이터에대한광범위한중간학습단계를통해이모델을훈련했습니다.이모델은시각적추론,STEM문제해결,시각적그라운딩,도구활용및비디오이해분야에서뛰어난성능을발휘합니다.전략적오픈소스추진이번출시는중국이미국기업들과경쟁하기위해오픈소스AI전략을강화하는가운데이루어졌습니다.최근분석에따르면,중국은오픈소스AI다운로드에서미국을앞질렀으며,DeepSeek,Alibaba,Baidu같은기업들이서구경쟁사들보다더빠르고저렴하게고성능모델을생산할수있음을입증하고있습니다.남가주대학교(UniversityofSouthernCalifornia)의SeanRen은CNBC에"주요연구소가강력한모델을오픈소스로공개할때마다업계전체의기준이높아진다"고말했습니다.이러한움직임은독점API와프리미엄가격에의존하는OpenAI와Anthropic같은비공개소스제공업체들에압박을가하고있습니다.Baidu는11월13일베이징에서열리는BaiduWorld2025컨퍼런스에서ERNIE라인업과추가AI발전사항을선보일예정입니다.이는중국의경쟁적인AI환경에서선두주자로서의입지를굳히기위한노력의일환입니다.
1042 조회
0 추천
2025.11.12 등록