Loading...

AI 뉴스

바이두, 새로운 AI 모델이 GPT-5를 능가한다고 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.12 21:44
1,445 조회
0 추천
0 비추천

본문

f43ee9a7735c9322763d602776200742_1762951492_0474.jpg
 

(퍼플렉시티가 정리한 기사)


바이두는 11월 11일 ERNIE-4.5-VL-28B-A3B-Thinking을 공개했다. 이는 오픈소스 멀티모달 AI 모델로, 중국 기술 대기업은 이 모델이 여러 벤치마크에서 OpenAI의 GPT-5와 구글의 Gemini 2.5 Pro를 능가한다고 주장한다. 이번 출시는 중국과 서구 기술 기업 간 격화되는 인공지능 경쟁에서 중요한 확대를 의미한다.​

허용적인 Apache 2.0 라이선스로 공개된 이 모델은 총 280억 개의 파라미터를 가진 전문가 혼합(Mixture-of-Experts) 아키텍처를 사용하지만, 추론당 30억 개만 활성화하여 높은 성능을 유지하면서도 계산 비용을 획기적으로 줄인다. 바이두의 발표에 따르면, 이 모델은 문서 및 차트 이해 분야의 VQA, MMBench, SEED-Bench 평가에서 Gemini 2.5 Pro를 능가한다.​


효율성과 성능의 만남

경량 설계를 통해 ERNIE-4.5-VL은 비슷한 수준의 전체 매개변수 모델보다 2~3배 빠른 추론 속도를 제공하면서도 훨씬 적은 메모리를 요구합니다. 이 모델은 이미지의 특정 영역을 확대하고, 잘라낸 뷰를 분석하며, 국소적 관찰을 종합적인 답변으로 통합할 수 있는 혁신적인 "이미지를 통한 사고(Thinking with Images)" 기능을 도입했습니다.​

바이두 연구진은 동적 난이도 샘플링을 적용한 GSPO 및 IcePop을 포함한 고급 강화 학습 전략을 활용하여 대규모 시각-언어 추론 데이터에 대한 광범위한 중간 학습 단계를 통해 이 모델을 훈련했습니다. 이 모델은 시각적 추론, STEM 문제 해결, 시각적 그라운딩, 도구 활용 및 비디오 이해 분야에서 뛰어난 성능을 발휘합니다.​


전략적 오픈소스 추진

이번 출시는 중국이 미국 기업들과 경쟁하기 위해 오픈소스 AI 전략을 강화하는 가운데 이루어졌습니다. 최근 분석에 따르면, 중국은 오픈소스 AI 다운로드에서 미국을 앞질렀으며, DeepSeek, Alibaba, Baidu 같은 기업들이 서구 경쟁사들보다 더 빠르고 저렴하게 고성능 모델을 생산할 수 있음을 입증하고 있습니다.​

남가주대학교(University of Southern California)의 Sean Ren은 CNBC에 "주요 연구소가 강력한 모델을 오픈소스로 공개할 때마다 업계 전체의 기준이 높아진다"고 말했습니다. 이러한 움직임은 독점 API와 프리미엄 가격에 의존하는 OpenAI와 Anthropic 같은 비공개 소스 제공업체들에 압박을 가하고 있습니다.​

Baidu는 11월 13일 베이징에서 열리는 Baidu World 2025 컨퍼런스에서 ERNIE 라인업과 추가 AI 발전 사항을 선보일 예정입니다. 이는 중국의 경쟁적인 AI 환경에서 선두주자로서의 입지를 굳히기 위한 노력의 일환입니다.

댓글 0
전체 1,366 / 44 페이지
Googl은 Drive에 “Gemini의 인사이트” 패널을 도입했습니다. 이 패널은 폴더 콘텐츠의 요약을 자동으로 생성하며, 사용자가 폴더를 열 때 표시되는 기존의 가로형 “넛지(nudges)“를 AI 기반의 능동적 개요로 대체합니다.이 기능은 Rapid Release 도메인의 경우 12월 2일부터 출시되기 시작했으며, Scheduled Release 도메인의 경우 12월 9일부터 시작됩니다. Google Docs, Sheets, Slides, PDF 및 하위 폴더를 분석할 수 있으며, 사용자는 “Gemini로 탐색” 사이드 패널을 통해 후속 질문을 할 수 있습니다.액세스는 Google Workspace Business 및 Enterprise 등급, Google One AI Premium, Google AI Pro for Education 사용자를 포함한 유료 구독자로 제한되며, 이는 AI 검색 기능을 프리미엄 페이월 뒤에 배치하는 업계의 광범위한 추세를 따릅니다.
624 조회
0 추천
2025.12.04 등록
• 현대자동차·기아가 3일 일본 도쿄에서 열린 세계 3대 로봇 박람회 ’일본 국제 로봇 전시회 2025(IREX)’에서 차세대 자율주행 로봇 플랫폼 ’모베드(MobED)’의 양산형 모델을 최초 공개했다.• 모베드는 2022년 CES에서 콘셉트로 처음 선보인 후 약 3년간 개발을 거쳐 양산 단계에 도달했으며, 자체 개발한 ‘DnL’ 모듈을 통해 경사로나 최대 20cm 높이의 연석 구간에서도 균형을 유지하며 주행할 수 있다.• 현대차·기아는 베이직과 프로 두 모델로 출시되는 모베드를 내년 상반기부터 판매할 예정이며, 물류·배송·촬영 등 다양한 산업 분야에서 활용될 것으로 기대된다.
668 조회
0 추천
2025.12.03 등록
YouTube는 수백만 명의 크리에이터를 대상으로 AI 딥페이크 감지 도구를 확대 적용했으며, 크리에이터들에게 정부 발급 신분증과 생체 인식 얼굴 영상을 제출하도록 요구해 AI가 생성한 콘텐츠에서 본인 이미지의 무단 사용 여부를 식별하게 했습니다[cnbc +1].전문가들은 Google의 개인정보 처리방침 문구가 회사가 크리에이터의 생체 정보를 AI 모델 학습에 사용할 수 있도록 허용할 수도 있다고 경고했으나, YouTube는 CNBC에 해당 방식으로 사용한 적이 없으며 도구의 문구를 검토 중이지만 기본 정책은 유지하고 있다고 밝혔습니다[cnbc].인물 유사성 보호업체인 Vermillio와 Loti는 고객들에게 해당 프로그램 등록을 자제하라고 권고했으며, 경영진은 AI 시대에 크리에이터들이 가장 중요한 자산이 될 수 있는 자신의 이미지 통제권을 잃을 위험이 있다고 주의했습니다[cnbc].
652 조회
0 추천
2025.12.03 등록
The Information에 따르면, OpenAI는 코딩 및 추론 작업에서 Google의 Gemini 3와 Anthropic의 Opus 4.5를 능가하는 Garlic이라는 코드명의 새로운 AI 모델을 개발 중이며, 2026년 초까지 GPT-5.2 또는 GPT-5.5로 출시될 가능성이 있다[investing +1].이러한 개발은 CEO Sam Altman이 월요일에 직원들에게 광고 계획을 포함한 다른 프로젝트를 연기하고 ChatGPT 개선을 우선시할 것을 촉구하는 “코드 레드” 메모를 발표한 이후 이루어졌으며, 이는 Google이 최근 출시한 Gemini 3 모델로 인한 경쟁 압력이 심화되고 있기 때문이다[forbes +2].이러한 긴박함은 3년 전 Google이 ChatGPT 출시에 대해 자체 “코드 레드”를 선언했던 것과는 반대되는 상황을 반영하고 있으며, Gemini는 현재 월간 사용자 6억 5천만 명으로 성장한 반면 ChatGPT는 주간 사용자 8억 명을 보유하고 있다[fortune +1]
700 조회
0 추천
2025.12.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입