Loading...

AI 뉴스

바이두, 2.4조 매개변수를 가진 ERNIE 5.0 AI 모델 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.15 17:05
1,385 조회
0 추천
0 비추천

본문

50d4cf1c79fbfdc8ae75d90b42e8ddf3_1763193766_6477.png
(퍼플렉시티가 정리한 기사)


바이두는 목요일 베이징에서 열린 Baidu World 2025 컨퍼런스에서 네이티브 옴니모달 인공지능 기초 모델인 ERNIE 5.0을 공개했다. 중국의 기술 대기업은 점점 더 경쟁이 치열해지는 국내 AI 시장에서 주도권을 되찾기 위해 힘쓰고 있다.

이 모델은 2.4조개의 파라미터를 특징으로 하며, 텍스트, 이미지, 오디오, 비디오 데이터를 동시에 처리해 멀티모달 이해 및 생성 기능을 제공한다. ERNIE 5.0은 현재 ERNIE Bot에서 공개 프리뷰로 제공되며, 기업 고객은 바이두 AI 클라우드의 첸판(Qianfan) 플랫폼을 통해 이용 가능하다. 벤치마크 테스트에서, 회사 측은 이 모델이 Gemini 2.5 Pro와 GPT-5 등 글로벌 선도 모델들과 비슷한 성능을 보인다고 밝혔다.

로빈 리 CEO는 “기술적 혁신의 속도가 유일한 경쟁력의 해자”라고 강조하며, AI 애플리케이션이 기초 모델 자체의 가치를 100배로 창출하는 바이두의 비전을 제시했다. 회사는 또한 대규모 추론 시나리오를 위한 M100(2026년 초 출시 예정)과 초대형 모델 훈련을 위한 M300(2027년 초 출시 예정) 등 2종의 새로운 쿤룬 AI 칩도 공개했다.


제품 생태계 및 글로벌 확장

플래그십 모델 외에도 바이두는 AI 제품군 전반에 걸친 업그레이드를 발표했습니다. 범용 AI 에이전트인 GenFlow 3.0은 2천만 사용자에 도달하여 회사가 “세계 최대 범용 에이전트”라고 부르는 제품이 되었습니다. 또한 회사는 세계 최초의 상용 자체 진화 에이전트로 설명되는 Famou를 공개했으며, 이는 초대 코드를 통해 이용 가능하고 운송, 에너지, 금융 및 물류 분야의 복잡한 시나리오를 위해 설계되었습니다.

노코드 애플리케이션 빌더인 Miaoda는 버전 2.0으로 업그레이드되어 40만 개 이상의 애플리케이션을 생성했습니다. 국제 버전인 MeDo는 이번 행사에서 전 세계적으로 출시되었으며 현재 medo.dev에서 개발자들이 이용할 수 있습니다. 바이두의 AI 워크스페이스인 Oreate는 글로벌 시장에서 120만 명의 사용자를 확보했습니다. 회사의 디지털 휴먼 기술은 브라질에서 데뷔했으며 미국과 동남아시아로의 확장을 모색하고 있으며, 중국의 “광군제” 쇼핑 페스티벌 기간 동안 라이브 스트리머의 83%가 이 기술을 사용하여 참여 라이브 스트림이 전년 대비 119% 증가했습니다.


자율주행의 이정표

바이두의 자율주행 호출 서비스인 아폴로 고(Apollo Go)는 10월 31일 기준 전 세계적으로 누적 1,700만 건 이상의 탑승 횟수를 돌파했으며, 22개 도시에서 주간 25만 건 이상의 완전 무인 운행을 진행하고 있습니다. 이 서비스는 자율주행 누적 거리 2억 4천만 킬로미터 이상을 기록했으며, 이 중 1억 4천만 킬로미터는 완전 무인 모드로 운행되었습니다. 최근 아폴로 고는 아부다비에서 최초의 상업용 무인 운행 허가 중 하나를 획득했으며, 2026년까지 아랍에미리트 내 차량 규모를 수백 대로 확장할 계획을 세우고 있습니다.

이러한 발표에도 불구하고, 바이두는 광고 수익이 9월 분기에 약 8% 감소할 것으로 예상되어 거의 10년 만에 가장 큰 하락세에 직면해 있습니다. 업계 관계자들에 따르면, 바이두는 AI 기반 애플리케이션과 오픈소스 모델 개발 부문에서 국내 경쟁사인 바이트댄스, 알리바바에 뒤처지고 있습니다.


댓글 0
전체 1,366 / 5 페이지
Executive Summary • Science 학술지 연구: AI 에이전트가 수천 개 소셜 계정을 조종해 허위정보 캠페인 전개 가능 • 2016년 러시아 트롤팜 수백 명 → 이제 1명이 AI로 수천 봇 통제 가능한 시대 • 22명 국제 전문가 경고: AI 군집이 2028 미국 대선에 실제 투입될 가능성 높아 • 대응책으로 'AI 영향력 관측소' 설립 제안했으나 정치적 의지 부족이 걸림돌 Background 2016년 러시아 인터넷연구소(IRA) 사태 이후 허위정보 캠페인은 딥페이크, 가짜 웹사이트 등으로 진화해왔다. AI 에이전트 기술이 급속히 발전하면서 이를 대규모 정보전에 활용할 수 있다는 우려가 과학계에서 본격 제기됐다. Impact & Implications 탐지 회피 능력 AI 군집의 가장 위협적인 특성은 기존 봇과 달리 인간 사용자와 구분이 거의 불가능하다는 점이다. 지속적 정체성과 기억력을 보유해 실제 SNS 사용자처럼 행동할 수 있다. 연구진은 "인간을 모방하는 교묘한 특성 때문에 탐지가 극히 어렵고 현존 여부조차 파악하기 힘들다"고 경고했다. 자가 개선 메커니즘 이 시스템은 게시물에 대한 반응을 피드백으로 삼아 스스로 개선할 수 있다. 연구진은 "충분한 신호가 있으면 수백만 건의 마이크로 A/B 테스트를 수행하고, 효과적인 변형을 기계 속도로 전파하며, 인간보다 훨씬 빠르게 반복 학습한다"고 설명했다. 정치적 무관심 소셜미디어 플랫폼은 참여도를 우선시하므로 AI 군집을 적발할 유인이 없다. 정부 역시 온라인 대화를 감시하는 '관측소' 개념에 우호적이지 않은 지정학적 환경이다. 전 바이든 행정부 허위정보 책임자 니나 얀코비츠는 "가장 무서운 건 AI가 초래하는 피해를 해결할 정치적 의지가 거의 없다는 것"이라고 지적했다. Key Data & Facts 항목수치/내용 연구 참여 전문가22명 (AI, 사이버보안, 심리학, 저널리즘, 정책 분야) 발표 학술지Science 예상 실전 투입 시기2028년 미국 대선 2026 중간선거 영향제한적 (아직 개발 단계) 제안된 대응책AI 영향력 관측소(Observatory) 설립 Key Quote "인공지능의 발전은 인구 전체 수준에서 신념과 행동을 조작할 가능성을 제시한다. 인간의 사회적 역학을 적응적으로 모방함으로써 민주주의를 위협한다." — Science 연구 보고서
273 조회
0 추천
02.01 등록
Executive Summary • 구글, 크롬 브라우저에 'Auto Browse' AI 에이전트 기능 출시 - Gemini 3 기반 자동 웹 브라우징 가능 • 티켓 예매, 쇼핑, 여행 계획 등 웹 작업 자동화 지원하나 정확도 문제 여전 • AI 에이전트가 지시를 '너무 문자 그대로' 해석하는 한계 드러나 - 콘서트 좌석 예매 시 연석 아닌 별도 열 선택 • 보안 취약점 우려: 악성 웹사이트의 프롬프트 인젝션 공격에 노출 가능성 Background 구글이 AI 프로 및 울트라 요금제 사용자를 대상으로 크롬 브라우저에 'Auto Browse' 기능을 출시했다. 이는 AI 에이전트가 사용자를 대신해 웹을 탐색하고 클릭하는 기능으로, 구글의 최신 Gemini 3 모델을 기반으로 한다. 이번 출시는 OpenAI, Anthropic 등 경쟁사들도 AI 에이전트 개발에 박차를 가하는 가운데 이루어져, 자동화된 웹 브라우징 시대의 본격적인 개막을 알린다. Impact & Implications 기술적 의미 Auto Browse는 다단계 웹 작업을 사람의 개입 없이 수행할 수 있다는 점에서 기존 AI 어시스턴트와 차별화된다. Gemini 3 모델이 먼저 작업 목표를 정의하고 전략을 수립한 뒤, 실제 클릭 동작을 수행하는 방식이다. 그러나 테스트 결과 '상식적 판단'이 필요한 상황에서는 여전히 한계를 보였다. 예를 들어 "통로 옆 두 좌석"을 예매해달라는 요청에 같은 열이 아닌 다른 열의 좌석을 선택하는 실수를 범했다. 사용자 영향 일반 사용자 입장에서 Auto Browse는 단순 반복 작업의 자동화라는 편의를 제공하지만, 결과물에 대한 검증 없이 신뢰하기에는 이르다. 쇼핑 테스트에서는 검색 결과 상위 3개를 그대로 장바구니에 담는 등 '큐레이션'이라기보다는 단순 자동화에 그쳤다. 구글은 결제나 SNS 게시 등 민감한 작업에는 사용자 승인을 요구하는 안전장치를 마련했다. 보안/정책 영향 보안 전문가들은 AI 에이전트가 악성 웹사이트의 프롬프트 인젝션 공격에 취약할 수 있다고 경고한다. 사용자가 AI에게 결제 정보를 맡기는 경우 금전적 피해로 이어질 수 있어, 신중한 사용이 권장된다. 크롬이 전 세계 브라우저 시장의 압도적 점유율을 차지하는 만큼, 이 기능의 확대 적용은 웹 생태계 전반에 영향을 미칠 전망이다. Key Data & Facts 항목수치/내용 서비스명Google Auto Browse 기반 모델Gemini 3 대상 사용자AI Pro/Ultra 요금제 가입자 (월 $20~) 출시 지역미국 우선 주요 기능티켓 예매, 쇼핑, 여행 계획 자동화 Key Quote "Auto Browse currently lacks the accuracy I need to rely fully on a tool like this as part of my daily life." "Auto Browse는 일상에서 전적으로 의존하기에는 아직 정확도가 부족하다." — Reece Rogers, WIRED 기자
269 조회
0 추천
2026.01.31 등록
Executive Summary • 메타 전 수석 AI 과학자 얀 르쿤이 샌프란시스코 스타트업 Logical Intelligence의 이사회에 합류 • 이 회사는 LLM과 다른 접근법인 '에너지 기반 추론 모델(EBM)'을 개발, 자기 수정 능력과 낮은 연산량이 특징 • 첫 모델 Kona 1.0은 단일 H100 GPU로 작동하며, 스도쿠 풀이에서 주요 LLM보다 빠른 성능 시연 • CEO는 LLM, EBM, 월드 모델의 결합이 AGI로 가는 길이라고 주장 Background 얀 르쿤은 오랫동안 대형언어모델(LLM)만으로는 인공일반지능(AGI)에 도달할 수 없다고 주장해왔다. 지난해 11월 메타를 떠난 이후 그는 실리콘밸리의 "LLM 집착"을 공개적으로 비판하며 대안적 AI 아키텍처 연구를 지지해왔다. 이번 Logical Intelligence 이사회 합류는 그의 이론을 실제 제품으로 구현하려는 첫 상업적 시도다. Impact & Implications 기술적 의미 에너지 기반 추론 모델(EBM)은 LLM과 근본적으로 다른 접근법을 취한다. LLM이 다음 단어를 확률적으로 예측하는 반면, EBM은 주어진 제약조건(예: 스도쿠 규칙) 내에서 작업을 수행한다. CEO Eve Bodnia는 이를 에베레스트 등반에 비유했다. "LLM 등반가는 한 방향만 보고 계속 전진하다 구멍을 만나면 떨어진다. EBM은 여러 방향을 보고 경로를 수정할 수 있다." 이 자기 수정 능력이 할루시네이션 문제를 해결할 수 있다고 회사 측은 주장한다. 산업/시장 영향 Kona 1.0 모델은 2억 개 미만의 파라미터로 구성되어 단일 Nvidia H100 GPU에서 작동한다. 이는 수천 개의 GPU가 필요한 대형 LLM과 대조적이다. 회사는 에너지 그리드 최적화, 반도체 제조, 신약 개발 등 오류 허용도가 없는 분야를 목표로 하고 있다. 주요 칩 제조업체 및 데이터센터 기업들과 이미 협의 중이라고 밝혔다. 향후 전망 Logical Intelligence는 르쿤이 설립한 파리 기반 스타트업 AMI Labs와 협력할 예정이다. AMI Labs는 물리적 환경을 인식하고 행동 결과를 예측하는 '월드 모델'을 개발 중이다. Bodnia는 AGI가 단일 모델이 아닌 여러 AI 모델의 생태계가 될 것이라고 전망했다. "LLM은 인간과 자연어로 소통하고, EBM은 추론을 담당하며, 월드 모델은 로봇이 3D 공간에서 행동하도록 돕는다." Key Data & Facts 항목수치/내용 모델명Kona 1.0 파라미터 수2억 개 미만 필요 하드웨어단일 Nvidia H100 GPU 주요 협력자얀 르쿤 (이사회), AMI Labs 타겟 분야에너지 그리드, 반도체 제조, 신약 개발 오픈소스 여부비공개 (향후 검토 예정) Key Quote "LLM은 하나의 거대한 추측 게임이다. 신경망에 인터넷의 온갖 쓰레기를 먹이고 사람들이 어떻게 소통하는지 가르치려 한다. 하지만 언어는 지능의 발현일 뿐, 지능 자체가 아니다. 왜 언어와 무관한, 추측 게임이 아닌 AI에 집중하지 않는가?" — Eve Bodnia, Logical Intelligence CEO
278 조회
0 추천
2026.01.30 등록
Executive Summary • 구글이 크롬 브라우저에 'Auto Browse' 기능을 새롭게 도입했다. Gemini 3 모델 기반의 AI 에이전트로, 항공권 예약이나 아파트 검색 같은 온라인 작업을 사용자 대신 수행한다. • 현재 미국 내 AI Pro 및 AI Ultra 유료 구독자에게만 제공되며, 일반 사용자 및 타 국가로의 확대 일정은 미정이다. • AI 에이전트가 브라우저를 제어해 작업을 수행하지만, 구글은 에이전트의 행동에 대한 책임은 사용자에게 있다고 명시했다. Background 구글은 지난해 'Gemini in Chrome' 기능을 출시하며 웹페이지 내용을 요약하고 여러 탭의 정보를 종합하는 AI 기능을 선보인 바 있다. 이번 Auto Browse는 그 연장선에서 웹 브라우징의 자동화를 한 단계 더 진화시킨 것으로, OpenAI의 Atlas 브라우저 등 AI 기반 웹 서비스들과의 경쟁이 본격화되는 양상이다. Impact & Implications 기술적 의미 Auto Browse는 사용자의 명령을 받아 독립적으로 웹사이트를 탐색하고 클릭하며 작업을 완료하는 '에이전틱 AI'의 본격적인 상용화 사례다. 기존의 질의응답 수준을 넘어, AI가 실제로 사용자의 행동을 대리하는 단계로 진입했다는 점에서 기술적 이정표가 된다. 다만 악성 웹사이트의 프롬프트 인젝션 공격에 취약할 수 있어 보안 우려도 제기된다. 사용자 영향 구글은 소셜미디어 포스팅이나 결제 같은 민감한 작업에는 여전히 사용자 확인을 요구한다. 하지만 에이전트의 모든 행동에 대한 책임은 사용자에게 있다는 면책 조항이 명시되어 있어, 자동화의 편의성과 개인 책임 사이의 긴장이 존재한다. AI가 온라인에서 무엇을 하든 그 결과는 사용자가 감당해야 한다. 경쟁 구도 변화 실리콘밸리 전반에서 AI 기반 웹 브라우징이 대세로 자리 잡고 있다. OpenAI의 Atlas부터 기존 브라우저에 AI를 접목한 구글 크롬까지, 대부분의 브라우저가 AI 기능을 탑재하고 있다. AI를 원치 않는 사용자를 위한 선택지(예: Vivaldi 브라우저)는 점점 줄어드는 추세다. Key Data & Facts 항목수치/내용 기반 모델Gemini 3 출시 지역미국 한정 이용 대상AI Pro, AI Ultra 구독자 출시일2026년 1월 28일 Key Quote "Use Gemini carefully and take control if needed. You are responsible for Gemini's actions during tasks." — 구글 Auto Browse 데모 화면 안내문
293 조회
0 추천
2026.01.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입