AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
1,067 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 1,055 / 196 페이지
(퍼플렉시티가 정리한 기사)구글은 인공지능 및 암호화폐 이니셔티브를 대폭 확대하고, 일련의 신제품 출시 및 전략적 파트너십을 통해 AI 기반 상거래 및 인프라 분야에서 회사 역사상 가장 야심찬 진출을 진행하고 있습니다.이 IT 대기업은 수요일, AI 시스템이 웹 애플리케이션을 보다 효과적으로 디버깅할 수 있도록 설계된 Chrome DevTools Model Context Protocol 서버의 공개 프리뷰를 출시했습니다. 이는 화요일에 발표된 구글의 Data Commons MCP 서버 출시 이후 이어진 것으로, 해당 서버는 AI 개발자들이 자연어를 사용해 방대한 공개 데이터셋을 질의할 수 있게 해줍니다.이러한 서버 출시들은 이번 달 초에 공개된 구글의 획기적인 Agent Payments Protocol(AP2)와도 맞물리는데, 이 프로토콜은 Mastercard, American Express, PayPal, Coinbase 등 60개 이상의 금융 및 기술 파트너 사의 지원을 받고 있습니다.구글, 암호화폐 채굴 지분 확보동시에 구글은 AI 목표를 지원하기 위해 암호화폐 채굴 인프라에도 상당한 투자를 하고 있습니다. 목요일에 사이퍼 마이닝은 구글이 비트코인 채굴 회사의 5.4% 지분을 취득할 수 있는 워런트와 교환하여 AI 스타트업 플루이드스택의 임대 채무 14억 달러를 보증하기로 합의했다고 발표했습니다.10년 계약에 따라 사이퍼는 콜로라도 데이터 센터를 AI 서비스용으로 전환하게 되며, 잠재적 연장 옵션을 포함해 최대 70억 달러 가치까지 약 30억 달러의 수익을 창출할 예정입니다. “이번 거래가 고성능 컴퓨팅(HPC) 분야에서 일련의 첫 사례가 될 것으로 믿습니다.“라고 사이퍼 마이닝의 CEO 타일러 페이지는 밝혔습니다.이는 최근 몇 달 사이 구글의 두 번째 주요 암호화폐 채굴 파트너십입니다. 8월에 구글은 플루이드스택과 유사한 37억 달러 규모의 협약을 통해 테라울프의 8% 지분을 확보한 바 있습니다.혁신적인 결제 인프라Agent Payments Protocol은 AI 기반 상거래를 표준화하려는 구글의 가장 중요한 시도로 평가받고 있습니다. AP2는 AI 에이전트가 암호학적으로 서명된 ‘Mandate’(위임장)를 통해 자율적으로 거래를 완료할 수 있게 하며, 이는 사용자 지시의 변조 불가능한 기록을 생성합니다.“AI 기반 상거래의 부상과 함께 신뢰와 책임감이 그 어느 때보다 중요해졌습니다,“라고 American Express Digital Labs의 수석 부사장인 Luke Gebb는 말했습니다. 이 프로토콜은 기존 카드, 스테이블코인, 실시간 은행 이체 등 다양한 결제 방법을 지원하며, 이에 따라 구글은 애널리스트들이 ‘에이전트 상거래’라고 부르는 분야의 선두에 서게 되었습니다.2025년 구글 주가는 30% 급등했으며, 회사는 AI 인프라에 750억 달러를 투자하겠다고 밝혔습니다. 구글의 포괄적인 AI 전략은 기본 인프라에서부터 새로운 Data Commons 서버, 그리고 소비자 대상 애플리케이션에 이르기까지 전방위적으로 확장되며, 인공지능, 결제, 그리고 암호화폐 채굴이라는 빠르게 진화하는 교차점에서 구글을 지배적인 힘으로 자리잡게 하고 있습니다.
976 조회
0 추천
2025.09.26 등록
Perplexity가 " 이메일 어시스턴트"를 퍼플렉시티 Max 유료 구독자에게 제공한다.지메일과 아웃룩용 AI 에이전트에 연동하는 것으로 사용자의 목소리와 맞춰 답장 초안을 만들어준다. 또한 이메일에 자동으로 라벨을 붙여 받은 편지함을 정리해주고, cc를 추가하면 미팅 시간을 제안해준다고.이 서비스는 구글 및 마이크로소프트 계정과의 연동으로 작동한다. 퍼플렉시티는 사용자 데이터를 모델 훈련에 사용하지 않는다고 하며, 비슷한 기능으로 구글 제미나이나 MS 코파일럿에서 이미 제공한 바 있다.하지만 요즘 주목을 받는 '에이전트' 기능으로 이메일 스레드 내에서 일정 조율의 전 과정을 처리한다는 점이 특징이라고.자세한 내용은 아래 페이지에서 확인할 수 있다.https://www.perplexity.ai/assistant
963 조회
0 추천
2025.09.26 등록
페이스북 데이팅 기능이 스와이핑으로 파트너를 찾는 피로함을 해결하기 위해 AI 를 도입한다고 밝혔다.페이스북은 "데이트 어시스턴트"와 "밋 큐트(Meet Cute)"라는 두 가지 새로운 기능을 자사의데이팅 서비스에 도입해, 반복적인 스와이프 방식에 지친 사용자들을 돕고자 한다고 발표했다데이트 어시스턴트는 사용자의 취향과 관심사를 바탕으로 맞춤형 추천을 제공하는 채팅 기반 도우미로,전통적인 키, 교육 수준 등의 기준뿐 아니라 '브루클린에 사는 IT 업계 여성 찾아줘'처럼 구체적인 요청도 가능하다이 어시스턴트는 매칭 탭에서 이용할 수 있으며, 미국과 캐나다에서 순차적으로 도입될 예정이다밋 큐트는 사용자의 선호도에 따라 매주 자동으로 새로운 상대와 매칭해주는 기능으로, 매칭된 상대와 대화를 나누거나 필요시 매칭을 해제할 수 있다페이스북은 이러한 기능들이 반복적인 스와이프로 인해 피로감을 느끼던 사용자들에게 새로운 만남의 기회를 제공하고, 쉽고 재미있는 만남을 이어갈 수 있도록 서비스를 계속 개선해 나가겠다고 밝혔다.
1007 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)구글 딥마인드 는 화요일에 자사의 가장 진보된 AI 로봇 모델을 공개했으며, 이러한 시스템은 복잡한 작업을 실행하기 전에 “생각”을 할 수 있고 문제 해결을 위해 실시간 정보 검색까지 할 수 있습니다.새로운 두 모델인 Gemini Robotics 1.5와 Gemini Robotics-ER 1.5는, 구글 딥마인드 로보틱스 책임자인 Carolina Parada에 따르면, 광범위한 재프로그래밍 없이 새로운 환경에 적응할 수 있는 다재다능한 로봇을 만드는 데 있어 상당한 진전을 보여줍니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.행동하기 전에 생각하는 로봇들이번 혁신은 Gemini Robotics-ER 1.5에 초점을 맞추고 있으며, DeepMind는 이를 현대의 텍스트 기반 챗봇과 유사한 시뮬레이션 추론이 가능한 최초의 로봇 AI라고 설명합니다. “ER”은 “구체적 추론(embodied reasoning)“을 의미하며, 이를 통해 로봇이 물리적 행동을 실행하기 전에 여러 단계를 미리 계획할 수 있습니다.시연 동안 연구원들은 로봇에게 “현지 규정에 따라” 쓰레기를 분류하라는 요청을 하고, 로봇이 재활용품을 성공적으로 분류하는 모습을 보여주었습니다. 로봇은 연구원이 샌프란시스코에 있다는 사실을 파악하고, 온라인에서 현지 재활용 규정을 검색한 후, 올바르게 물품을 분류했습니다. 또 다른 실험에서는 런던 여행을 위해 짐을 싸라는 요청을 받은 후, 로봇이 날씨 예보를 검색하고 비니와 같은 적절한 아이템을 챙기기도 했습니다.“현대 로봇은 매우 특수화되어 있으며 구현이 어려워, 단일 용도의 로봇 한 대를 도입하는 데 수개월이 걸리는 경우가 많다”고 파라다는 밝혔습니다. 새로운 생성형 AI 접근법은 로봇이 재프로그래밍 없이 완전히 새로운 상황을 처리할 수 있게 합니다.
974 조회
0 추천
2025.09.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입