AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
1,368 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 1,224 / 252 페이지
(퍼플렉시티가 정리한 기사)인공지능 연구자들은 ChatGPT가 고대 그리스의 2,400년 된 수학 퍼즐에 도전했을 때, 인간과 매우 유사한 학습 행동을 보였음을 발견했습니다. ChatGPT는 창의적으로 해결책을 제시하고, 학생들이 익숙하지 않은 문제를 접근할 때 보이는 오류를 그대로 드러냈습니다.이 실험은 케임브리지 대학교의 나다브 마르코 박사와 안드레아스 스타일리아니데스 교수가 진행했으며, 기원전 385년경 플라톤의 유명한 “정사각형의 두 배 만들기” 문제를 되살렸습니다. 이는 수학 교육에서 가장 오래된 실험 중 하나로 여겨집니다. 원래의 대화에서는 소크라테스가 수학을 모르는 소년을 이끌어, 정사각형의 넓이를 두 배로 만드는 방법이 단순히 한 변의 길이를 두 배로 늘리는 것이 아니라, 원래 정사각형의 대각선과 같은 길이의 새로운 변을 만들어야 한다는 사실을 발견하게 합니다.AI가 예상치 못한 길을 선택하다연구자들이 이 고전적인 기하학 문제를 ChatGPT-4에 제시했을 때, 그들은 챗봇이 방대한 훈련 데이터에서 잘 알려진 소크라테스식 해법을 그대로 반복할 것이라고 예상했습니다. 그러나 ChatGPT는 그들을 놀라게 하며 대수적인 방식으로 접근했는데, 이는 플라톤 시대에는 알려지지 않았던 방법이었습니다. AI는 연구자들이 실망을 표했음에도 완강하게 대수적인 방법을 고수하다가, “우아하고 정확한” 답을 원한다고 말했을 때에만 기하학적인 해법으로 바꿨습니다.Marco는 ChatGPT의 행동을 “학습자 같은” 것으로 특징지으면서, 이 AI가 단순히 암기된 정보를 반환하기보다는 “자체적으로 가설과 해법을 만들어내는 것처럼 보였다”고 언급했습니다. 플라톤의 작업에 대해 직접 묻자, ChatGPT는 고전적인 해법에 대해 완벽히 알고 있음을 보여주었으며, 이는 정보를 몰라서가 아니라 스스로 접근 방식을 적극적으로 선택한 것으로 보였습니다.즉흥성과 실수연구자들은 ChatGPT의 추론 능력을 더욱 시험하기 위해 변형된 질문을 도입했습니다. 직사각형의 비율을 유지하면서 면적을 두 배로 늘리라는 질문에 대해, AI는 대각선을 사용할 수 없기 때문에 기하학적으로는 해법이 존재하지 않는다고 잘못 주장했습니다. 하지만 대체 기하학적 방법들이 실제로 존재합니다. 마르코는 이러한 잘못된 주장이 ChatGPT의 지식 기반에서 나올 확률이 “거의 없을 것”이라며, AI가 이전 대화를 바탕으로 즉흥적으로 답변한 것임을 시사했습니다.이러한 행동을 바탕으로 연구자들은 은유적으로 “챗의 근접 발달 영역”을 제안했습니다. 이는 학습자가 독립적으로 알고 있는 것과 지도를 받을 때 달성할 수 있는 것 사이의 격차를 나타내는 교육 개념과 비슷합니다. 이 연구는 International Journal of Mathematical Education in Science and Technology에 게재되었으며, 이 발견이 수학 교육에서 학생들이 AI와 상호작용하는 방식을 변화시킬 수 있다고 제안합니다.“이런 능력들이야말로 학생들이 반드시 익혀야 하는 핵심 기술입니다. 하지만 ‘이 문제를 함께 탐구해 보자’와 같은 프롬프트를 사용해야 하지, ‘정답을 알려줘’라고만 해서는 안 됩니다,“라고 마르코는 설명했습니다.
1389 조회
0 추천
2025.09.18 등록
(퍼플렉시티가 정리한 기사)구글 클라우드가 AI 에이전트가 사용자를 대신해 안전하게 결제를 처리할 수 있는 새로운 개방형 표준 ’에이전트 결제 프로토콜(AP2)’을 17일(현지시간) 공개했다. AP2는 기존 결제 시스템이 사람의 직접 승인을 전제로 설계된 한계를 넘어 AI 에이전트 기반 상거래의 신뢰와 보안을 강화하는 프레임워크를 제공한다.60개 이상 글로벌 기업과 협력한 새로운 결제 표준AP2는 구글 클라우드가 주요 결제 및 기술 기업과 공동 개발한 것으로, 기존 에이전트-투-에이전트(A2A) 및 모델 컨텍스트 프로토콜(MCP)의 확장판이다. 마스터카드, 아메리칸 익스프레스, 페이팔, 코인베이스, 세일즈포스 등 60개 이상의 글로벌 기업이 개발과 도입에 참여했다.아시아 지역에서는 한국사이버결제(NHN KCP), 에어월렉스(Airwallex), 피우(Fiuu), 라자다(Lazada), 쇼피(Shopee), 잘로라(ZALORA) 등이 참여해 글로벌 확산 기반을 마련했다.암호화된 디지털 위임장으로 신뢰성 확보AP2의 핵심은 위·변조가 불가하고 암호화 방식으로 서명된 디지털 계약인 ‘위임장(Mandate)’ 시스템이다. 이는 사용자의 구매 권한 부여와 진짜 의도 보장, 문제 발생 시 책임 규명이라는 AI 에이전트 결제의 핵심 과제를 해결한다.위임장은 두 가지 방식으로 작동한다. 실시간 구매 시에는 사용자가 “흰색 러닝화 찾아줘”라고 요청하면 ‘구매 의사 위임장’이 생성되고, 에이전트가 찾은 상품을 사용자가 승인하면 ‘장바구니 위임장’이 서명돼 변경 불가능한 거래 기록이 완성된다. 사용자 부재 시에는 가격 한도와 구매 조건을 담은 상세한 위임장을 사전에 설정해 에이전트가 조건 충족 시 자동으로 결제를 진행할 수 있다.신용카드부터 암호화폐까지 다양한 결제 지원AP2는 신용카드, 체크카드, 실시간 계좌이체 등 기존 결제 방식은 물론 스테이블코인과 같은 암호화폐까지 지원하는 결제 방식 중립적 프레임워크를 제공한다. 특히 구글은 코인베이스, 이더리움 재단, 메타마스크 등과 협력해 에이전트 기반 암호화폐 결제를 위한 A2A x402 확장 기능을 출시했다.구글 클라우드 비즈니스 애플리케이션 플랫폼 담당 라오 수라파네니 부사장은 “AP2는 에이전트와 판매업체 간 안전한 준법 거래를 위한 공통 언어를 제공해 생태계 분열을 방지한다”며 “사용자와 판매자에게 일관되고 안전하며 확장 가능한 경험을 보장한다”고 설명했다.AP2는 항공권과 호텔 예약을 동시에 처리하거나, 품절 상품의 재입고 시 자동 구매 등 완전히 새로운 커머스 경험을 가능하게 한다고 구글은 설명했다. 이 프로토콜의 전체 기술 명세는 깃허브를 통해 공개돼 개발자와 기업들이 활용할 수 있다.
1435 조회
0 추천
2025.09.18 등록
손목밴드에서 조정을 하는 것 같고 전작과 많이 달라졌습니다.AI 기능으로 번역도 가능하네요..https://www.meta.com/kr/ai-glasses/meta-ray-ban-display/
1428 조회
0 추천
2025.09.18 등록
조금 전 메타가 AI 기능이 있는 안경을 비롯하여 중요한 키노트를 진행하였습니다.CNET이 준비한 키노트 요약입니다.RAYBAN 과 새로 제작한 안경이 큰 화제입니다.
1525 조회
0 추천
2025.09.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입