Loading...

AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
1,576 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 1,262 / 296 페이지
Yomiuri Sues U.S. AI Startup over Use of Articles; Perplexity Allegedly Used Over 100,000 News Stories요미우리 신문 3개 자회사가 미국 AI 스타트업인 Perplexity를 상대로 기사와 이미지를 무단으로 이용했다며 소송을 제기했다미우리 측은 퍼플렉시티가 약 12만 건의 디지털 기사와 이미지를 무단으로 복제해 검색엔진 답변에 사용했다고 주장했다.신문사 측은 약 21억7000만 엔의 손해배상을 요구했으며, 기사와 이미지 무단 복제가 저작권법상 복제권 및 공중송신권을 침해했다고 주장했다. 신문사에 따르면, 퍼플렉시티는 기존 검색엔진과 달리 직접 답변을 제공해 언론사 사이트 유입 감소로 광고 수입이 줄었다고 했다.요미우리 측은 언론의 노력과 투자가 AI 기업에 무단으로 이용되고, 공정한 보도를 해치는 결과가 된다고 했다. 이에 대해 퍼플렉시티는 일본 내 오해에 유감을 표하며 사실관계 확인에 노력 중이고, 언론사와의 협력 의향을 밝혔다.요미우리는 이번 소송이 일본 언론사로서는 최초 사례라고 했다. 미국에서도 유사한 소송이 진행 중이라고 밝혔다.
2268 조회
0 추천
2025.08.12 등록
애플이 새로운 시리(Siri) 업그레이드를 준비하고 있으며, 이는 서드파티 앱(Uber, YouTube, Facebook, WhatsApp 등)과 자체 앱(메일, 메시지 등)에서 깊이 있는 통합과 제어가 가능할 것으로 알려졌다..사용자는 음성만으로 사진 검색 및 편집, 인스타그램 댓글 작성, 쇼핑 앱 탐색 및 장바구니 추가 등 앱 내 세부 기능을 조작할 수 있게 된다. 이번 개선의 핵심은 'App Intents' 시스템과 애플의 생성형 AI 'Apple Intelligence'에 있다사실 새로운 시리의 출시는 여러 차례 연기되어 왓다. . 잦은 지연의 원인은 구형 시리 시스템과 신형 LLM(대규모 언어 모델) 아키텍처가 결합된 하이브리드 구조의 버그, 약 1/3 확률의 실패율 등 기술적 문제가 컸던 것으로 알려졌다.
2276 조회
1 추천
2025.08.11 등록
GPT-5 가 나왔어요.영상으로 모든 걸 보여줍니다.자막이 있으니 편하게 보세요.
2080 조회
1 추천
2025.08.08 등록
AI 전문가 Daniel Lozovsky의 분석에 따르면, 2025년 7월 27일부터 8월 1일까지의 단 5일간이 AI 역사상 가장 극적인 변화를 가져온 기간이었습니다. 빌 게이츠조차 이 급격한 변화의 속도에 놀랐다고 할 정도였습니다.이 기간 동안 구글은 Gemini 2.5 Deep Think라는 월 250달러짜리 프리미엄 AI 모델을 출시했는데, 너무 강력해서 하루에 단 5회만 사용할 수 있도록 제한했습니다. 이 AI는 화학, 생물학, 방사능, 핵 관련 위험한 정보까지 생성할 수 있어서 구글이 안전상의 이유로 직접 사용을 제한한 것입니다.반면 중국의 Zhipu AI는 GLM 4.5라는 모델을 완전 무료로 공개했는데, 이 AI는 정말 놀라운 성능을 보여줬습니다. "새는 진짜가 아니다"라는 음모론에 대한 프레젠테이션을 완벽하게 만들어내거나, 뱀파이어 서바이버라는 게임을 자바스크립트로 완전히 구현해내는 등 유료 모델 못지않은 능력을 발휘했습니다.창작 도구 분야에서도 혁신이 쏟아졌습니다. Runway의 ALF라는 도구는 음성 명령만으로 비디오를 편집할 수 있게 해주고, 구글의 Veo는 이미지에 직접 텍스트를 써넣으면 그대로 비디오를 생성해주는 마법 같은 기능을 선보였습니다. Ideogram의 새로운 기능은 단 한 장의 사진만 있으면 어떤 이미지에든 얼굴을 바꿔넣을 수 있게 해줍니다.경제적으로도 엄청난 변화가 있었습니다. 빅테크 기업들이 올해만 AI에 1,550억 달러를 투자했고, 메타는 AI 투자 발표 후 주식이 11%나 급등했습니다.
2281 조회
0 추천
2025.08.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입