Loading...

AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
733 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 684 / 101 페이지
(퍼플렉시티가 정리한 기사)메타는 빠르게 진화하는 로봇 산업에서 다음 주요 경쟁자로 자신을 포지셔닝하며, 다른 기업들이 자사의 휴머노이드 로봇에 적용할 수 있도록 포괄적인 소프트웨어 플랫폼을 개발할 계획을 발표했습니다. 최근 인터뷰에서 최고기술책임자(CTO) 앤드류 보스워스가 밝힌 이 전략은 구글의 스마트폰용 안드로이드 모델의 성공을 본뜬 것이며, 증강현실(AR)에 이은 메타의 최신 수십억 달러 규모의 도전입니다.“하드웨어가 힘든 부분이라고 생각하지 않습니다.“라고 보스워스는 이번 주 더 버지(The Verge)와의 인터뷰에서 밝혔습니다. 그는 이 프로젝트를 “AR 규모의 베팅”이라고 부르며 수십억 달러의 투자가 필요하다고 시사했습니다. “하드웨어 역시 어렵지 않다는 의미는 아니지만, 병목은 아닙니다. 진짜 병목은 소프트웨어입니다.”메타의 안드로이드식 접근 방식이 구체화된다회사의 로보틱스 부문은 Reality Labs 하드웨어 유닛 내에 설립되었으며, 전 Cruise CEO인 Marc Whitten이 이끌고 있습니다. 이 부문은 자체 휴머노이드 프로토타입인 “Metabot”과 다른 제조업체들이 도입할 수 있는 근본적인 소프트웨어 플랫폼을 개발하고 있습니다. 경쟁사인 테슬라와 애플와 달리, 메타의 주된 초점은 로봇을 직접 개발·판매하는 것이 아니라, 이를 구동하는 인텔리전스를 만드는 데에 있습니다.“우리가 하드웨어 제조사가 되는 것엔 관심이 없습니다,”라고 Bosworth는 설명하며, 미래에는 어떤 로봇 기업이든 “로봇이 이 사양을 만족하기만 하면” 메타의 소프트웨어를 사용할 수 있게 될 것이라고 내다봤습니다. 이런 플랫폼 우선 전략은, 전 Scale CEO 알렉산드르 왕(Alexandr Wang)이 이끄는 신설 Superintelligence Labs를 통해 인공지능 분야에서 메타가 이루고 있는 혁신에 기반하고 있습니다.Bosworth가 ‘월드 모델’이라 부르는 이 접근법은, 섬세한 조작 등 복잡한 물리작용을 시뮬레이션할 수 있는 AI 시스템 개발에 주안점을 두고 있습니다. 그가 자신의 인터뷰에서 물컵을 들어올리며 설명했듯, 로봇은 평지에서 달리거나 백플립을 할 수 있지만, 섬세한 물체를 잡으려 하면 “컵을 으깨버리거나 곧바로 물을 다 쏟아버리죠”라고 도전 과제를 예시로 들었습니다.경쟁 환경이 더욱 치열해지고 있다메타는 테슬라가 정기적으로 옵티머스(Optimus) 로봇을 선보이고 있는 혼잡한 분야에 진입하고 있다. 다만, 테슬라의 시연은 대부분 매우 통제된 환경에서 이뤄졌다. 애플 역시 2027년 출시를 목표로 탁상용 로봇 기기와 인간형(휴머노이드) 컨셉을 모두 개발 중인 것으로 알려졌다. 구글 또한 딥마인드를 통해 로보틱스 분야에서 투자를 강화하면서 최근 로봇 응용을 위해 특별히 설계된 새로운 AI 모델을 소개했다.메타가 최근 서커스(SE)와의 협력을 통해 독일에서 첫 자율 로봇을 배치한 시점도 전략적으로 보인다. 이 협력으로 CA-1 AI 로봇이 9월 메타 뮌헨 오피스에 납품되었다. 이와 같은 실제 적용 사례는 처음에는 청소, 세탁물 정리 등 가사 업무에 집중된 메타의 광범위한 로보틱스 계획에 중요한 데이터를 제공한다.업계 분석가들은 소프트웨어 라이선스 모델이 하드웨어 비용과 제조 공정의 난관을 자주 겪는 로봇 시장에서 메타의 성공을 이끄는 결정적 요인이 될 수 있다고 분석한다. 어떤 로봇 하드웨어 제조사가 성공하더라도 그 혜택을 볼 수 있게 입지를 다져둔 셈이며, 이는 소비자 채택이 제한된 상황에서 수십억 달러를 하드웨어에 쏟아부은 고가의 가상현실 투자 경험에서 메타가 얻은 교훈을 적용한 것으로 보인다.회사는 2025년까지 AI 인프라에 600~650억 달러를 투입하는 대규모 투자 계획의 하나로, 로보틱스 프로젝트를 위해 약 100명 규모의 엔지니어 채용을 허가했다. 이는 AI 지능을 물리적 세계에 실현하겠다는 장기 비전에 대한 메타의 진지한 의지를 보여준다.
655 조회
0 추천
2025.09.28 등록
(퍼플렉시티가 정리한 기사)유튜브가 오늘 새로운 실험 플랫폼인 유튜브 랩스를 출시하며, 동영상 스트리밍 대기업에서 앞으로 진행될 인공지능 실험 시리즈의 첫 기능으로 AI 음악 호스트를 선보였습니다. 이번 프로그램은 유튜브가 스포티파이의 인기 있는 AI DJ 기능과 직접 경쟁하려는 최신 노력의 일환이며, 첨단 AI 도구를 테스트할 수 있는 장을 마련하는 것이기도 합니다.첫 번째 실험인 “Beyond the Beat”는 AI 호스트가 라디오 믹스와 플레이리스트를 진행하는 동안 노래에 관한 해설, 팬 트리비아, 그리고 콘텍스트 있는 이야기를 제공할 수 있게 해줍니다. 이 기능은 좋아요/싫어요 버튼과 댓글 버튼 사이에 반짝이 아이콘으로 표시되어, 사용자가 AI가 생성한 해설을 듣고 싶을 때 직접 제어할 수 있도록 합니다.AI DJ 분야에서 경쟁하기유튜브의 이번 조치는 스포티파이가 AI DJ 기능을 도입한 지 2년이 넘은 뒤에 이루어진 것으로, 회사에 따르면 이 기능의 참여도는 지난 1년 동안 거의 두 배로 증가했다. 이번 시점은 스트리밍 플랫폼들이 AI 기반 개인화 기능을 통해 경쟁이 치열해지는 가운데 전략적 선택으로 보인다.“이 AI 진행자들은 라디오와 믹스를 청취하는 동안 관련 이야기와 인사이트를 들려줄 것입니다,“라고 유튜브는 오늘 블로그 게시글에서 발표했다. 사용자는 코멘터리를 1시간 또는 하루 동안 잠시 꺼둘 수 있어, 음악 감상 중 원치 않는 방해에 대한 잠재적 우려를 해소한다.플랫폼은 “AI 코멘터리는 실수를 포함할 수 있다”고 경고하며, 기술의 실험적 성격을 인정하는 동시에 사용자 피드백이 미래 개발 방향에 도움이 될 것이라고 강조했다.제한된 접근과 프리미엄 중심YouTube Labs는 현재 “미국 내 참가자 중 제한된 수”만을 수용하고 있으며, 프리미엄 가입자가 실험적 기능을 널리 출시하기 전에 우선적으로 테스트할 수 있는 권한을 받습니다. 이 프로그램은 Google Labs와 별도로 운영되며, Google의 광범위한 AI 이니셔티브가 아닌 YouTube 플랫폼에만 초점을 맞추고 있습니다.이 독점적 접근 모델은 YouTube가 최근 프리미엄 구독을 새로운 기능의 테스트 장으로 활용하는 전략을 따릅니다. 올해 초, 회사는 음악 트랙용 고음질 오디오, 최대 4배까지 빠른 재생 속도, 스마트 TV 및 게임 콘솔용 Jump Ahead 기능 등 여러 가지 프리미엄 전용 기능을 출시했습니다.레딧 이용자 보고에 따르면, 초기 테스터들은 이미 AI 호스트를 경험하고 있으며, 한 참가자는 해당 기능이 트랙에 대한 “통찰력 있는 요약”을 제공하지만 가끔 “말 대신 이상한 잡음”을 발생시키기도 한다고 언급했습니다. 이 해설은 각 트랙이 아닌 약 다섯 곡마다 나타나며, 정보 제공과 끊김 없는 청취 사이에서 균형을 이루고 있습니다.
627 조회
0 추천
2025.09.28 등록
(퍼플렉시티가 정리한 기사)여덟 개의 주요 오픈소스 재단이 이번 주에 “무료” 소프트웨어 인프라의 시대가 끝나가고 있다고 선언했으며, 인공지능 주도의 수요가 중요 패키지 레지스트리를 지속 불가능한 한계로 밀어붙이고 있다고 경고했다.오픈소스 시큐리티 재단이 주도하고 파이썬 소프트웨어 재단, 러스트 재단, 이클립스 재단 등이 참여한 이 연합은 화요일에 오픈소스 인프라의 자금 조달 및 소비 방식에 근본적인 변화가 필요하다는 공동 성명을 발표했다. 이들이 감독하는 레지스트리에는 파이썬을 위한 PyPI, 자바를 위한 Maven Central, 자바스크립트를 위한 npm 등이 포함되어 있으며, 이들은 매달 수십억 건의 다운로드를 제공하지만, 대부분 기부와 자원봉사자들의 선의에 의존해 운영되고 있다.AI 사용이 ‘불필요한’ 수요를 창출하다재단들은 생성형 AI와 자율 코딩 에이전트로 인한 “기계 주도적이고 종종 낭비적인 자동화 사용 폭발”을 시스템에 대한 주요 부담으로 지적했다. 지속적인 통합 파이프라인, 대규모 종속성 스캐너, 그리고 AI 도구들이 패키지 레지스트리로 캐싱이나 제한 메커니즘 없이 자동화된 요청을 폭발적으로 보내고 있다.“상업 규모의 사용에 비해 상업 규모의 지원이 없다면 지속 가능성이 없습니다,“라고 연합은 밝혔다. 현재의 자금 조달 모델은 소수의 후원자들에게 의존하고 있으며, 대부분의 대규모 상업적 사용자들은 지속 가능성에 기여하지 않으면서 서비스를 소비하고 있다고 지적했다.최근 업계 데이터에 따르면, npm은 2024년에만 4.5조 패키지 다운로드를 제공할 것으로 예상되며, Python의 PyPI 레지스트리는 전년 대비 87% 성장했다. 재단들은 수요는 지수적으로 증가하는 반면, 자금 지원은 선형적으로만 증가한다고 경고했다.유료 접근 모델로의 전환재단들은 개인 개발자에게는 무료 접근을 유지하면서 상업적 단체에는 사용량에 비례한 기여를 요구하는 단계별 접근 시스템을 도입할 가능성을 시사했습니다. 제안된 해결책에는 상업적 파트너십, 성능 기반 접근 계층, 사용 분석과 같은 부가 가치 서비스가 포함됩니다.Eclipse 재단의 전무이사인 Mike Milinkovich는 그의 조직이 재정 증가는 없이 다운로드 수가 네 배가 늘었다고 IT Brew에 밝혔습니다. 그는 “수요와 수익을 연계하는 비즈니스 모델이 없다”고 말하며 현 모델을 “고장났다”고 표현했습니다.이 시점은 8월에 Python Software Foundation이 재정 요청이 40% 증가해 연 예산이 바닥나면서 사상 처음으로 지원금 프로그램을 중단한 결정과도 맞물립니다. 이 움직임은 전 세계 파이썬 콘퍼런스와 재단 지원에 의존하는 커뮤니티 이니셔티브에 영향을 미칩니다.이 공동 성명은 주요 오픈소스 인프라 제공자들이 지속 가능성을 위해 유료 접근 모델을 도입할 수 있다는 가장 명확한 경고를 나타냅니다. “아직 위기는 아니지만, 이는 중대한 전환점입니다”라고 재단들은 밝혔습니다.
666 조회
0 추천
2025.09.27 등록
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 올트먼은 이번 주 초지능형 AI가 2030년까지 도래할 것이라는 대담한 예측을 다시 강조하면서, 저명한 물리학자 데이비드 도이치와 함께 인공지능 일반(AI) 테스트에 대한 획기적인 새로운 방안을 제안했습니다. 올트먼은 수요일 베를린의 악셀 슈프링어 어워드 시상식에서 연설하며, 컴퓨팅 파워가 전례 없는 규모에 도달한다면 AI 시스템이 10년 내에 암을 치료할 수 있을 것이라는 비전을 제시했습니다.인공지능 지능의 혁신적 기준알트만을 기쁘게 한 깜짝 등장으로, 양자 컴퓨팅의 개척자 데이비드 도이치가 영상 링크를 통해 베를린 행사에 합류하여 그들이 “튜링 테스트 2.0”이라 이름 붙인 제안을 내놓았다. 새로운 기준은 물리학에서 가장 난해한 문제 중 하나인 양자 중력에 초점을 맞춘다.“만약 미래의 모델이 양자 중력을 알아내고 그 이야기를 — 어떤 문제를 선택했는지, 왜 그것을 추구했는지 — 알려줄 수 있다면, 그게 당신을 설득하기에 충분하겠습니까?“라고 알트만이 도이치에게 질문했다. 양자 컴퓨팅의 아버지로 알려진 이 물리학자는 그러한 능력이 진정한 인공지능임을 보여준다고 동의했다.도이치는 진정한 지능이란 기존 정보를 단순히 재조합하는 것이 아니라 새로운 지식을 창조하는 것이라고 강조했다. “거대 언어 모델은 방대한 지식에 기반해 끝없이 말할 수 있습니다,“라고 그는 설명했다. “제 생각에 진정한 지능이란 지식을 창조하는 능력 — 문제를 발견하고, 해결책을 고안하며, 그것을 시험하고 인간처럼 개선하는 것이라고 봅니다”.초지능 타임라인과 암 치료의 돌파구Altman은 2030년 전망을 재확인하며 기자들에게 “이번 10년이 끝날 때쯤, 우리가 직접 할 수 없는 일들을 할 수 있는 매우 뛰어난 모델이 등장하지 않는다면 저는 정말 놀랄 것입니다”라고 말했다. 그는 앞으로 몇 년 안에 AI가 인간이 독자적으로 해낼 수 없는 과학적 발견을 이루게 될 것이라고 내다봤다.오픈AI 최고경영자는 특히 암을 AI 돌파구의 타깃으로 삼으며, 이는 대규모 컴퓨팅 인프라가 뒷받침되어야 한다고 강조했다. “아마도 10기가와트의 컴퓨팅 파워가 있다면, AI가 암 치료 방법을 밝혀낼 수 있을지 모르겠다”고 Altman은 최근 블로그 게시물에서 밝혔다. 그는 이러한 컴퓨팅 역량이 개인 맞춤형 치료를 가능하게 하고, 의료 연구의 근본적인 변화를 이끌 수 있을 것이라고 제안했다.역사적인 인프라 투자알트만의 야심찬 일정은 오픈AI가 역사상 최대 규모의 AI 인프라 프로젝트를 발표한 것과 맞물린다. 이 회사는 9월 22일 Nvidia와의 1,000억 달러 규모 전략적 파트너십을 공개하며, 최소 10기가와트에 달하는 컴퓨팅 시스템을 구축할 계획임을 밝혔다. 이는 10개의 원자력 발전소와 맞먹는 전력 소비량이다.“Nvidia 창립자 젠슨 황은 “이것은 역사상 가장 큰 AI 인프라 프로젝트입니다.”라고 선언했다. “우리는 실제로 모든 응용프로그램, 모든 사용 사례, 모든 기기에 인텔리전스를 연결할 것입니다”. 첫 번째 1기가와트 규모 시스템은 2026년 말, Nvidia의 Vera Rubin 플랫폼을 통해 가동될 예정이다.컴퓨팅 요구 사항은 압도적이다. 계획된 10기가와트는 약 400만~500만 개의 그래픽 처리 장치를 구동할 수 있는데, 이는 Nvidia의 연간 GPU 출하량 전체와 맞먹는 규모다. 알트만은 이 인프라를 인공지능을 “근본적인 인권”으로 실현하기 위해 필수적이라고 강조했다.
679 조회
0 추천
2025.09.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입