Loading...

AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
171 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 345 / 1 페이지
(퍼플렉시티가 정리한 기사)OneMedNet Corporation은 월요일에 Palantir Technologies와의 획기적인 다년간 파트너십을 발표했으며, 이 소식에 힘입어 OneMedNet 주가는 장 초반 130% 이상 급등했고, Palantir도 프리마켓 거래에서 2.9% 상승했습니다. 이번 협업을 통해 Palantir의 인공지능 플랫폼이 OneMedNet의 헬스케어 데이터 네트워크와 통합되어, 양사는 2030년까지 약 8,680억 달러에 달할 것으로 예상되는 AI 기반 헬스케어 시장에서 상당한 점유율을 확보할 수 있게 되었습니다.방대한 헬스케어 데이터 인프라가 파트너십을 강화하다다년간에 걸친 이번 계약에 따라, Palantir의 AI 플랫폼은 OneMedNet의 iRWD™ 거의 실시간 제공자 네트워크에 기술적 기반을 제공합니다. 이 네트워크는 1,750개 이상의 의료 기관 사이트에서 50억 건이 넘는 행정 청구 및 1억 3,100만 건의 임상 검사 데이터를 포함하고 있습니다. 네트워크는 종양학, 심장학, 희귀 질환 등 중요한 치료 영역을 포괄하며, 생명 과학, 의료기기, 연구 기관에 익명화된, 규제 등급의 임상 데이터와 고도화된 분석 기능을 제공합니다.“OneMedNet은 Palantir의 AIP 덕분에 고품질의 규제 준수 데이터 제공 역량을 획기적으로 혁신할 수 있게 되었습니다. 이를 통해 임상 연구와 AI 기반 의료 솔루션에서의 획기적인 발전을 선도할 수 있게 되었습니다.”라고 OneMedNet의 사장이자 CEO인 Aaron Green이 밝혔습니다. 한편 Palantir의 의료 사업 공동대표인 Drew Goldstein은 “Palantir는 OneMedNet이 혁신적인 의료 솔루션을 더욱 빠르게 제공하고 궁극적으로 환자 치료 결과를 개선할 수 있도록 AI 인프라를 지원하게 되어 자랑스럽게 생각합니다.”라고 말했습니다.기술 향상이 시장 기회를 견인하다이번 파트너십은 운영 효율성을 크게 개선할 것으로 기대되며, 데이터 조회가 수 일 대신 몇 분 만에 완료되고, 방대한 데이터셋에 걸친 대화형 AI 기반 검색 기능 및 자동화된 프로세스를 통해 비용을 절감하면서 확장 가능한 성장을 가능하게 합니다. 팔란티어의 플랫폼은 SNOMED, HCPCS, ICD-10, CPT 코드를 포함한 의료 표준을 통합하여 상호운용 가능한 데이터 접근을 보장하고, OneMedNet의 독점 AI 알고리즘은 임상 데이터를 안전하게 비식별화하여 환자의 프라이버시를 보호합니다.PricewaterhouseCoopers의 연구에 따르면 종합적인 의료 데이터에 대한 접근성은 2030년까지 AI 기반 의료에서 예상되는 8,680억 달러의 시장 기회를 열기 위한 핵심 장벽으로 남아 있습니다. OneMedNet의 광범위한 공급자 네트워크와 팔란티어의 고급 분석 능력이 결합되어, 규제 준수 및 보안 플랫폼에서 확장 가능하고 반복적인 수익 창출 기회를 제공합니다.
17 조회
0 추천
10.07 등록
(퍼플렉시티가 정리한 기사)컨설팅 대기업 딜로이트는 월요일에 Anthropic의 Claude AI 어시스턴트를 전 세계 47만 명 이상의 임직원에게 도입한다고 발표했으며, 이는 해당 인공지능 스타트업의 현재까지 최대 규모의 기업 배포이다. 이번 파트너십 확장은 동시에 딜로이트가 AI로 생성된 오류가 포함된 호주 정부 보고서에 대해 일부 환불을 동의한 사실과 맞물려, 기업용 AI 채택의 가능성과 위험성을 동시에 보여준다.이러한 시점은 AI 기술을 도입하는 전문 서비스 기업들에게 중요한 순간임을 강조한다. 딜로이트는 AI 혁신의 선두주자임을 내세우며, 동시에 이전에 마이크로소프트의 GPT-4o를 사용하면서 발생한 품질 관리 문제를 해결해야만 한다. 호주 고용 및 직장관계부는 딜로이트의 보고서가 조작된 인용과 존재하지 않는 학술 자료를 포함한 사실을 확인한 이후, 딜로이트가 44만 달러 계약의 마지막 분할 금액을 환불하기로 했다고 밝혔다.대규모 글로벌 출시딜로이트의 클로드(Claude) 도입은 150개국 이상에 걸친 직원들에게 적용될 예정이며, 이는 양사가 2024년에 처음 발표한 파트너십의 상당한 확장임을 의미합니다. 이 컨설팅 회사는 직원의 역할에 맞춘 맞춤형 클로드 “페르소나”를 만들 계획으로, 회계사에게는 재무 분석에 특화된 AI 도구를 제공하고, 소프트웨어 개발자에게는 코딩에 집중한 버전을 제공할 예정입니다.딜로이트 미국 전략 및 기술 책임자인 란짓 바와(Ranjit Bawa)는 “고객들은 당연히 ’여러분도 이를 사용하고 있나요?’라고 묻습니다. 그래서 저희가 더 나은 자문을 제공하고, 더 신뢰를 얻을 수 있습니다.“라고 설명했습니다. 이 회사는 훈련된 전문가들과 함께 클로드 센터 오브 엑설런스(Claude Center of Excellence)를 설립하고, 15,000명의 전문가에게 해당 플랫폼에 대한 자격증을 부여할 계획입니다.앤트로픽(Anthropic)의 최고 상업 책임자인 폴 스미스(Paul Smith)는 CNBC에 양사가 이 파트너십에 상당한 재정 및 엔지니어링 투자를 하고 있지만 구체적인 조건은 공개하지 않았다고 밝혔습니다.앤트로픽의 모멘텀딜로이트와의 계약은 앤트로픽에게 뜻깊은 한 해를 마무리하는 계기가 되었습니다. 앤트로픽은 9월에 1,830억 달러의 가치로 130억 달러의 자금 조달을 완료했습니다. 회사의 연간 수익은 2025년 초 약 10억 달러에서 8월 기준 50억 달러 이상으로 급등했습니다. 현재 앤트로픽은 30만 개 이상의 비즈니스 고객을 보유하고 있으며, 연 매출 10만 달러 이상의 대형 계정은 지난 1년 동안 거의 7배 성장했습니다.파트너십 발표는 앤트로픽이 9월 말에 공개한 Claude Sonnet 4.5 출시 직후에 이루어졌으며, 이 모델은 “세계 최고의 코딩 모델”로 평가받고 있습니다. 이 스타트업은 국제 인력을 세 배로 확장했으며, 크리스 챠우리(Chris Ciauri)를 글로벌 확장 책임자로 임명했습니다.
18 조회
0 추천
10.07 등록
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 알트먼은 샌프란시스코에서 열린 회사의 DevDay 2025 컨퍼런스에서 AI 에이전트를 구축하기 위한 종합 툴킷인 AgentKit을 공개하며, 빠르게 확장되는 자율 에이전트 시장에 본격적으로 진출할 것을 알렸다.혁신적인 AgentKit 툴킷, 개발자 생태계 겨냥AgentKit은 ChatGPT 이후 OpenAI가 선보인 가장 야심찬 개발자 대상 제품 출시에 해당하며, Altman이 “프로토타입에서 실제 제품까지 에이전트를 개발할 수 있도록 설계된 OpenAI 플랫폼의 완성된 빌딩 블록 세트”라고 설명한 바 있습니다. 이 툴킷은 단순한 프롬프트 응답을 넘어서 복잡한 작업을 수행할 수 있는 자율 AI 시스템에 대한 수요 증가에 대응하기 위해 개발되었습니다.플랫폼은 네 가지 핵심 구성요소를 포함합니다: Agent Builder는 Altman이 “에이전트 제작을 위한 Canva”라고 비유한 시각적 드래그 앤 드롭 인터페이스이며, ChatKit은 맞춤형 애플리케이션에 삽입할 수 있는 채팅 인터페이스, Evals for Agents는 성능 측정 툴을 제공하며, OpenAI의 커넥터 레지스트리에 대한 접근을 통해 안전하게 서드파티 통합이 가능합니다.툴킷의 접근성을 시연하기 위해, OpenAI 엔지니어 Christina Huang은 8분 이내에 무대에서 전체 AI 워크플로우와 두 명의 에이전트를 직접 구축해 보여주었습니다. Altman은 “우리가 처음 에이전트를 만들려고 했을 때 바랐던 모든 것들이 이 안에 있습니다”라고 설명하며, 에이전트 개발을 간소화하는 것에 대한 회사의 의지를 강조했습니다.ChatGPT, 플랫폼 확장 속 주간 사용자 8억 명 돌파앨트먼은 또한 ChatGPT의 주간 활성 이용자 수가 8억 명에 도달했으며, 이는 불과 두 달 전 7억 명에서 증가한 수치라고 발표했다. 이 이정표는 OpenAI가 동시에 Apps SDK를 출시해 개발자들이 ChatGPT 대화 내에서 직접 상호작용하는 애플리케이션을 만들 수 있도록 하면서 플랫폼의 폭발적인 성장을 강조한다.새로운 앱 기능으로 사용자는 채팅 인터페이스를 벗어나지 않고도 Spotify , Figma, Coursera , Zillow , Canva 등의 서비스를 원활하게 이용할 수 있게 되었다. “우리는 ChatGPT가 사람들이 발전하고 더 생산적이고 창의적으로 될 수 있도록 돕는 훌륭한 방법이 되기를 바랍니다.”라고 앨트먼은 설명했다.ChatGPT, 플랫폼 확장 속 주간 사용자 8억 명 돌파앨트먼은 또한 ChatGPT의 주간 활성 이용자 수가 8억 명에 도달했으며, 이는 불과 두 달 전 7억 명에서 증가한 수치라고 발표했다. 이 이정표는 OpenAI가 동시에 Apps SDK를 출시해 개발자들이 ChatGPT 대화 내에서 직접 상호작용하는 애플리케이션을 만들 수 있도록 하면서 플랫폼의 폭발적인 성장을 강조한다.새로운 앱 기능으로 사용자는 채팅 인터페이스를 벗어나지 않고도 Spotify , Figma, Coursera , Zillow , Canva 등의 서비스를 원활하게 이용할 수 있게 되었다. “우리는 ChatGPT가 사람들이 발전하고 더 생산적이고 창의적으로 될 수 있도록 돕는 훌륭한 방법이 되기를 바랍니다.”라고 앨트먼은 설명했다.
29 조회
0 추천
10.07 등록
(퍼플렉시티가 정리한 기사)Rivian 의 CEO RJ Scaringe는 자사 전기차에서 Apple CarPlay를 제외하기로 한 결정에 대해 거듭 확신을 표명했습니다. 그는 더버지의 Decoder 팟캐스트에서, 앞으로 18개월 동안 인공지능 기능을 통합해 나가면서 고객들이 결국 리비안만의 독자적 소프트웨어 방식을 높이 평가할 것이라고 말했습니다.10월 5일 게스트 진행자 Joanna Stern과의 대화에서 Scaringe는 표준 CarPlay와 최신 CarPlay Ultra 모두를 생략하겠다는 자신의 입장이 “매우 확고하다”고 재확인하며, 리비안이 그가 “매끄러운 디지털 경험”이라고 부르는 것에 헌신하고 있음을 강조했습니다. 그는 이러한 결정이 일부 고객을 잃게 만들 수 있다는 점을 인정하면서도 “우리는 그것을 감수한다”고 밝혔습니다.AI 통합이 전략을 이끈다스카린지는 AI 통합을 리비안이 소프트웨어 생태계를 완전히 통제해야 하는 핵심 이유로 제시했습니다. 회사는 AI 기반 음성-텍스트 메시징 기능과 기타 지능형 기능을 출시할 계획이며, 이는 자동차 내 다양한 애플리케이션을 외부 플랫폼인 CarPlay와 달리 보다 깊게 연결할 수 있게 할 예정입니다.“앞으로 18개월 안에, 우리는 반드시 여러 애플리케이션을 연결하기 위해 작업을 수행하거나 결정을 내리는 다양한 새로운 기능들을 보게 될 것입니다.“라고 스카린지는 설명했습니다. 그는 차량 상태, 주행 조건, 그리고 사용자 선호도를 ‘생태계 수준’에서 파악하면 리비안이 “더 풍부하고 나은 경험”을 제공할 수 있다고 주장했습니다.최초로 2024년 11월 소프트웨어 최고 책임자 와심 벤사이드가 발표한 AI 음성 어시스턴트는 2025년에 리비안의 R1T 픽업 및 R1S SUV 모델에 출시될 예정입니다. 이 시스템은 사용자가 음성 명령을 통해 모든 터치스크린 기능에 접근할 수 있게 하고, 여러 명령을 동시에 처리하며 전체적인 의도를 해석할 수 있도록 설계되었습니다.업계의 반발과 소비자 선호도리비안의 입장은 소비자 선호도와 상충되는데, 최근 데이터에 따르면 2023년 북미에서 판매된 신차의 Apple CarPlay 및 Android Auto 채택률이 85%를 초과한 것으로 나타났습니다. 2025년 에디슨 리서치 연구에 따르면, CarPlay 또는 Android Auto에 접근할 수 있는 미국인의 83%가 실제로 해당 플랫폼을 사용하고 있습니다.이 결정은 소셜 미디어와 자동차 포럼에서 비판을 받았으며, 잠재 구매자들은 CarPlay 지원이 없는 리비안 차량을 고려하는 데 주저하는 모습을 보였습니다. 한 리비안 애호가는 RivianTrackr에 “많은 운전자들에게 있어 외모가 중요한 것이 아니라, 편안함과 연속성, 그리고 우리가 아이폰을 중심으로 구축한 생태계가 중요하다”고 적었습니다.리비안은 테슬라와 제너럴 모터스와 함께 서드파티 스마트폰 통합 플랫폼을 거부하고 독자적인 소프트웨어 생태계에 베팅하고 있습니다. 그러나 이 경쟁자들과 달리 리비안은 여전히 소프트웨어 성숙도가 떨어지며, 현재 운전자 지원 기능은 사전 매핑된 고속도로에 한정되어 있고, 테슬라의 더 발전된 시스템에 비해 성능이 느립니다.스케어린지가 “애플과 훌륭한 관계”를 유지하고 있으며 Apple Music 확장과 Apple Watch 차량 접속을 포함한 향후 통합을 약속했음에도 불구하고, 리비안은 CarPlay 거부에 대해 “강한 확신”을 가지고 있습니다. 회사는 Google Maps, Spotify, YouTube 등 일부 서드파티 앱을 자사 인터페이스에 직접 통합하여 계속 제공하고 있습니다.
21 조회
0 추천
10.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입