Loading...

AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
447 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 469 / 55 페이지
(퍼플렉시티가 정리한 기사)오픈AI의 CEO 샘 알트먼은 이번 주말 인공지능 회사가 앞으로 몇 주 안에 새로운 “고성능 컴퓨팅 집약적” ChatGPT 기능을 출시할 것이라고 발표했으나, 이러한 고급 기능들은 월 200달러 프로 요금제 가입자에게만 제공되고 추가 요금이 발생할 수 있다고 밝혔다.9월 21일 X(엑스)에 올린 게시글에서 알트먼은 이 같은 새로운 기능과 관련한 높은 컴퓨팅 비용 때문에 처음에는 프로 구독자들에게만 접근 권한을 제한할 수밖에 없다고 설명했다. 알트먼은 “앞으로 몇 주 동안, 우리는 새로운 컴퓨팅 집약적 (compute-intensive) 기능을 출시할 예정입니다. 관련 비용 때문에, 일부 기능은 초기에는 프로 구독자에게만 제공되고, 일부 신제품에는 추가 요금이 붙을 수 있습니다”라고 전했다.프리미엄 AI 기능을 위한 전략적 추진이번 발표는 OpenAI가 고급 AI 기능을 유료화하는 지속적인 전략을 나타내며, 정교한 모델 운영에 드는 상당한 비용과 접근성의 균형을 맞추려는 움직임입니다. 앨트먼은 회사가 AI를 광범위하게 사용할 수 있도록 하겠다는 약속을 재확인하며 “우리의 목표는 가능한 한 공격적으로 지능의 비용을 낮추고 서비스를 널리 제공하는 데 있다”고 밝혔습니다.그러나 그는 이러한 새로운 서비스들을 현재 AI 능력의 한계를 실험하는 것이라고 설명했습니다. “오늘날의 모델 비용 기준으로 많은 컴퓨팅 자원을 흥미로운 새로운 아이디어에 투자하면 무엇이 가능한지 배우고 싶다”고 앨트먼은 설명했습니다.이번 발표 시기는 OpenAI가 프리미엄 서비스 확장을 본격적으로 추진하는 시기와 맞물렸습니다. 2024년 12월에 월 200달러로 출시된 ChatGPT Pro 구독 서비스는 이미 GPT-5 Pro, Sora 비디오 생성, 최근 도입된 Operator AI 에이전트와 같은 독점 기능을 포함하여 고급 모델을 무제한 이용할 수 있도록 지원하고 있습니다.경쟁 및 시장 포지셔닝알트먼이 곧 출시될 제품에 어떤 기능이 포함될지 구체적으로 밝히지는 않았지만, 보도에 따르면 OpenAI는 곧 공개될 수 있는 AI 기반 웹 브라우저를 개발 중인 것으로 알려졌습니다. 로이터에 따르면, 이 브라우저는 ChatGPT를 브라우징 경험에 직접 통합하고, 자동화된 웹 작업을 위한 OpenAI의 Operator 에이전트가 포함될 가능성도 있다고 합니다.회사 측은 기존 도구의 향상된 버전도 개발 중인 것으로 전해지며, 추론 모델의 업그레이드와 자사 AI 에이전트의 확장된 기능이 포함될 예정입니다. 이러한 개발은 최근 구글가 새로운 AI 기능을 출시하는 등 경쟁이 치열해지는 가운데, 타사 기업들도 AI 역량 향상에 박차를 가하고 있는 상황에서 이루어지고 있습니다.OpenAI의 수익 전략은 효과를 보이고 있는 것으로 보이며, 2025년 중반 기준으로 연간 반복 수익이 120억 달러를 돌파한 것으로 알려졌습니다. 이는 주로 구독 서비스에서 비롯된 것입니다. 무료 ChatGPT 플랜에서부터 프리미엄 Pro 구독에 이르는 다단계 가격 정책 덕분에, 향상된 AI 기능을 원하는 일반 사용자와 기업 고객 모두의 관심을 끌고 있습니다.
406 조회
0 추천
2025.09.23 등록
(퍼플렉시티가 정리한 기사)10명의 노벨상 수상자와 선도적인 인공지능 연구자들을 포함한 200명 이상의 저명 인사들이 월요일, 위험한 AI 응용 프로그램에 대한 구속력 있는 국제 규제를 촉구하는 긴급 성명을 발표했으며, 이 호소는 뉴욕에서 열린 유엔 총회에 맞춰 발표되었습니다.“AI 레드라인을 위한 글로벌 호소(Global Call for AI Red Lines)“는 노벨 평화상 수상자인 마리아 레사가 유엔 총회의 고위급 주간(High-Level Week) 개막 연설에서 발표했으며, 각국 정부에 2026년 말까지 AI에 대한 “명확하고 검증 가능한 레드라인”을 설정할 것을 촉구했습니다.주목받는 연합, 과학과 정치를 아우르다서명자들은 화학, 경제학, 평화, 물리학 부문 노벨상 수상자들을 아우르는 전례 없는 연합을 대표합니다. 주목할 만한 인물로는 생화학자 제니퍼 다우드나, 경제학자 다론 아제모글루, 물리학자 조르지오 파리시가 있습니다. 또한 AI 분야의 개척자이자 투링상 수상자인 제프리 힌턴과 요슈아 벤지오, 이른바 “AI의 대부” 세 명 중 두 명도 명단에 포함되어 있습니다.이 이니셔티브를 지지하는 정치인으로는 메리 로빈슨 전 아일랜드 대통령, 2016년 노벨 평화상 수상자인 후안 마누엘 산토스 전 콜롬비아 대통령, 엔리코 레타 전 이탈리아 총리가 있습니다. 유럽 의회의 브란도 베니페이와 세르게이 라고딘스키 의원도 서명에 동참했습니다.기술 산업 참여주요 AI 기업의 유명 직원들이 이 성명에 동참했는데, 여기에는 OpenAI 공동 설립자 보이치에흐 자렘바와 Google DeepMind 수석 과학자인 이안 구드펠로우 등이 포함되어 있습니다. 그러나 OpenAI의 샘 알트만, Anthropic의 다리오 아모데이, Google DeepMind의 데미스 하사비스 등 주요 AI 기업의 CEO들은 서명하지 않았습니다.AI 위험에 대한 긴급성 증가이 서한은 AI의 “현재 경로가 전례 없는 위험을 초래한다”고 경고하며, 인위적으로 설계된 팬데믹, 대량 실업, 체계적인 인권 침해, 그리고 고도화된 시스템에 대한 인간의 통제력 상실 가능성에 대한 우려를 언급합니다. 최근 AI가 대량 감시에 활용되거나, 청소년 자살과 관련이 있다는 의혹, 허위 정보 캠페인 등이 언론에 보도되면서 이러한 즉각적인 우려가 더욱 강조되고 있습니다.구체적인 권고 사항을 피하면서도, 이 성명은 치명적인 자율 무기, 자율적 AI 자기 복제, 핵전쟁에서의 AI 활용 금지 등 잠재적 ‘레드라인’을 제안합니다. 이번 캠페인은 2023년 3월 1,000명 이상의 기술 리더들이 강력한 AI 개발 중단을 촉구했던 이전의 노력에 이어 등장했습니다.이 캠페인은 특히 국제 AI 규제에 대한 미국의 반대 등 상당한 도전에 직면해 있습니다. 현 행정부는 “과도한 규제”와 AI 거버넌스에 대한 외국의 영향력에 대해 회의적 입장을 표명했습니다. 이런 장애물에도 불구하고, 다양한 지지세는 글로벌 AI 안전 조치의 필요성이 국제적으로 확산되고 있음을 보여줍니다.
440 조회
0 추천
2025.09.23 등록
(퍼플렉시티가 정리한 기사)Google는 오늘 공식적으로 Google TV 기기에서 Gemini AI 어시스턴트를 출시하며, Google 어시스턴트를 생태계 전반에서 대체하려는 회사의 더 광범위한 노력에서 중요한 단계에 도달했다. 이번 롤아웃은 TCL의 최신 QM9K 시리즈 스마트 TV에서 독점적으로 시작되며, 해당 TV는 현재 3,000달러부터 구매할 수 있다.프리미엄 TCL QM9K 텔레비전은 Gemini 통합 기능을 처음으로 탑재한 Google TV 기기이며, 사용자는 텔레비전과 자연스러운 언어로 대화를 나눌 수 있다. 기존의 Google 어시스턴트에서 흔히 볼 수 있는 경직된 명령과 달리, Gemini는 더욱 정교한 상호작용을 가능하게 해주어, 예를 들어 “아내와 함께 볼 수 있는 걸 찾아줘. 나는 드라마를 좋아하지만, 아내는 가볍고 재미있는 코미디를 좋아해.“처럼 복잡한 요청도 할 수 있다.한정 초기 출시가 독점성을 만듭니다QM9K 시리즈는 Google TV의 Gemini를 위한 고급 입문 제품군으로, 65인치 모델이 $3,000, 75인치가 $3,500, 85인치가 $4,000, 그리고 플래그십 98인치 모델이 $6,000에 달합니다. 이 텔레비전들은 4K QD-미니 LED 기술을 적용해 6,500니트의 최대 밝기와 6,000개의 디밍 존을 자랑하며, 사용자가 방에 들어올 때 감지할 수 있는 존재 감지 기능도 갖추고 있습니다.Android Authority에 따르면, Google TV의 Gemini는 현재 구글 어시스턴트가 제공하는 모든 기능을 수행할 수 있을 뿐만 아니라 복잡한 요청에 대해 더욱 유연하게 대응할 수 있도록 향상된 기능을 제공할 예정입니다. AI는 콘텐츠 추천, TV 프로그램의 시즌 요약 제공, 그리고 교육적 질문에 적합한 YouTube 영상을 제안하는 등 다양한 지원도 할 수 있습니다.2025년에 더 넓은 범위로 출시 예정TCL 출시로 Gemini가 텔레비전에 첫선을 보인 가운데, 구글은 추가 기기들도 “올해 후반”에 업데이트를 받을 것이라고 공식 확인했습니다. 예정된 롤아웃에는 구글 자체 TV 스트리머, Walmart의 Onn 4K Pro 스트리밍 기기, 2025년형 하이센스 U7, U8, UX 모델, 그리고 QM7K, QM8K, X11K 시리즈를 포함한 추가 TCL 모델들이 포함됩니다.이러한 단계적 롤아웃 방식으로 인해 구글의 자체 스트리밍 하드웨어가 왜 TCL 출시와 동시에 업데이트를 받지 않는지에 대한 의문이 제기되고 있습니다. 구글은 Gemini 지원을 위해 안드로이드 14가 필요하다고 언급했으며, 이는 구형 Google TV 기기들과의 호환성을 제한할 수 있다고 밝혔습니다.AI 통합을 통한 향상된 TV 경험오락 추천을 넘어, Google TV의 Gemini는 텔레비전을 정보 허브로서의 기능까지 확장합니다. 사용자는 교육 관련 질문을 하거나 요리법을 요청하거나 숙제 도움을 받을 수 있으며, AI는 관련 동영상 추천과 함께 텍스트 응답을 읽어줍니다. 이 통합은 텔레비전을 단순한 오락 기기가 아닌 포괄적인 스마트 홈 제어 센터로 바꾸려는 구글의 비전을 보여줍니다.이러한 출시와 함께, 구글은 자사 제품 생태계 전반에서 Google Assistant를 Gemini로 순차적으로 대체해 나가고 있으며, 스마트 홈 기기들도 2025년 10월에 비슷한 업데이트를 받을 것으로 예상됩니다.
428 조회
0 추천
2025.09.23 등록
(퍼플렉시티가 정리한 기사)Nvidia이 월요일에 OpenAI와 획기적인 전략적 파트너십을 발표했으며, Nvidia의 시스템을 활용해 최소 10기가와트 규모의 AI 데이터 센터를 구축하기 위해 최대 1,000억 달러를 투자하기로 약속했습니다. 이 대규모 인프라 구축의 1단계는 2026년 하반기에 Nvidia의 새로운 Vera Rubin 플랫폼을 사용하여 시작될 예정입니다.이번 파트너십은 역사상 가장 큰 기술 거래 중 하나로, Nvidia는 각 기가와트 용량이 가동될 때마다 점진적으로 1,000억 달러를 투자할 계획입니다. Jensen Huang Nvidia 창립자 겸 CEO에 따르면, “이번 투자와 인프라 파트너십은 다음 시대의 지능을 이끌 10기가와트 배치라는 또 다른 도약을 의미합니다”.대규모 인프라 구축10기가와트 규모의 배치는 OpenAI가 초지능 개발을 목표로 하는 과정에서 수백만 개의 Nvidia GPU로 구성될 예정입니다. 이 규모를 이해하기 쉽게 설명하자면, Nvidia CEO 젠슨 황은 데이터 센터의 1기가와트 용량마다 약 500~600억 달러의 투자가 필요하며, 이 중 약 350억 달러가 Nvidia 칩과 시스템에 해당한다고 추정한 바 있습니다.이번 파트너십은 Nvidia의 최첨단 Vera Rubin NVL144 CPX 플랫폼을 활용합니다. 이 플랫폼은 단일 랙에 8 엑사플롭스의 AI 연산 성능을 제공하며, Nvidia의 기존 GB300 NVL72 시스템 대비 7.5배 더 높은 성능을 발휘합니다. Rubin CPX GPU는 백만 토큰의 코딩과 생성형 영상 애플리케이션 등 방대한 컨텍스트의 AI 처리를 위해 특별히 설계되었습니다.OpenAI CEO 샘 올트먼은 전략적 중요성을 강조하며 다음과 같이 밝혔습니다: “모든 것은 컴퓨트에서 시작됩니다. 컴퓨트 인프라는 미래 경제의 토대가 될 것이며, 우리가 Nvidia와 함께 구축하는 것을 바탕으로 새로운 AI 혁신을 창출하고 그 혁신을 사람들과 기업에 대규모로 제공할 것입니다”.전략적 포지셔닝 및 시장 환경이번 파트너십은 AI 혁명의 두 핵심 기업 사이의 관계를 크게 강화합니다. 현재 주간 활성 사용자 7억 명 이상을 보유한 OpenAI는 AI 팩토리 성장 계획을 위해 Nvidia를 선호하는 전략적 컴퓨팅 및 네트워킹 파트너로 선정하여 협력할 예정입니다.이번 계약은 Microsoft, Oracle, SoftBank 등 주요 파트너들과 진행 중인 OpenAI의 인프라 사업을 Stargate 프로젝트를 통해 보완합니다. 2025년 1월에 발표된 Stargate 이니셔티브는 미국 전역에 AI 인프라를 구축하기 위해 최대 5,000억 달러를 투자할 계획입니다.이번 발표는 양사가 글로벌 AI 인프라 확장에 박차를 가하는 가운데 나왔습니다. 최근 보도에 따르면, Nvidia와 OpenAI는 영국 데이터 센터에도 수십억 달러 규모의 투자를 계획하고 있으며, 트럼프 대통령의 영국 방문 시 Nscale 운영사와 협력할 예정입니다.양사는 기술 로드맵을 공동 최적화할 것이며, OpenAI의 모델 및 인프라 소프트웨어가 Nvidia의 하드웨어 및 소프트웨어 플랫폼과 긴밀하게 연동될 예정입니다. 이러한 깊은 통합은 AI의 지속적인 기하급수적 성장과 인공지능 일반을 달성하기 위해 필요한 엄청난 컴퓨팅 수요에 대한 전략적 선택을 의미합니다.
405 조회
0 추천
2025.09.23 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입