Loading...

AI 뉴스

알리바바, Qwen3-Omni 모델 공개로 미국과 AI 경쟁 심화

페이지 정보

작성자 xtalfi
작성일 2025.09.23 17:23
761 조회
0 추천
0 비추천

본문

ea5187736d5e8fdfa78888d5ed1c9830lz9C.png

(퍼플렉시티가 정리한 기사)

중국 기술 대기업 알리바바는 일요일에 자사의 Qwen3-Omni 인공지능 모델을 공개하며, 다중 모달 AI 시스템 분야에서 미국 기술 선두주자들에게 중대한 도전을 제기했습니다. 이 오픈소스 모델은 텍스트, 이미지, 오디오, 비디오 입력을 동시에 처리할 수 있으며, 텍스트와 음성 형식 모두로 실시간 스트리밍 응답을 제공합니다.


공식 발표에 따르면, Qwen3-Omni는 36개 벤치마크 중 32개에서 최첨단 성능을 달성하였고, 36개 오디오 및 비디오 테스트 중 22개에서 오픈소스 모델 중 선두를 차지했습니다. 시스템의 자동 음성 인식 기능은 구글의 Gemini 2.5 Pro와 동등한 수준입니다.


멀티모달을 넘어 확장되는 AI 아스날


알리바바는 이번 달에 여러 보완적인 AI 기술도 선보였습니다. 회사는 300억 개의 파라미터만 사용하면서도 미국 모델의 더 많은 파라미터 수로 추정되는 OpenAI의 대표적 딥리서치 툴에 버금가는 딥리서치 에이전트를 출시했습니다. 사우스차이나모닝포스트에 따르면, 알리바바는 이 에이전트가 “놀라운 효율성”을 보여주었으며 Humanity’s Last Exam 벤치마크에서 32.9%의 정확도를 달성해 OpenAI의 딥리서치 점수인 26.6%를 능가했다고 밝혔습니다.


딥리서치 에이전트는 알리바바의 Amap 내비게이션 앱에 통합되어 여러 날에 걸친 여행 계획을 지원하고, Tongyi FaRui 법률 연구 플랫폼에서는 검증된 인용문과 함께 사례 검색을 강화했습니다.


또한 알리바바는 인물 사진을 말하거나 노래하고, 공연할 수 있는 애니메이션 아바타로 변환하는 디지털 휴먼 영상 생성 오픈소스 모델 Wan2.2-animate를 공개했습니다. 이 기술은 다양한 프레이밍 옵션을 지원하며 프롬프트 지시에 따라 캐릭터의 동작을 생성할 수 있습니다.


세계적인 경쟁이 심화되고 있다


이 출시들은 이달 초 공개된 첫 조 단위 파라미터 모델인 Qwen-3-Max-Preview를 포함한 알리바바의 광범위한 AI 확장과 맞물려 있습니다. 알리바바는 오픈소스 AI 개발 분야에서 선두주자로 자리매김하고 있으며, 허깅페이스에서 10만 개가 넘는 Qwen 기반 파생 모델이 만들어져 메타의 Llama 기반 모델을 능가했습니다.


Qwen3-Omni는 119개의 텍스트 언어, 19개의 음성 입력 언어, 10개의 음성 출력 언어를 지원하며, 오디오 상호작용에 대해 211밀리초로 매우 빠른 응답 시간을 자랑하는 저지연 스트리밍을 제공합니다. 이 모델은 Mixture of Experts 아키텍처를 적용하며, 사고 모드와 비사고(단순 실행) 모드 모두를 제공합니다.


이러한 출시 시기는 AI 업계 내 경쟁이 심화되고 있음을 반영하며, 중국 기업들이 미국 기술 대기업의 지배에 점점 더 도전하면서 전 세계 개발자들의 채택을 높이기 위해 공격적인 오픈소스 전략을 펼치고 있습니다.

댓글 0
전체 720 / 105 페이지
(퍼플렉시티가 정리한 기사)구글는 화요일에 AI 모드 검색 기능에 대한 대규모 업데이트를 출시하며, 이미지와 자연어 설명을 결합해 제품과 영감을 찾을 수 있도록 하는 비주얼 검색 기능을 추가했습니다. 이번 강화로 구글의 대화형 검색 도구는 더욱 시각적이고 쇼핑에 특화된 경험으로 변화하여, OpenAI의 ChatGPT와 같은 경쟁 업체들과 겨루기 위한 회사의 전략에 중요한 발걸음을 내딛게 되었습니다.이 업데이트로 사용자는 "내 침실에 어울릴 만한 맥시멀리스트 영감을 보여줘"와 같은 질문을 하고, 그에 맞는 큐레이팅된 이미지 결과를 받을 수 있습니다. 이후 "더 어두운 톤과 대담한 프린트가 들어간 것 더 보여줘"처럼 추가 질문을 통해 결과를 세분화할 수 있습니다. 각 이미지는 출처 웹사이트로 직접 연결되는 링크가 포함되어 있어, 사용자가 관심을 끄는 상품을 탐색하거나 구매할 수 있도록 돕습니다.혁신적인 쇼핑 경험시각적 검색 기능은 사용자가 전통적인 필터 대신 대화식으로 제품을 설명할 수 있게 함으로써 온라인 쇼핑을 획기적으로 변화시킵니다. 예를 들어, 쇼핑객은 "너무 헐렁하지 않은 배럴진"을 검색하고 이에 맞는 시각적 결과를 받은 뒤, "좀 더 발목까지 오는 길이로 보여줘"와 같이 검색을 더욱 세밀하게 조정할 수 있습니다.이러한 쇼핑 경험은 500억 개 이상의 제품 목록을 보유한 Google의 쇼핑 그래프에 의해 제공됩니다. 이 목록들은 전 세계 소매업체로부터 수집되며, 매시간 20억 개 이상의 목록이 새로 고쳐집니다. 이 시스템은 리뷰, 가격, 사용 가능한 색상, 재고 상태 등 최신 상품 정보를 제공합니다.첨단 인공지능 기술이 시각적 혁신을 실현합니다이 획기적인 발전은 구글의 새로운 "비주얼 검색 팬아웃(visual search fan-out)" 기술에 의존하고 있습니다. 이 기술은 주요 피사체를 넘어 미묘한 세부 사항과 부차적인 객체까지 인식하여 이미지를 포괄적으로 분석합니다. 시스템은 이후 여러 개의 배경 쿼리를 실행해 전체 시각적 맥락을 파악하고 매우 관련성 높은 결과를 제공합니다.이 기능은 Gemini 2.5의 진보된 멀티모달 기능을 기반으로 구글 검색, 렌즈, 이미지 검색 기술을 결합합니다. 구글 검색 제품 관리 부사장인 로비 스타인(Robby Stein)에 따르면, 이는 “당신이 검색하고자 하는 것을 단지 단어로는 표현할 수 없는 상황”을 해결합니다.비주얼 AI 모드는 이번 주 미국의 영어 사용자를 대상으로 출시됩니다. 이번 업데이트는 ChatGPT가 하루 약 6,600만 개의 검색 유사 프롬프트를 처리하는 등 AI 기반 검색 경쟁이 심화되는 가운데 발표된 것으로, 구글은 하루 140억 건의 검색을 처리하고 있습니다. 그럼에도 구글은 검색 플랫폼 전반에 AI 역량을 빠르게 확장하면서 여전히 지배적 위치를 유지하고 있으며, 비주얼 검색을 사용자가 온라인에서 제품을 발견하고 쇼핑하는 방식의 다음 진화 단계로 내세우고 있습니다.
597 조회
0 추천
2025.10.02 등록
(퍼플렉시티가 정리한 기사)엘론 머스크은 화요일에 자신의 인공지능 회사 xAI가 "그로키피디아(Grokipedia)"를 개발 중이라고 발표했습니다. 그로키피디아는 온라인 지식 공유에서 위키피디아의 지배에 직접적으로 도전하는 AI 기반 백과사전입니다."우리는 Grokipedia를 @xAI에서 개발 중입니다. 위키피디아보다 훨씬 개선될 것입니다. 솔직히 말해, 이것은 xAI가 우주를 이해하는 목표를 향한 필수적인 단계입니다,"라고 머스크는 X에 썼습니다.위키피디아 편향에 대한 증가하는 비판머스크의 발표는 백악관 암호화폐 담당관 데이비드 색스(David Sacks)의 비판에 대한 응답으로 나왔다. 색스는 위키피디아를 "완전히 편향되어 있다"고 비난하며, "좌파 활동가 군단"이 이를 통제하고 있다고 주장했다. 색스는 2024년 12월 도널드 트럼프 대통령에 의해 미국 최초의 AI 및 암호화폐 담당관으로 임명된 인물로, 위키피디아의 영향력이 일반 독자를 넘어 AI 모델 훈련에까지 미쳐 더 광범위한 체계적 문제를 야기한다고 주장했다.이러한 비판은 위키피디아 공동 창립자 래리 생거(Larry Sanger)가 제기해 온 오랜 우려를 반영한다. 생거는 최근 인터뷰에서 좌파 활동가들이 "위키피디아를 타락시키고, 서사의 방향을 유독한 좌파 편향으로 통제할 수 있는 힘을 장악했다"고 경고했다. 생거는 특히 정치 인물, 약물 합법화, 기타 논쟁이 되는 주제에 대한 위키피디아의 서술이 명확한 이념적 편견을 드러낸다고 비판해왔다.그로키피디아의 인공지능 기반 접근법프로젝트에 정통한 소식통에 따르면, Grokipedia는 xAI의 Grok AI 모델을 활용해 온라인 콘텐츠의 부정확성을 자동으로 감지하고 "합성 교정"을 통해 이를 재작성할 예정이다. 이 시스템은 위키피디아, 서적, 기타 온라인 자료에서 정보를 수집하여 머스크가 보다 객관적이라고 설명하는 정보 버전을 생성하고, 그가 오류와 이념적 편향으로 여기는 부분을 걸러낸다.이 프로젝트는 단순한 대화형 AI를 넘어 xAI의 Grok 챗봇의 진화를 의미한다. 회사는 최근 2025년 9월 Grok 4 Fast를 출시했으며, 이는 성능 기준을 유지하면서도 토큰 사용량을 40% 절감한 더 효율적인 추론 모델이다. 최신 버전은 2백만 토큰의 컨텍스트 윈도우를 지원하고, 경쟁사보다 비용이 크게 낮으면서 평가 플랫폼의 검색 관련 작업에서 1위를 차지했다.2025년 3월 X Corp 인수 이후 800억 달러의 기업 가치를 인정받은 xAI는 "최대의 진실 추구" AI를 표방하며 "우주의 본질을 이해하는 것"을 목표로 삼고 있다. 그러나 회사는 콘텐츠 관리 측면에서 어려움을 겪어왔으며, Grok가 반유대주의적 콘텐츠를 생성하거나 아돌프 히틀러를 찬양하는 사례가 발생한 적이 있고, 이후 수정 조치가 이루어졌다.
555 조회
0 추천
2025.10.02 등록
(퍼플렉시티가 정리한 기사)아마존은 화요일에 링(Ring) 보안 카메라와 도어벨의 가장 포괄적인 업그레이드를 공개하며, 스마트 홈 감시 시스템을 새로운 영역으로 끌어올리는 인공지능 기능들을 도입했습니다. 이번 업그레이드를 통해 얼굴 인식, 잃어버린 반려동물 추적, 그리고 지능형 도어벨 응답 기능 등이 추가되었습니다.이 기술 대기업은 가을 하드웨어 행사에서 링(Ring) 브랜드 최초의 4K 카메라 라인업이 "Retinal Vision"이라는 AI 강화 이미징 시스템으로 구동된다고 발표했습니다. 이 시스템은 더욱 선명한 영상 품질을 제공하도록 설계되었습니다. 새로운 기능들은 기존에 최대 1080p 및 2K 해상도만을 지원했던 홈 보안 브랜드에게 있어 큰 도약을 의미합니다.인공지능이 가정 보안의 중심에 서다두드러지는 특징은 "익숙한 얼굴들(Familiar Faces)"로, 인공지능을 사용하여 등록된 친구와 가족 구성원을 인식합니다. 사용자는 사랑하는 사람들의 얼굴을 기기에 등록할 수 있고, 이에 따라 링(Ring)에서는 인식된 인물이 도착하면 "엠마가 현관에 있습니다"와 같은 특정 알림을 보낼 수 있습니다. 시스템은 또한 낯선 사람이 감지되었을 때 사용자에게 알림을 주어, 주택 소유자가 신속하게 정보를 바탕으로 결정을 내릴 수 있도록 돕습니다."마찬가지로 중요한 점은, 당신이 모르는 누군가가 머무르고 있을 때 즉시 그들이 낯선 사람임을 알 수 있다는 것입니다,"라고 링의 창립자 제이미 시미노프는 행사에서 언론에 말했습니다.아마존은 또한 "알렉사+ 인사(Alexa+ Greetings)"를 출시하고 있는데, 이 기능은 음성 비서를 스마트 도어벨 안내원으로 탈바꿈시킵니다. 이 기능은 배송을 관리하고, 방문 판매원을 돌려보내며, 방문 목적을 방문객에게 묻는 등의 일을 할 수 있습니다. 이 AI 기반 기능을 통해 주택 소유자는 방문 판매자나 배달원과 직접 상호작용할 필요가 없습니다.커뮤니티 기반 반려동물 찾기 네트워크가장 혁신적인 추가 기능은 "서치 파티(Search Party)"입니다. 이는 커뮤니티 기반 기능으로, Ring 카메라 네트워크를 통해 잃어버린 반려동물을 찾는 데 도움을 줍니다. 사용자가 Ring 앱에서 강아지 분실 신고를 하면, 근처의 야외 Ring 카메라들이 인공지능을 통해 해당 설명과 일치하는 동물을 스캔합니다. 잠재적으로 일치하는 동물이 포착되면, 카메라 소유자는 알림을 받고, 해당 영상을 반려동물 주인과 공유할지 선택할 수 있습니다.이 기능은 11월에 강아지를 대상으로 먼저 출시되며, 이후 고양이와 기타 반려동물로 지원이 확대될 예정입니다. 아마존은 지난 1년 동안 Ring 앱을 통해 백만 건 이상의 반려동물 분실 신고가 접수되었다고 밝혔습니다.새로운 Ring 라인업은 59.99달러의 Indoor Cam Plus부터 499.99달러의 프리미엄 Wired Doorbell Elite까지 다양하며, 4K 모델로는 249.99달러의 Ring Wired Doorbell Pro와 199.99달러의 Outdoor Cam Pro가 포함됩니다. 모든 기기에는 Retinal Vision 기술이 탑재되어, 인공지능을 활용해 영상 품질을 지속적으로 모니터링하고 최적의 화면을 위해 설정을 조정합니다. 카메라들은 10배 줌 기능과 향상된 저조도 성능도 제공합니다.사전 주문은 즉시 가능하며, 서치 파티(Search Party)는 11월에 출시되고 Alexa+ 인사 및 페이스 인식 기능은 12월에 출시될 예정입니다.
610 조회
0 추천
2025.10.02 등록
2025년 9월 30일 화요일 수백만 명의 ChatGPT 사용자가 서비스 접속에 심각한 문제를 겪었습니다. OpenAI는 PST 기준 오전 3시 33분부터 4시 23분까지 50분간 "ChatGPT와 API에서 높은 오류율이 발생했다"고 공식 인정했습니다. 사용자들은 웹사이트와 모바일 앱 모두에서 "Bad gateway" 오류 메시지를 받았고, 파일 업로드 기능도 완전히 중단되었습니다. DownDetector에 따르면 영국에서 5,100건, 미국에서 4,300건 이상의 장애 신고가 접수되어 전 세계적 영향을 보여주었습니다.장애는 실제로 9월 29일 수요일부터 시작된 파일 업로드 문제에서 비롯되었으며, 소셜미디어에서 한 사용자가 "사진 업로드 기능이 제대로 작동하지 않는다"고 OpenAI에 문의하는 게시물을 올렸습니다. OpenAI는 수요일 오후 5시 15분에 "로그인 및 파일 업로드 문제를 해결했다"고 발표했지만, 화요일에 더 큰 규모의 전면 장애가 발생했습니다. 이는 OpenAI 상태 페이지에 따르면 2024년 12월 26일 3시간 장애 이후 가장 큰 규모의 서비스 중단이었습니다.█
630 조회
0 추천
2025.10.01 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입