Loading...

AI 뉴스

샤오미, 로봇과 자동차를 위한 오픈소스 AI 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.11.23 17:01
721 조회
0 추천
0 비추천

본문

179eca808840ce5856d6d8f0d4e339a7_1763884793_6923.png
 

Xiaomi는 2025년 11월 21-22일에 MiMo-Embodied를 공개했으며, 이 중국 기술 기업은 이를 자율주행과 체화된 인공지능을 단일 프레임워크 내에서 성공적으로 통합한 업계 최초의 오픈소스 기반 모델이라고 설명합니다.

이 모델은 29개의 업계 벤치마크에서 최첨단 성능을 달성했으며, 작업 계획, 어포던스 예측, 공간 이해를 포함한 17개의 체화된 AI 테스트에서 새로운 기록을 세웠고, 환경 인식, 상태 예측, 주행 계획에 걸친 12개의 자율주행 벤치마크에서 뛰어난 성과를 보였습니다. Xiaomi는 Hugging Face와 GitHub를 포함한 플랫폼에서 모델과 기술 문서를 완전히 오픈소스로 공개했습니다.


크로스 도메인 AI 과제 해결

MiMo-Embodied는 AI 개발에서 지속적인 과제를 해결하기 위한 Xiaomi의 시도를 나타냅니다: 실내 로봇 지능과 실외 주행 시스템이 인지 능력을 공유할 수 있도록 하는 것입니다. Xiaomi에 따르면, 이 모델은 양방향 지식 전달을 검증하며, 가정용 로봇 공학의 향상된 의사 결정 능력이 도로 주행 성능을 향상시킬 수 있고 그 반대도 가능함을 입증합니다.

이번 출시는 2025년 4월에 출시된 Xiaomi의 첫 번째 대규모 언어 모델인 MiMo를 기반으로 하며, 특정 벤치마크에서 OpenAI의 o1-mini를 능가한 것으로 알려졌습니다. 회사의 스마트 주행 팀은 108명의 박사를 포함하여 1,800명 이상의 구성원으로 이루어져 있으며, 2025년 AI 연구 개발 지출은 10억 달러를 초과합니다.


중국 AI 추진에서의 전략적 포지셔닝

이번 출시는 구현된 지능(embodied intelligence)이 중국의 국가 기술 전략에서 두각을 나타내는 시점에 이루어졌습니다. 2025년 3월, 중국 정부 업무 보고서는 구현된 지능을 미래 산업으로 육성할 것을 명시적으로 요구했습니다. 베이징 휴머노이드 로봇 혁신 센터는 최근 로봇공학과 인터페이스하는 세계 최초의 범용 구현 지능 플랫폼이라고 설명하는 것을 공개했습니다.

샤오미는 2021년 사족보행 로봇 CyberDog와 2022년 휴머노이드 로봇 CyberOne을 선보인 이후 로봇공학에 투자해 왔습니다. 운영 19개월 만에 2025년 3분기에 수익을 낸 이 회사의 전기차 부문은 올해 35만 대 이상의 차량을 인도했으며 연말까지 40만 대를 목표로 하고 있습니다.


댓글 0
전체 1,366 / 22 페이지
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
395 조회
0 추천
2025.12.26 등록
2025년 말, 음악 산업의 지형도를 뒤흔드는 상징적인 사건이 발생했습니다. 세계적인 거대 레이블 워너 뮤직 그룹(WMG)이 생성형 AI 음악 플랫폼 수노(Suno)와 극적인 합의에 도달하며, 적대적 소송 관계를 끝내고 공식적인 파트너십을 체결한 것입니다. 이번 합의는 기술적 혁신과 저작권 보호라는 팽팽한 갈등 사이에서 음악 산업이 나아갈 새로운 공존의 길을 제시하고 있습니다.이번 파트너십의 핵심은 아티스트의 권리를 철저히 보장하는 ‘선택적 참여(Opt-in)’ 모델에 있습니다. 과거 AI 기업들이 저작물을 무단으로 학습시키며 비판을 받았던 것과 달리, 이제 워너 뮤직 소속 아티스트들은 자신의 목소리와 음악적 자산을 AI 학습에 제공할지 여부를 스스로 결정하게 됩니다. 이는 아티스트의 고유한 정체성을 데이터 자산으로 인정하고, 그 활용 과정에서 발생하는 수익을 정당하게 배분하겠다는 의지의 표명입니다.수노는 이번 합의를 기점으로 단순한 생성 도구를 넘어 종합적인 음악 생태계로의 진화를 꾀하고 있습니다. 특히 공연 정보 플랫폼 ‘송킥(Songkick)’을 인수하며 온라인의 AI 창작물과 오프라인의 라이브 공연 경험을 연결하려는 행보는 주목할 만합니다. 또한 무료 사용자의 무분별한 콘텐츠 생성을 제한하고 유료 모델을 강화함으로써, 이른바 ‘AI 슬롭(Slop)’이라 불리는 저품질 콘텐츠의 범람을 막고 시장의 질서를 잡으려는 노력도 병행하고 있습니다.이러한 변화는 음악 산업에 깊은 통찰을 던져줍니다. 무엇보다 이번 사건은 AI 기술의 흐름을 법적으로 막아설 수 없다는 현실을 인정한 레이블들이, 기술을 제도권 안으로 끌어들여 새로운 ‘라이선스 수익 모델’을 창출하는 실리를 택했음을 보여줍니다. 이제 음악은 완성된 결과물을 소비하는 단계를 넘어, 아티스트의 목소리와 스타일 자체가 거래되는 새로운 가치 사슬을 형성하게 되었습니다.결국 이번 합의는 AI가 음악적 영감을 훼손하는 위협이 아니라, 팬들이 아티스트의 자산을 활용해 상호작용할 수 있는 새로운 창작의 도구가 될 수 있음을 시사합니다. 기술의 풍요로움이 인간의 창의성과 결합하여 음악 산업의 가치를 높일 수 있을지, 아니면 단순한 상업적 도구로 전락할지는 향후 구축될 투명한 보상 체계와 윤리적 운영에 달려 있습니다.
382 조회
0 추천
2025.12.26 등록
OpenAI는 “hazelnuts”라는 코드명의 새로운 “Skills” 기능을 ChatGPT에 테스트 중이며, 이를 통해 사용자는 슬래시 명령어를 통해 맞춤 지시사항에 액세스할 수 있고, Skills 편집기와 맞춤 GPT를 스킬로 변환하는 옵션이 제공되며, 2026년 1월에 출시될 것으로 예상됩니다.Skills는 AI 시스템에 특정 능력과 워크플로우를 가르치는 폴더 기반 지시사항으로, 12월 18일 agentskills.io에서 Anthropic이 공개한 오픈 스탠다드를 따르며, OpenAI는 이미 지난주 자사의 Codex 코딩 에이전트에 이를 조용히 도입했습니다.Microsoft, GitHub, 그리고 Cursor와 Goose를 포함한 인기 있는 코딩 에이전트들은 이미 Agent Skills 표준을 통합했으며, 이는 여러 스킬을 효율적으로 함께 쌓을 수 있는 이 접근 방식의 광범위한 업계 채택을 나타냅니다.
398 조회
0 추천
2025.12.25 등록
OpenAI의 GPT-5.2는 실제 테스트에서 이전 버전 대비 미미한 개선만을 제공한 반면, Google의 Gemini 3는 Nano Banana Pro 모델을 통해 속도, 창의적 글쓰기, 이미지 생성에서 명확하게 눈에 띄는 발전을 보여주었습니다.경쟁 압박으로 인해 OpenAI CEO Sam Altman은 Gemini 3의 출시가 다양한 성능 지표에서 GPT-5.1을 능가한 후, 직원들에게 즉각적인 ChatGPT 개선을 우선시하도록 지시하는 “코드 레드” 지침을 발령했습니다.GPT-5.2의 API 가격은 GPT-5.1 대비 40% 인상된 반면, Gemini 3는 더 저렴한 가격을 유지하면서 일반 사용자들이 더 쉽게 알아차릴 수 있는 복잡한 추론 작업에서 일관되게 더 빠르고 정확한 응답을 제공했습니다.
380 조회
0 추천
2025.12.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입