Loading...

AI 뉴스

메타, 객체 감지를 위한 SAM 3 및 SAM 3D AI 모델 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:57
725 조회
0 추천
0 비추천

본문

metaelephants.png

(퍼플렉시티가 정리한 기사)


Meta Platforms, Inc.는 오늘 오픈소스 컴퓨터 비전 모델 컬렉션인 Segment Anything Collection의 최신 버전인 SAM 3와 SAM 3D를 발표했으며, 텍스트 기반 객체 감지 및 3D 재구성 기능을 도입하여 비디오 편집 및 콘텐츠 제작 워크플로우를 혁신할 것이라고 밝혔습니다.​

이번 릴리스는 사용자가 수동 선택이 아닌 자연어 프롬프트를 사용하여 객체를 감지하고 분할할 수 있도록 함으로써 이전 Segment Anything 모델과는 다른 방향을 제시합니다. Meta의 발표에 따르면, SAM 3는 "노란색 스쿨버스" 또는 "빨간 야구모자를 쓰지 않고 앉아 있는 사람들"과 같은 텍스트 문구로 설명된 객체의 모든 인스턴스를 식별할 수 있습니다. SAM 3D는 단일 이미지에서 객체, 사람 및 장면의 3차원 모델을 재구성합니다.​


텍스트 프롬프트와 향상된 정확도

SAM 3는 Meta의 연구 논문에 따르면 LVIS 벤치마크에서 47.0의 제로샷 마스크 평균 정밀도를 달성하여 기존 시스템 대비 22% 향상된 성능을 나타냅니다. 이 모델은 H200 GPU에서 프레임당 약 30밀리초로 이미지를 처리하며 동시에 100개 이상의 객체를 처리합니다.​

Meta는 발표에서 "SAM 3는 이러한 제한을 극복하여 훨씬 더 광범위한 텍스트 프롬프트를 수용합니다"라고 밝혔습니다. 회사는 Roboflow와 협력하여 개발자들이 특정 애플리케이션을 위해 데이터에 주석을 달고, 미세 조정하며, SAM 3를 배포할 수 있도록 했습니다.​


메타 제품 전반에 걸친 즉각적인 통합

Meta는 이미 자사의 제품 생태계 전반에 두 모델을 배포하고 있습니다. SAM 3는 회사의 Edits 비디오 제작 앱과 Vibes 플랫폼에서 새로운 효과를 지원하여, 크리에이터들이 콘텐츠 내 특정 객체에 수정을 적용할 수 있도록 합니다. SAM 3D는 Facebook Marketplace의 새로운 "방에서 보기" 기능을 구현하여, 사용자들이 구매 전에 가구 및 홈 데코 아이템을 자신의 공간에서 시각화할 수 있도록 돕습니다.​​

두 모델 모두 Meta의 새로운 Segment Anything Playground 플랫폼을 통해 접근할 수 있으며, 기술적 전문 지식이 필요하지 않습니다. Meta는 SAM 3 모델 가중치, 평가 벤치마크 및 연구 논문을 공개하고 있으며, SAM 3D 모델 체크포인트와 추론 코드는 연구 커뮤니티와 공유되고 있습니다.

댓글 0
전체 1,366 / 42 페이지
삼성전자가 차세대 고대역폭메모리(HBM4)의 내부 성능 테스트를 마치고 12월 2일 생산준비승인(PRA)을 통과하며 본격 양산 준비를 완료했다.삼성은 10나노 6세대 D램과 4나노 파운드리 공정을 활용해 엔비디아가 요구한 동작 속도 초당 11기가비트 이상을 달성했으며, 지난달 국제고체회로학회에서 36GB 용량과 초당 3.3TB 대역폭의 HBM4를 공개했다.현재 엔비디아 등 주요 고객사에 샘플을 보내 품질 테스트를 진행 중이며, 업계는 이르면 이달 내 최종 승인을 받아 내년 차세대 GPU ‘루빈’에 납품될 것으로 전망하고 있다.
485 조회
0 추천
2025.12.04 등록
Googl은 Drive에 “Gemini의 인사이트” 패널을 도입했습니다. 이 패널은 폴더 콘텐츠의 요약을 자동으로 생성하며, 사용자가 폴더를 열 때 표시되는 기존의 가로형 “넛지(nudges)“를 AI 기반의 능동적 개요로 대체합니다.이 기능은 Rapid Release 도메인의 경우 12월 2일부터 출시되기 시작했으며, Scheduled Release 도메인의 경우 12월 9일부터 시작됩니다. Google Docs, Sheets, Slides, PDF 및 하위 폴더를 분석할 수 있으며, 사용자는 “Gemini로 탐색” 사이드 패널을 통해 후속 질문을 할 수 있습니다.액세스는 Google Workspace Business 및 Enterprise 등급, Google One AI Premium, Google AI Pro for Education 사용자를 포함한 유료 구독자로 제한되며, 이는 AI 검색 기능을 프리미엄 페이월 뒤에 배치하는 업계의 광범위한 추세를 따릅니다.
479 조회
0 추천
2025.12.04 등록
• 현대자동차·기아가 3일 일본 도쿄에서 열린 세계 3대 로봇 박람회 ’일본 국제 로봇 전시회 2025(IREX)’에서 차세대 자율주행 로봇 플랫폼 ’모베드(MobED)’의 양산형 모델을 최초 공개했다.• 모베드는 2022년 CES에서 콘셉트로 처음 선보인 후 약 3년간 개발을 거쳐 양산 단계에 도달했으며, 자체 개발한 ‘DnL’ 모듈을 통해 경사로나 최대 20cm 높이의 연석 구간에서도 균형을 유지하며 주행할 수 있다.• 현대차·기아는 베이직과 프로 두 모델로 출시되는 모베드를 내년 상반기부터 판매할 예정이며, 물류·배송·촬영 등 다양한 산업 분야에서 활용될 것으로 기대된다.
520 조회
0 추천
2025.12.03 등록
YouTube는 수백만 명의 크리에이터를 대상으로 AI 딥페이크 감지 도구를 확대 적용했으며, 크리에이터들에게 정부 발급 신분증과 생체 인식 얼굴 영상을 제출하도록 요구해 AI가 생성한 콘텐츠에서 본인 이미지의 무단 사용 여부를 식별하게 했습니다[cnbc +1].전문가들은 Google의 개인정보 처리방침 문구가 회사가 크리에이터의 생체 정보를 AI 모델 학습에 사용할 수 있도록 허용할 수도 있다고 경고했으나, YouTube는 CNBC에 해당 방식으로 사용한 적이 없으며 도구의 문구를 검토 중이지만 기본 정책은 유지하고 있다고 밝혔습니다[cnbc].인물 유사성 보호업체인 Vermillio와 Loti는 고객들에게 해당 프로그램 등록을 자제하라고 권고했으며, 경영진은 AI 시대에 크리에이터들이 가장 중요한 자산이 될 수 있는 자신의 이미지 통제권을 잃을 위험이 있다고 주의했습니다[cnbc].
520 조회
0 추천
2025.12.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입