AI 뉴스

메타, 객체 감지를 위한 SAM 3 및 SAM 3D AI 모델 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:57
803 조회
0 추천
0 비추천

본문

metaelephants.png

(퍼플렉시티가 정리한 기사)


Meta Platforms, Inc.는 오늘 오픈소스 컴퓨터 비전 모델 컬렉션인 Segment Anything Collection의 최신 버전인 SAM 3와 SAM 3D를 발표했으며, 텍스트 기반 객체 감지 및 3D 재구성 기능을 도입하여 비디오 편집 및 콘텐츠 제작 워크플로우를 혁신할 것이라고 밝혔습니다.​

이번 릴리스는 사용자가 수동 선택이 아닌 자연어 프롬프트를 사용하여 객체를 감지하고 분할할 수 있도록 함으로써 이전 Segment Anything 모델과는 다른 방향을 제시합니다. Meta의 발표에 따르면, SAM 3는 "노란색 스쿨버스" 또는 "빨간 야구모자를 쓰지 않고 앉아 있는 사람들"과 같은 텍스트 문구로 설명된 객체의 모든 인스턴스를 식별할 수 있습니다. SAM 3D는 단일 이미지에서 객체, 사람 및 장면의 3차원 모델을 재구성합니다.​


텍스트 프롬프트와 향상된 정확도

SAM 3는 Meta의 연구 논문에 따르면 LVIS 벤치마크에서 47.0의 제로샷 마스크 평균 정밀도를 달성하여 기존 시스템 대비 22% 향상된 성능을 나타냅니다. 이 모델은 H200 GPU에서 프레임당 약 30밀리초로 이미지를 처리하며 동시에 100개 이상의 객체를 처리합니다.​

Meta는 발표에서 "SAM 3는 이러한 제한을 극복하여 훨씬 더 광범위한 텍스트 프롬프트를 수용합니다"라고 밝혔습니다. 회사는 Roboflow와 협력하여 개발자들이 특정 애플리케이션을 위해 데이터에 주석을 달고, 미세 조정하며, SAM 3를 배포할 수 있도록 했습니다.​


메타 제품 전반에 걸친 즉각적인 통합

Meta는 이미 자사의 제품 생태계 전반에 두 모델을 배포하고 있습니다. SAM 3는 회사의 Edits 비디오 제작 앱과 Vibes 플랫폼에서 새로운 효과를 지원하여, 크리에이터들이 콘텐츠 내 특정 객체에 수정을 적용할 수 있도록 합니다. SAM 3D는 Facebook Marketplace의 새로운 "방에서 보기" 기능을 구현하여, 사용자들이 구매 전에 가구 및 홈 데코 아이템을 자신의 공간에서 시각화할 수 있도록 돕습니다.​​

두 모델 모두 Meta의 새로운 Segment Anything Playground 플랫폼을 통해 접근할 수 있으며, 기술적 전문 지식이 필요하지 않습니다. Meta는 SAM 3 모델 가중치, 평가 벤치마크 및 연구 논문을 공개하고 있으며, SAM 3D 모델 체크포인트와 추론 코드는 연구 커뮤니티와 공유되고 있습니다.

댓글 0
전체 1,366 / 18 페이지
구글이오픈소스모델인'젬마3(Gemma3)'의내부작동원리를분석할수있는도구인'젬마스코프2(GemmaScope2)'를출시하며AI의'블랙박스'현상을규명하기위한연구결과를공개했습니다.이도구모음은인공지능이탈옥이나환각증상을보이거나아첨하는태도를취할때내부의어떤기능이활성화되고네트워크를통해어떻게전달되는지를실시간으로추적하여AI의안전성과정렬상태를정밀하게검사할수있도록돕습니다.특히모든레이어에포함된'트랜스코더'기술을통해인공지능내부에서정보가어떻게전파되고계산되는지그구체적인경로를파악할수있게함으로써,AI모델의신뢰도를높이고윤리적인행동제어를가능하게하는데기여할것으로기대됩니다.
406 조회
0 추천
2025.12.29 등록
구글은생성AI가단순히텍스트답변을내놓는것을넘어,대화맥락에맞는사용자인터페이스(UI)를직접생성할수있도록돕는오픈소스프로토콜'A2UI'를출시했습니다.기존에는AI가HTML코드등을보내UI를구현하려했으나,보안위험과앱디자인과의부조화문제가있었습니다.A2UI는UI구성요소를'데이터(JSON)'형태로전달하여각앱의프레임워크에맞춰안전하고자연스럽게렌더링하도록설계되었습니다.이프로토콜의가장큰특징은보안성과유연성입니다.실행가능한코드가아닌사전에약속된컴포넌트정보만주고받기때문에임의스크립트실행과같은보안공격을방지할수있습니다.또한앵귤러,플러터,리액트등다양한개발환경에서재사용이가능하며,AI가계산을수행하는동안UI가실시간으로구성되는스트리밍방식의점진적렌더링을지원해사용자경험을크게향상시킵니다.A2UI는여러기업의AI에이전트들이협업하는'멀티에이전트'환경에서복잡한작업을효율적으로처리하기위해개발되었습니다.예를들어레스토랑예약처럼텍스트로만대화하기번거로운상황에서AI가즉시예약폼이나버튼을생성해사용자에게보여줌으로써작업속도를높여줍니다.구글은이표준기술을통해서로다른시스템의AI들이안전하고일관된방식으로사용자와소통할수있는기반을마련할계획입니다.
417 조회
0 추천
2025.12.28 등록
미국이인공지능(AI)패권전쟁에서초기승기를잡았음에도불구하고,화석연료중심의에너지정책때문에결국중국에역전당할수있다는경고가나왔습니다.트럼프행정부는생산성회복을위해AI발전을강조하고있지만,재생에너지를확대하는중국과달리화석연료의존도를높이고있어장기적인비용경쟁력에서뒤처질위험에처해있습니다.중국은태양광과해상풍력등재생에너지를빠르게늘리며AI전력비용을낮추고있는반면,미국은2030년대까지데이터센터전력의상당부분을천연가스등비싼화석연료에의존할전망입니다.에너지비용곡선이하락하는재생에너지와달리화석연료는비용압박이커질수밖에없어,저렴한에너지를확보한중국AI산업이가격경쟁력에서유리한고지를점할것으로분석됩니다.또한,화석연료발전과데이터센터운영에필요한막대한용수공급문제도미국AI산업의발목을잡는요인으로지적되었습니다.현재미국신규데이터센터의상당수가물부족지역에위치해있어,향후물부족심화와식량안보위기가사회적비용상승으로이어져AI발전을가로막는경제적부담이될수있다는진단입니다.
408 조회
0 추천
2025.12.28 등록
많은기업이인건비를줄이기위해인공지능(AI)도입을서두르고있지만,직원의역할을지나치게단순화해판단하는'도어맨의오류'에빠져오히려비용이증가하는부작용을겪고있습니다.이는겉으로드러난핵심업무만자동화하면인간을완전히대체할수있다는잘못된믿음에서비롯됩니다.실제로AI상담원을도입했던금융권이나패스트푸드체인등에서고객불만이폭증하고서비스품질이저하되는사례가잇따르고있습니다.인간직원이제공하던섬세한응대나맥락이해같은'보이지않는가치'가사라지면서,결국해고했던직원을복귀시키거나서비스를재검토하는등추가비용을지불하게된것입니다.전문가들은AI가인간을완전히대체하기보다인간의판단력과결합될때가장큰효과를낼수있다고강조합니다.효율성만을기준으로기술을도입하기에앞서,해당직무가실제현장에서어떤복합적인가치를창출하는지깊이이해하는능력이기업경영의핵심과제로떠오르고있습니다.
410 조회
0 추천
2025.12.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입