Loading...

AI 뉴스

MIT, AI가 CAD를 작동시켜 스케치를 3D 모델로 변환하는 연구 발표

페이지 정보

작성자 xtalfi
작성일 2025.11.20 03:29
841 조회
0 추천
0 비추천

본문

Untitled-design-2025-11-19T225959.683.jpg

(퍼플렉시티가 정리한 기사)


MIT 엔지니어들은 인간 사용자처럼 컴퓨터 지원 설계 소프트웨어를 작동시키는 AI 시스템을 개발했으며, 이 시스템은 프로그램 내에서 버튼을 클릭하고 메뉴를 탐색하여 2D 스케치를 3D 모델로 자동 변환합니다. 연구팀은 올해 12월 샌디에이고에서 열리는 신경 정보 처리 시스템 학회에서 그들의 연구를 발표할 예정입니다.​

이 시스템은 CAD 모델을 구축하는 데 관련된 모든 마우스 클릭, 드래그, 키 입력을 기록한 41,000개 이상의 비디오를 포함하는 데이터셋인 VideoCAD에 의존합니다. "선 스케치" 또는 "돌출"과 같은 상위 수준의 명령만 캡처한 이전 데이터셋과 달리, VideoCAD는 정확한 픽셀 위치와 UI 작업을 기록하여 AI가 소프트웨어 인터페이스와 정확히 어떻게 상호작용하는지 학습시킵니다.​


CAD의 학습 곡선 해결하기

컴퓨터 지원 설계 소프트웨어는 수천 개의 명령어를 탐색하고 숙련도를 개발하는 데 상당한 시간을 투자해야 하므로 숙달하기가 매우 어려운 것으로 악명 높습니다. MIT 팀은 대학원생 Ghadi Nehme와 부교수 Faez Ahmed가 이끌며, 이러한 진입 장벽을 낮추는 것을 목표로 하고 있습니다.​

Nehme는 성명에서 "AI가 엔지니어의 생산성을 높이고 더 많은 사람들이 CAD에 접근할 수 있도록 만들 기회가 있습니다"라고 말했습니다. Ahmed는 이 기술이 "설계에 대한 진입 장벽을 낮춰 수년간의 CAD 교육을 받지 않은 사람들도 3D 모델을 더 쉽게 만들고 창의성을 발휘할 수 있도록 돕기 때문에 중요합니다"라고 덧붙였습니다.​

연구원들은 이 시스템이 사용자에게 다음 단계를 제안하거나 그렇지 않으면 지루한 수동 클릭이 필요한 반복적인 작업을 자동화할 수 있는 "CAD 부조종사"로 진화할 것으로 예상하고 있습니다. AI는 단순한 브래킷부터 더 복잡한 주택 배치도에 이르기까지 다양한 객체를 성공적으로 처리했으며, 팀은 현재 점점 더 복잡한 설계를 학습시키고 있습니다.​


산업 대응

이 연구에 참여하지 않은 Autodesk Research의 수석 연구 과학자 Mehdi Ataei는 VideoCAD를 "새로운 사용자의 온보딩을 돕고 익숙한 패턴을 따르는 반복적인 모델링 작업을 자동화하는 AI 어시스턴트를 향한 가치 있는 첫걸음"이라고 평가했습니다. 그는 미래의 시스템이 여러 CAD 플랫폼에 걸쳐 작동하고 조립 및 제약 조건과 같은 보다 정교한 작업을 처리할 수 있을 것이라고 언급했습니다.​

이 연구는 스프레드시트에서 데이터를 정리하는 것과 같은 작업을 위해 소프트웨어 프로그램을 사용하도록 훈련된 AI 기반 사용자 인터페이스 에이전트의 최근 발전을 확장합니다. 그러나 CAD는 AI가 특정 도구를 선택하고, 영역을 정의하고, 확대/축소하고, 각도를 조정하고, 형상 작업을 실행해야 하는 훨씬 더 복잡한 과제를 제시합니다.​

대학원생 Brandon Man과 박사후연구원 Ferdous Alam도 이 연구에 기여했습니다.

댓글 0
전체 1,366 / 23 페이지
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
438 조회
0 추천
2025.12.26 등록
2025년 말, 음악 산업의 지형도를 뒤흔드는 상징적인 사건이 발생했습니다. 세계적인 거대 레이블 워너 뮤직 그룹(WMG)이 생성형 AI 음악 플랫폼 수노(Suno)와 극적인 합의에 도달하며, 적대적 소송 관계를 끝내고 공식적인 파트너십을 체결한 것입니다. 이번 합의는 기술적 혁신과 저작권 보호라는 팽팽한 갈등 사이에서 음악 산업이 나아갈 새로운 공존의 길을 제시하고 있습니다.이번 파트너십의 핵심은 아티스트의 권리를 철저히 보장하는 ‘선택적 참여(Opt-in)’ 모델에 있습니다. 과거 AI 기업들이 저작물을 무단으로 학습시키며 비판을 받았던 것과 달리, 이제 워너 뮤직 소속 아티스트들은 자신의 목소리와 음악적 자산을 AI 학습에 제공할지 여부를 스스로 결정하게 됩니다. 이는 아티스트의 고유한 정체성을 데이터 자산으로 인정하고, 그 활용 과정에서 발생하는 수익을 정당하게 배분하겠다는 의지의 표명입니다.수노는 이번 합의를 기점으로 단순한 생성 도구를 넘어 종합적인 음악 생태계로의 진화를 꾀하고 있습니다. 특히 공연 정보 플랫폼 ‘송킥(Songkick)’을 인수하며 온라인의 AI 창작물과 오프라인의 라이브 공연 경험을 연결하려는 행보는 주목할 만합니다. 또한 무료 사용자의 무분별한 콘텐츠 생성을 제한하고 유료 모델을 강화함으로써, 이른바 ‘AI 슬롭(Slop)’이라 불리는 저품질 콘텐츠의 범람을 막고 시장의 질서를 잡으려는 노력도 병행하고 있습니다.이러한 변화는 음악 산업에 깊은 통찰을 던져줍니다. 무엇보다 이번 사건은 AI 기술의 흐름을 법적으로 막아설 수 없다는 현실을 인정한 레이블들이, 기술을 제도권 안으로 끌어들여 새로운 ‘라이선스 수익 모델’을 창출하는 실리를 택했음을 보여줍니다. 이제 음악은 완성된 결과물을 소비하는 단계를 넘어, 아티스트의 목소리와 스타일 자체가 거래되는 새로운 가치 사슬을 형성하게 되었습니다.결국 이번 합의는 AI가 음악적 영감을 훼손하는 위협이 아니라, 팬들이 아티스트의 자산을 활용해 상호작용할 수 있는 새로운 창작의 도구가 될 수 있음을 시사합니다. 기술의 풍요로움이 인간의 창의성과 결합하여 음악 산업의 가치를 높일 수 있을지, 아니면 단순한 상업적 도구로 전락할지는 향후 구축될 투명한 보상 체계와 윤리적 운영에 달려 있습니다.
426 조회
0 추천
2025.12.26 등록
OpenAI는 “hazelnuts”라는 코드명의 새로운 “Skills” 기능을 ChatGPT에 테스트 중이며, 이를 통해 사용자는 슬래시 명령어를 통해 맞춤 지시사항에 액세스할 수 있고, Skills 편집기와 맞춤 GPT를 스킬로 변환하는 옵션이 제공되며, 2026년 1월에 출시될 것으로 예상됩니다.Skills는 AI 시스템에 특정 능력과 워크플로우를 가르치는 폴더 기반 지시사항으로, 12월 18일 agentskills.io에서 Anthropic이 공개한 오픈 스탠다드를 따르며, OpenAI는 이미 지난주 자사의 Codex 코딩 에이전트에 이를 조용히 도입했습니다.Microsoft, GitHub, 그리고 Cursor와 Goose를 포함한 인기 있는 코딩 에이전트들은 이미 Agent Skills 표준을 통합했으며, 이는 여러 스킬을 효율적으로 함께 쌓을 수 있는 이 접근 방식의 광범위한 업계 채택을 나타냅니다.
442 조회
0 추천
2025.12.25 등록
OpenAI의 GPT-5.2는 실제 테스트에서 이전 버전 대비 미미한 개선만을 제공한 반면, Google의 Gemini 3는 Nano Banana Pro 모델을 통해 속도, 창의적 글쓰기, 이미지 생성에서 명확하게 눈에 띄는 발전을 보여주었습니다.경쟁 압박으로 인해 OpenAI CEO Sam Altman은 Gemini 3의 출시가 다양한 성능 지표에서 GPT-5.1을 능가한 후, 직원들에게 즉각적인 ChatGPT 개선을 우선시하도록 지시하는 “코드 레드” 지침을 발령했습니다.GPT-5.2의 API 가격은 GPT-5.1 대비 40% 인상된 반면, Gemini 3는 더 저렴한 가격을 유지하면서 일반 사용자들이 더 쉽게 알아차릴 수 있는 복잡한 추론 작업에서 일관되게 더 빠르고 정확한 응답을 제공했습니다.
423 조회
0 추천
2025.12.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입