Loading...

AI 뉴스

UCSD 엔지니어들이 AI 모델 맞춤화 비용을 300배 절감

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:39
211 조회
0 추천
0 비추천

본문

AI_major_rotator_and_thumb.jpg

(퍼플렉시티가 정리한 기사)

캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​

BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.

 

특화된 AI 애플리케이션의 주요 비용 절감

 

UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​

"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​

전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.

 

혁신적인 이중 레벨 최적화 접근법

 

BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​

이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​

이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.

댓글 0
전체 720 / 49 페이지
(퍼플렉시티가 정리한 기사)국내 게임업계 매출 2위 크래프톤이 23일 'AI 퍼스트' 기업으로의 전환을 공식 선언하고 1000억원 이상의 대규모 투자를 단행한다고 발표했다. 김창한 크래프톤 대표는 사내 소통 프로그램인 '크래프톤 라이브 토크'에서 "오늘을 기점으로 크래프톤은 에이전틱 AI를 중심으로 업무를 자동화하고, 구성원은 창의적 활동과 복잡한 문제 해결에 집중하는 AI 중심 경영 체계를 본격화할 것"이라고 밝혔다.GPU 클러스터 구축과 대규모 투자 계획크래프톤은 약 1000억원을 투자해 GPU 클러스터를 구축할 방침이다. 이 인프라는 정교한 추론과 반복 계획이 필요한 다단계 과제를 지원하며, 에이전틱 AI 구현을 가속하는 기반이 될 예정이다. 회사는 해당 인프라를 통해 AI 워크플로우 자동화뿐 아니라 AI 연구개발, 인게임 AI 서비스 강화를 추진한다.​특히 엔비디아 B300 기반 GPU 클러스터 구축에 투자하며, 2026년 하반기까지 AI 플랫폼과 데이터 통합·자동화 기반을 완성해 전사 AI 운영 인프라를 확립할 계획이다. 또한 2026년부터 매년 약 300억원의 예산을 편성해 구성원들이 다양한 AI 툴을 직접 활용하고 업무에 적용할 수 있도록 지원한다. 이는 기존 AI 서비스 지원 규모의 10배 이상 증가한 수준이다.전사적 조직 혁신과 문화 변화크래프톤은 'AI 퍼스트'의 전사 내재화를 위해 인사 제도와 조직 운영 체계를 전면 개편한다. 실행 전략은 ▲AI 퍼스트 문화 정착 ▲업무 방식·조직 혁신 ▲새로운 도전·성장 기회 제공의 세 가지 축으로 구성된다.​회사는 사내 플랫폼 'AI 러닝 허브'를 중심으로 AI 학습과 업무 도구 활용을 지원하고, 'AI 라운드테이블'과 'AI 해커톤'을 운영해 직군과 조직을 넘나드는 AI 활용 문화를 확산시킬 예정이다. 조직 관리 범위를 확장해 구성원이 더 큰 단위의 목표와 성과를 주도적으로 이끌 수 있도록 지원하며, AI 전문 인력으로 구성된 연구개발 조직에는 별도의 인력 운영 체계를 도입한다.​김창한 대표는 "AI 퍼스트 전략을 통해 구성원 개개인의 성장 기회를 넓혀 플레이어 경험 중심의 창의적 시도를 확대하고, 게임 산업 전반의 AI 혁신을 선도하겠다"며 "AI 중심으로 일하는 운영 기준을 정립해 글로벌 게임 산업에서 참고할 수 있는 모범사례를 제시하겠다"고 강조했다.
161 조회
0 추천
2025.10.23 등록
(퍼플렉시티가 정리한 기사)지멘스 디지털 인더스트리 소프트웨어는 오늘 인공지능 기능을 도입한 Designcenter Solid Edge 2026을 출시했다고 발표했습니다. 이번 소프트웨어 신제품에는 2D 도면 뷰의 최대 80%를 자동으로 생성하고, 지능형 제약 조건 적용을 통해 조립 프로세스를 간소화하는 AI 기반 도구들이 포함되어 있습니다.​AI 통합이 생산성 향상을 이끕니다2026년 업데이트의 핵심은 세 가지 주요 AI 기반 기능의 통합입니다. Magnetic Snap Assembly는 머신러닝을 활용하여 조립 설계 중에 부품을 배치할 때 여러 제약 조건을 자동으로 감지하고 적용함으로써, 이 과정을 몇 배나 빠르게 진행할 수 있도록 합니다. 자동 도면 작성 기능은 AI를 이용해 직교, 파손, 등각 투시도를 치수와 함께 자동 생성하며, 사용자 입력을 최소화합니다.​또한 이 소프트웨어는 설계 환경 내에 직접 내장된 대화형 AI 챗봇인 Design Copilot을 도입하여 자연어 입력을 활용한 실시간, 상황 인식 지원을 제공합니다. Siemens Digital Industries Software의 Mainstream Engineering 수석 부사장 John Miller는 “Designcenter Solid Edge 2026과 Designcenter X Solid Edge를 통해 진화하는 현대 엔지니어링 팀의 요구에 부응하는 더욱 스마트하고 연결된 설계 경험을 제공하고 있다”고 밝혔습니다.클라우드 우선 접근 방식이 협업을 강화합니다이번 출시에는 데스크톱과 클라우드 환경 전반에서 하이브리드 워크플로우를 가능하게 하는 클라우드 기반 동반자, Designcenter X Solid Edge가 포함되어 있습니다. 이 플랫폼은 실시간 협업, 디바이스 동기화, 그리고 분산 엔지니어링 팀을 위해 설계된 유연한 라이선스 모델을 지원합니다. 브라질의 장비 제조업체 Siltomac Group은 초기 도입 기업으로서 상당한 생산성 향상을 보고했습니다. Siltomac의 COO인 Mariana Rodrigues는 “새로운 AI 기반 Magnetic Snap 기능 덕분에 조립 설계 속도가 몇 배나 빨라질 수 있습니다”라고 말했습니다.​이 소프트웨어는 사용자 경험을 향상시키는 다양한 요소들도 갖추고 있으며, 눈의 피로를 줄이는 다크 테마, 확장 가능한 SVG 아이콘, 새롭게 디자인한 명령 바 등이 포함되어 있습니다. 클라우드 기반 설정 동기화 기능은 모든 디바이스에서 일관된 환경을 제공하며, 가치 기반 라이선스는 실제 사용 패턴에 맞춰 토큰 기반 접근을 지원합니다. 이 업데이트는 Siemens Xcelerator 포트폴리오의 일부로 즉시 제공되며, 회사는 2035년까지 227억 달러에 이를 것으로 예상되는 성장하는 CAD 소프트웨어 시장에서 경쟁력을 갖추게 됩니다.
168 조회
0 추천
2025.10.23 등록
(퍼플렉시티가 정리한 기사)Tesla는 수요일 2025년 3분기 실적 발표에서 차세대 AI5 칩이 이전 제품보다 최대 40배 향상된 성능을 제공할 것이라고 발표하며, 반도체 독립성을 향한 회사의 노력에서 중요한 도약을 이뤘습니다. CEO 일론 머스크는 삼성과 TSMC 모두가 미국 내 시설에서 이 칩을 제조할 것이며, Tesla는 차량, 로봇 및 데이터 센터 전반에 배치하기 위해 "초과 공급"을 목표로 하고 있다고 밝혔습니다.맞춤형 설계를 통한 혁신적인 성능 향상AI5 칩은 테슬라의 2024년 주주총회에서 처음 공개되었으며, 머스크는 실적 발표에서 이를 "놀라운 설계"라고 부르며, 성능 향상이 하드웨어와 소프트웨어 요구사항 모두에 대한 테슬라의 깊은 이해에서 비롯된 것임을 강조했습니다. "일부 지표에 따르면, AI5 칩은 AI4 칩보다 40배 더 우수할 것입니다"라고 머스크는 투자자들에게 말하며, 이러한 극적인 개선이 테슬라의 특정 사용 사례에 맞춘 칩의 맞춤 최적화 덕분이라고 설명했습니다.​아키텍처 발전 사항으로는 AI4 대비 8배 더 많은 원시 컴퓨팅 성능, 9배 더 많은 메모리, 그리고 5배 향상된 메모리 대역폭이 포함됩니다. 테슬라는 AI4 칩의 병목 현상을 제거하여 40배의 성능 향상을 달성했으며, 특히 현재 40단계의 에뮬레이션이 필요한 SoftMax 연산이 AI5에서는 단 몇 단계로 네이티브로 실행될 수 있게 되었습니다. 이 칩은 또한 실제 AI 워크로드에 최적화된 혼합 정밀도 모델과 희소 텐서 연산에 대한 네이티브 지원을 제공합니다.전략적 제조 파트너십 및 시장 포지셔닝테슬라가 AI5 생산을 삼성과 TSMC로 분산하기로 한 결정은 이전에 AI5 제조를 TSMC에만 맡기고 삼성은 차세대 AI6 칩을 담당하도록 했던 초기 계획에서 전환된 것입니다. 이러한 이중 파운드리 접근 방식은 공급망 회복력을 보장하고 테슬라가 칩 과잉 공급 목표를 달성할 수 있도록 합니다. 머스크는 "우리의 명확한 목표는 AI5 칩의 과잉 공급을 확보하는 것입니다"라고 말하며, 차량이나 테슬라의 옵티머스 로봇에 사용되지 않는 여분의 칩은 회사의 확장되는 데이터 센터 운영에 활용될 것이라고 설명했습니다.​이 전략은 엔비디아와의 파트너십을 유지하면서 테슬라의 광범위한 반도체 독립 노력을 반영합니다. 머스크는 테슬라가 엔비디아를 데이터 센터 하드웨어 공급업체로 대체할 계획이 없으며, 대신 AI5 칩을 엔비디아 시스템과 "함께" 사용할 것이라고 명확히 했습니다. 테슬라는 현재 엔비디아 H100 칩 81,000개에 해당하는 컴퓨팅 성능을 갖춘 데이터 센터를 운영하고 있습니다.​​AI5 칩은 전통적인 GPU와 이미지 신호 프로세서를 포함한 레거시 구성 요소를 제거하여, 머스크의 말에 따르면 본질적으로 "GPU 자체"가 됩니다. 이 간소화된 아키텍처는 머스크가 예측하는 "와트당 최고의 성능, 아마도 2배 또는 3배 그리고 AI에 대한 달러당 최고의 성능, 아마도 10배"를 가능하게 합니다.
168 조회
0 추천
2025.10.23 등록
(퍼플렉시티가 정리한 기사)보안 연구원들은 OpenAI의 새로운 ChatGPT Atlas 브라우저 출시 24시간도 채 되지 않아 심각한 취약점을 발견했으며, AI 기반 브라우저가 기존 웹 보호 기능으로는 해결할 수 없는 전례 없는 보안 위험을 초래한다고 경고했습니다.즉각적인 취약점 노출2025년 10월 21일에 출시된 이 브라우저는 이미 보안 연구자들에 의해 취약점이 발견되었습니다. 트위터 사용자 @elder_plinius는 Atlas Agent를 속여 사용자가 인지하지 못하는 사이에 악성 피싱 링크를 복사하도록 만드는 "클립보드 인젝션" 공격을 시연했습니다.​Brave Software 연구원들은 Atlas와 같은 AI 브라우저가 웹사이트에 숨겨진 악성 명령어가 AI 어시스턴트를 조작할 수 있는 프롬프트 인젝션 공격에 취약하다는 것을 보여주는 상세한 연구 결과를 발표했습니다. Brave의 개인정보 보호 및 보안 부사장인 Shivan Kaul Sahib는 "AI 어시스턴트가 신뢰할 수 없는 웹페이지 콘텐츠의 악성 명령어를 따를 때, 동일 출처 정책이나 교차 출처 리소스 공유와 같은 전통적인 보호 장치들은 모두 사실상 무용지물이 됩니다"라고 말했습니다.​이러한 취약점으로 인해 공격자들은 흰색 배경에 흰색 텍스트, HTML 주석, 또는 이미지 내의 거의 보이지 않는 텍스트를 포함한 기술을 사용하여 명령어를 삽입할 수 있습니다. 시연에서 연구원들은 Reddit 댓글에 숨겨진 명령어가 AI 브라우저로 하여금 계정 페이지로 이동하고, 이메일 주소를 추출하며, 인증 코드를 위해 Gmail에 접근하고, 자격 증명을 댓글로 게시하도록 만들 수 있음을 보여주었습니다.OpenAI가 위험성을 인정하다OpenAI의 최고 정보 보안 책임자인 Dane Stuckey는 보안 우려 사항에 대해 직접 언급하며, ChatGPT 에이전트가 "여전히 (때때로 놀라운!) 실수를 할 수 있으며, 잘못된 항목을 구매하려고 하거나 중요한 작업을 수행하기 전에 사용자와 상의하지 않을 수 있다"고 밝혔습니다. 회사는 에이전트가 "웹페이지나 이메일과 같은 곳에 숨겨져 있을 수 있으며, ChatGPT 에이전트의 의도된 동작을 무효화할 의도로 숨겨진 악의적인 지시에 취약하다"는 점을 인정했습니다.​OpenAI의 문서에 따르면, 이러한 공격은 "로그인한 사이트에서 데이터를 탈취하거나 의도하지 않은 작업을 수행하게 만들 수 있다"고 합니다. 회사는 에이전트 작업을 활성 브라우저 탭으로 제한하고 금융 기관과 같은 민감한 사이트에서의 작업에 대해 사용자 승인을 요구하는 것을 포함한 안전 장치를 구현했습니다.전문가들, 위험을 '극복 불가능'하다고 지적보안 연구원 Simon Willison은 개인정보 보호 및 보안 위험이 "극복할 수 없을 정도로 높아 보인다"고 설명했습니다. 그는 Atlas의 프롬프트 인젝션 공격에 대한 방어책에 대한 자세한 설명이 부족하다고 비판하며, "현재로서는 주요 방어책이 사용자가 에이전트 모드가 수행하는 작업을 항상 주의 깊게 지켜보는 것에 의존하는 것처럼 보인다"고 지적했습니다.​개인화된 제안을 제공하기 위해 브라우징 행동을 추적하는 브라우저의 "Memories" 기능은 추가적인 개인정보 보호 우려를 제기했습니다. 개인정보 보호 전문가들은 Atlas가 AI 대화, 웹 상호작용 및 개인 데이터 수집을 단일 인터페이스로 결합함으로써 Google Chrome이 달성하는 것을 넘어서는 사용자 상호작용에 대한 "전면적인 감시"를 생성한다고 경고합니다.​Atlas는 현재 macOS에서만 실행되며, Windows, iOS 및 Android 버전이 계획되어 있습니다. 브라우저의 에이전트 모드는 초기 출시 단계 동안 ChatGPT Plus 및 Pro 구독자에게만 제한됩니다.
172 조회
0 추천
2025.10.23 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입