Loading...

AI 뉴스

UCSD 엔지니어들이 AI 모델 맞춤화 비용을 300배 절감

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:39
721 조회
0 추천
0 비추천

본문

AI_major_rotator_and_thumb.jpg

(퍼플렉시티가 정리한 기사)

캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​

BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.

 

특화된 AI 애플리케이션의 주요 비용 절감

 

UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​

"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​

전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.

 

혁신적인 이중 레벨 최적화 접근법

 

BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​

이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​

이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.

댓글 0
전체 1,248 / 214 페이지
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 올트먼은 두바이에서 열린 GITEX Global 2025에서 자사의 야심찬 인프라 전략을 제시하며, 인공지능이 세계가 기술 시스템을 구축하고 운영하는 방식을 근본적으로 변화시킬 미래를 예측했습니다. 10월 14일 기술 컨퍼런스에 가상으로 참석한 올트먼은 지능의 비용이 결국 에너지 비용과 수렴하게 될 것이며, 이는 AI가 전 세계적으로 배포되는 방식에 있어 중추적인 변화를 의미한다고 강조했습니다.인프라 확장 및 전략적 파트너십Altman은 OpenAI가 향후 1~2년간 AI 모델의 기하급수적 성장을 지원하기 위해 업계 전반의 협력이 필요한 "매우 공격적인 인프라 투자"를 진행하고 있다고 밝혔다. 이러한 대규모 투자 전략은 이미 여러 주요 파트너십으로 구체화되었으며, 최근와의 협력을 통해 10기가와트 규모의 맞춤형 AI 가속기를 배치하기로 했고, 2026년 하반기부터 배치가 시작될 예정이다.또한 회사는 AMD와 다년간 계약을 체결하여 6기가와트 규모의 GPU를 배치하기로 했으며, 2026년에 1기가와트부터 시작할 예정이다. 이러한 파트너십은 OpenAI가 연구소에서 Altman이 설명한 "AI 제국"이라는 수직 통합 기업으로 전환하고 있음을 보여주며, 기본 컴퓨팅 파워부터 상위 계층 애플리케이션까지 역량을 통제하고 있다.UAE 파트너십 및 스타게이트 프로젝트OpenAI는 G42, Oracle, Nvidia, Cisco 및 SoftBank와의 파트너십을 통해 UAE를 Stargate 데이터 인프라 프로젝트의 첫 번째 해외 사이트로 선정했습니다. 계획된 5기가와트 UAE 캠퍼스의 첫 200메가와트는 내년에 가동될 것으로 예상되며, G42의 Talal Al Kaissi가 GITEX에서 일정을 확인했습니다.G42 CEO Peng Xiao와의 대화에서 Altman은 AI가 일상 생활에 어떻게 자리 잡았는지 강조했으며, ChatGPT는 현재 전 세계 인구의 약 10%에 해당하는 8억 명 이상의 주간 활성 사용자를 보유하고 있습니다. Xiao는 ChatGPT가 500개의 맞춤형 프롬프트를 통해 아부다비 부통치자이자 G42 회장인 Sheikh Tahnoon의 집 설계를 도왔다고 밝혔습니다.자가 복제 인프라에 대한 비전아마도 가장 놀라운 것은 AI가 곧 데이터 센터와 로봇이 자율적으로 스스로를 구축하고 복제할 수 있게 할 것이라는 Altman의 예측이었습니다. "다른 데이터 센터를 구축할 수 있는 데이터 센터는 그리 멀지 않았습니다"라고 그는 말하며, 이를 기술 환경에서 가장 논의가 부족한 변화 중 하나로 설명했습니다. 이 비전은 로봇이 다른 로봇을 제작하는 것으로 확장되며, 그는 이를 기계가 인지적 작업과 물리적 창조 작업을 모두 처리하는 새로운 산업 자동화 단계라고 불렀습니다.Altman과 Xiao는 글로벌 "AI 격차"를 방지하기 위해서는 지능을 모든 곳에서 풍부하고 접근 가능하게 만들어 전기와 유사한 공공재로 취급해야 한다는 데 동의했습니다. Xiao가 표현한 것처럼, UAE는 "석유 배럴 수출에서 지능 토큰 배포로" 전환하고 있으며, 이는 지능 기반 경제로의 광범위한 전환을 반영합니다.
1143 조회
0 추천
2025.10.15 등록
(퍼플렉시티가 정리한 기사)AI 스타트업 Lila Sciences는 Nvidia의 벤처 투자 부문이 주도한 시리즈 A 연장 라운드에서 1억 1,500만 달러를 유치하여 회사 가치가 13억 달러를 넘어섰다고 오늘 발표된 로이터 보도에 따르면. 이번 투자로 Lila의 시리즈 A 총 투자금은 3억 5,000만 달러에 이르렀으며, 2023년 설립 이후 총 조달 자본은 5억 5,000만 달러가 되었다.과학적 초지능 플랫폼이 형태를 갖추다Geoffrey von Maltzahn과 Noubar Afeyan이 Flagship Pioneering을 통해 설립한 Lila Sciences는 특화된 AI 모델과 자동화된 실험실을 결합하여 "과학적 초지능"을 구축하는 것을 목표로 합니다. 이 회사의 접근 방식은 일부 전문가들이 거의 고갈되었다고 주張하는 인터넷 기반 학습 데이터에 의존하기보다는 새로운 실험을 통해 독점적인 과학 데이터를 생성하는 데 중점을 두고 있습니다.이 스타트업은 최근 매사추세츠주 케임브리지에서 235,500평방피트 규모의 임대 계약을 체결했으며, 이는 올해 그레이터 보스턴 지역에서 가장 큰 실험실 임대 계약 중 하나입니다. "AI 과학 공장"이라 불리는 이 시설들은 AI가 제어하는 로봇 장비를 갖추고 있어 실험을 지속적으로 수행합니다. 회사는 자사의 플랫폼이 이미 생명과학, 화학, 재료 분야에서 수천 건의 발견을 이루었다고 주장합니다.연구실을 넘어 확장하기Lila는 기업용 소프트웨어를 통해 AI 모델과 자동화된 실험실에 대한 접근을 제공함으로써 플랫폼을 상업화할 계획입니다. 이 기술은 에너지, 반도체, 제약 분야의 기업들로부터 관심을 받았지만, 구체적인 고객명은 공개되지 않았습니다. 전통적인 신약 개발 회사들과 달리, Lila는 분자를 직접 임상시험에 진입시키지 않고 자사 플랫폼을 사용하는 다른 기업 및 스타트업과 파트너십을 맺을 예정입니다.이번 투자 유치는 AI 기반 과학적 발견에 대한 벤처 캐피털의 관심이 증가하고 있음을 반영합니다. 지난달, Google DeepMind와 OpenAI 출신 연구자들이 설립한 AI 스타트업 Periodic Labs는 AI 과학자를 개발하기 위해 3억 달러를 조달했습니다. Lila의 투자자로는 Flagship Pioneering, General Catalyst, 그리고 Abu Dhabi Investment Authority의 자회사가 포함됩니다.
1149 조회
0 추천
2025.10.15 등록
(퍼플렉시티가 정리한 기사)Oracle은 월요일에 Oracle AI Factory를 출시했습니다. 이는 기업들이 인공지능 솔루션을 신속하게 구현하고 운영 전반에 걸쳐 측정 가능한 비즈니스 성과를 달성할 수 있도록 설계된 포괄적인 서비스 제품군입니다.이 새로운 제품은 AI 교육 프로그램, 구현 플레이북, 고객 성공 관리자, 기술 전문가, 그리고 글로벌 AI 고객 우수성 센터를 하나의 서비스 패키지로 묶었습니다. Oracle은 AI Factory를 기업의 AI 야망과 실제 배포 사이의 격차를 해결하고, "AI 여정의 어느 지점에 있든" 고객을 만나는 것으로 포지셔닝하고 있습니다.얼리 어답터들이 즉각적인 혜택을 보고하다여러 주요 기업들이 이미 Oracle AI Factory를 사용하기 시작했으며, 상당한 운영 개선을 보고하고 있습니다. Marriott International, MTI, Etihad Salam, 그리고 Grupo Bimbo는 프로세스 복잡성 감소, 이탈률 감소, 글로벌 운영 표준화, 사이버 보안 강화 등의 혜택을 경험하고 있는 얼리 어답터들입니다.Marriott International의 인재 관리 및 조직 역량 글로벌 책임자인 Elaine Engle은 "Oracle의 AI 기반 Fusion Cloud HCM 제품군은 성과 관리에 대한 우리의 접근 방식을 향상시켜 직원들을 위한 더 빠르고 일관된 목표 설정을 가능하게 했습니다"라고 말했습니다. "이는 우리 직원들이 조직에 의미 있는 영향과 결과를 가져오는 더 명확하고 측정 가능한 목표를 개발할 수 있도록 힘을 실어줍니다."세계 최대의 제빵 회사인 Grupo Bimbo는 Oracle의 AI 기능을 활용하여 글로벌 운영을 현대화했으며, 생성형 AI 어시스턴트를 사용하여 직원들이 정책 정보에 빠르게 접근할 수 있도록 돕고, 개선된 판매 예측 및 생산 라인 모니터링을 위해 AI 기반 분석을 구현했습니다.포괄적 AI 구현 프레임워크Oracle AI Factory는 8가지 핵심 구성 요소를 포함합니다: AI 교육 및 훈련 프로그램, Oracle Fusion Applications를 위한 처방적 AI 플레이북 및 런북, Cloud Success Navigator 디지털 플랫폼, 전담 고객 성공 관리자, 선별된 AI 도구 및 사용 사례, 테스트를 위한 글로벌 AI Customer Excellence Center, 맞춤형 구현을 위한 Oracle 기술 전문가, 그리고 사전 구축된 에이전트를 갖춘 고정 범위 AI Acceleration Services.이 서비스는 올해 초 출시된 Oracle의 기존 AI Agent Studio for Fusion Applications를 기반으로 구축되었으며, 고객이 기업 운영 전반에 걸쳐 맞춤형 AI 에이전트를 생성하고 배포할 수 있도록 지원합니다. Oracle의 고객 성공 책임자이자 수석 부사장인 Gary Miller는 회사의 포괄적인 접근 방식을 강조하며 다음과 같이 말했습니다: "Oracle AI Factory는 이러한 요소들을 통합하여 최첨단 기술을 안전하고 비용 효율적으로 실질적인 가치를 제공하는 실용적인 비즈니스 솔루션으로 전환합니다".이번 발표는 2026년부터 50,000개의 AI 프로세서를 배포하기 위한 AMD와의 새로운 파트너십 및 내장형 AI 기능을 갖춘 Oracle AI Database 26ai의 출시를 포함한 Oracle의 광범위한 AI 인프라 확장과 동시에 이루어졌습니다.
1021 조회
0 추천
2025.10.15 등록
오픈AI가 챗GPT 성인 이용자에게 성적인 대화나 성인용 콘텐츠를 허용하겠다는 방침을 발표샘 올트먼 오픈AI 최고경영자(CEO)는 14일(현지시간) 엑스에 챗GPT의 새로운 버전 출시 계획을 알리면서 성인 이용자에게 허용되는 콘텐츠의 범위를 확대하겠다는 방침을 밝혔다.
1175 조회
0 추천
2025.10.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입