Loading...

AI 뉴스

UCSD 엔지니어들이 AI 모델 맞춤화 비용을 300배 절감

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:39
2,003 조회
0 추천
0 비추천

본문

AI_major_rotator_and_thumb.jpg

(퍼플렉시티가 정리한 기사)

캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​

BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.

 

특화된 AI 애플리케이션의 주요 비용 절감

 

UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​

"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​

전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.

 

혁신적인 이중 레벨 최적화 접근법

 

BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​

이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​

이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.

댓글 0
전체 1,366 / 91 페이지
**마이크로소프트(Microsoft)**의 AI CEO **무스타파 술레이만(Mustafa Suleyman)**은 Copilot과 Windows에 AI가 통합되는 것에 불만을 가진 비평가들에게 반박하며, 사람들이 AI와 유창하게 대화하고 이미지와 동영상을 생성할 수 있는 능력에 감명을 받지 않는다는 사실에 “정말 놀랐다”고 말했다.술레이만의 옹호는 최근 The Verge의 보고서에서 실제 Copilot의 기능이 **마이크로소프트(Microsoft)**가 광고에서 보여주는 것과 맞지 않는다는 점이 지적된 가운데 나왔으며, Windows 사장 **파반 다불루리(Pavan Davuluri)**가 “대리 OS(agentic OS)” 비전을 홍보하다가 심한 반발을 받아 자신의 게시물에서 답글 기능을 비활성화해야 했던 사건에 이어졌다.이 논란은 **마이크로소프트(Microsoft)**가 새로운 “AI를 위한 당신의 캔버스(Your canvas for AI)” 슬로건을 밀어붙이는 가운데, Windows의 평판이 해당 매체가 “역대 최저”라고 묘사할 정도로 떨어진 상황을 부각시킨다. 사용자들은 모든 인터페이스에 원하지 않는 AI 기능을 강제로 넣는 대신 회사가 근본적인 플랫폼 문제를 해결할 것을 요구하고 있다.
1214 조회
0 추천
2025.11.20 등록
Google DeepMind는 Boston Dynamics의 전 최고기술책임자(CTO)인 Aaron Saunders를 하드웨어 엔지니어링 부사장으로 영입했습니다. 이는 CEO Demis Hassabis가 Gemini를 Android가 여러 제조업체의 스마트폰을 구동하는 것처럼 범용 로봇 운영체제로 변모시키려는 비전을 발전시키기 위한 것입니다.Hassabis는 Gemini가 “거의 모든 물리적 구성으로 즉시 작동할 수 있는” AI 기반으로 기능하기를 목표로 하며, 이는 인간형 및 비인간형 로봇을 포함하여 회사가 AI 기반 로봇공학 분야로의 진출을 강화하고 있는 가운데 추진되고 있습니다.이러한 움직임은 Google DeepMind를 2035년까지 510억 달러 규모에 달할 것으로 예상되는 급속히 성장하는 시장에서 경쟁할 수 있는 위치에 올려놓습니다. 경쟁사인 Tesla는 향후 10년간 백만 대의 Optimus 인간형 로봇 생산을 목표로 하고 있으며, Unitree와 같은 중국 기업들은 경쟁력 있는 가격의 다리 달린 로봇을 제공하고 있습니다
1206 조회
0 추천
2025.11.20 등록
MIT 연구원들은 새로운 추론 AI 모델에서 가장 많은 연산 처리를 요구하는 문제 유형이 인간이 해결하는 데 가장 오래 걸리는 문제와 동일하다는 것을 발견했으며, 이는 인공지능과 생물학적 지능이 복잡한 사고에 접근하는 방식에서 예상치 못한 수렴을 시사합니다PNAS에 게재된 이 연구는 7가지 문제 유형에 걸쳐 인간의 반응 시간과 AI가 생성한 “토큰”(내부 연산 단계)을 측정했으며, 놀라운 상관관계를 발견했습니다—인간과 모델 모두 “ARC 챌린지“라고 불리는 시각적 추론 과제에 가장 오래 걸리고 기본 산술에는 가장 적은 노력을 소비했습니다추론 모델은 훈련 중 강화 학습을 통해 향상된 성능을 달성하는데, 정답에 대해서는 보상을 받고 오류에 대해서는 페널티를 받아 문제 공간을 탐색하고 인간의 문제 해결 접근 방식을 반영하는 단계별 솔루션 전략을 개발할 수 있습니다
1217 조회
0 추천
2025.11.20 등록
(퍼플렉시티가정리한기사)러시아대통령블라디미르푸틴이수요일모스크바에서열린AI저니컨퍼런스에서춤추는휴머노이드로봇의환영을받았다.푸틴은이자리에서러시아가국내전문가들이완전히통제할수있는독자적인인공지능기술을개발해야한다고강조하며,AI주권이국가안보에필수적임을밝혔다.러시아스베르은행이주최한제10회연례컨퍼런스에서푸틴은"러시아는생성형인공지능분야에서독자적인기술과제품을완비해야한다."고선언했다.그는외국의AI시스템에의존하는것이국가의기술적·문화적자율성에위험을초래할수있다고경고했다.11월19일부터21일까지스베르은행본사에서진행된이번컨퍼런스에서는러시아의최신AI성과시연이펼쳐졌으며,그중에는푸틴이도착했을때맞이한스베르은행의GigaChat언어모형으로구동되는인간형로봇도있었다.​AI야망을위한원자력에너지푸틴은향후20년동안우랄,시베리아,극동지역을중심으로38기의새로운원자력발전소건설계획을발표했으며,이들의총발전용량은러시아의현재원전발전량과거의맞먹는수준이다.대통령은데이터센터의전력소비가이번10년동안3배이상증가할것으로예상됨에따라에너지인프라가매우중요하다고강조했다.​“가장중요하고근본적인과제는데이터센터에대규모의에너지를지속적이고안정적이며신뢰성있게공급하는일입니다.”라고푸틴은말했다.그는AI인프라에전력을공급할수있는소형모듈형원자로개발에서러시아의역량을언급했다.​국가인공지능태스크포스와경제목표푸틴대통령은생성적인공지능개발을감독할국가태스크포스의창설을명령하고,정부에포괄적인이행계획을수립할것을지시했다.그는AI기술이2030년까지러시아국내총생산(GDP)에11조루블(1,360억달러)이상을기여해야한다고전망했다.​대통령은언어모델이세계관에영향을미치고"전체국가의의미공간"을형성할수있는도구가되었다고강조하며,이른바"가치기반주권"을유지하기위해서는자체적인개발이필수적이라고밝혔다.​서양기술과의경쟁러시아의인공지능(AI)부문은미국과중국에뒤처져있으며,토터스미디어의글로벌AI지수에따르면전세계31위를차지하고있다.서방의마이크로칩수입제한제재는모스크바의컴퓨팅야심에차질을빚었으나,러시아는주요국산언어모델두개를개발했다:스베르방크의GigaChat과얀덱스의YandexGPT이다.​푸틴대통령과함께전시회를둘러본스베르방크의CEO게르만그레프는은행이매년약10억달러를AI개발에투자한다고밝혔다.이번컨퍼런스에서는의약품개발부터건강모니터링ATM에이르기까지다양한응용사례가선보였다.​푸틴대통령은AI규제가필요하다고강조하면서도,국가안보와정보작전을위해서는러시아가자체개발한모델만을사용해야하며,이를통해데이터가국경내에안전하게보관된다는점을분명히했다.
1188 조회
0 추천
2025.11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입