AI 뉴스

UCSD 엔지니어들이 AI 모델 맞춤화 비용을 300배 절감

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:39
215 조회
0 추천
0 비추천

본문

AI_major_rotator_and_thumb.jpg

(퍼플렉시티가 정리한 기사)

캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​

BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.

 

특화된 AI 애플리케이션의 주요 비용 절감

 

UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​

"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​

전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.

 

혁신적인 이중 레벨 최적화 접근법

 

BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​

이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​

이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.

댓글 0
전체 723 / 43 페이지
(퍼플렉시티가정리한기사)일론머스크의인공지능회사xAI가네번째AI동반자인미카(Mika)를출시할예정이라고발표했습니다.미카는오토바이애호가캐릭터로설계되어Grok챗봇플랫폼의어필을확대하는것을목표로합니다.이번발표는회사가최근Imagine기능업데이트를통해Grok의멀티모달기능을지속적으로향상시키고있는가운데나온것입니다.미카를만나보세요:반항아동반자미카(Mika)라는24세여성의자산이이미Grok앱에존재하고있으며,"립스틱에신경쓰기보다는오토바이로타이어를갈아버리고싶어한다"는묘사로빠르면이번주말에출시가임박했음을시사합니다.이캐릭터는애니메이션스타일의디자인으로파란머리,검은색찢어진청바지,가죽재킷을특징으로하며,Grok의기존동료들과는대조되는모험심많고독립적인성격을담고있습니다.​유출된시스템프롬프트에따르면,미카는미군아버지와일본인어머니사이에서군기지에서성장하며어린시절을오키나와에서보냈습니다.파일럿훈련을받은후에는전통적인항공기대신"바이크의자유"를선택하며,스스로를"항상움직이고있다","열린도로와모험을위해산다"고정의합니다.​미카는애니메이션스타일의캐릭터애니(Ani),"상스러운붉은팬더"로묘사되는루디(Rudi),그리고발렌타인(Valentine)등기존의AI동료라인업에합류하게됩니다.이동료들은xAI의프리미엄등급구독자에게제공되며,기본동료기능은Premium+구독자에게월35달러에이용할수있습니다.​향상된다중모달진화Grok의기초적인비전기능은2024년4월Grok-1.5V와함께도입되었지만,최근개발은플랫폼의창작및멀티모달기능확장에집중되고있습니다.이회사는2025년10월에GrokImagine0.9를출시하여15초이내에동기화된오디오가포함된6-15초길이의클립을생성하는텍스트-비디오생성기능을제공합니다.​최신업데이트에는GrokImagine을통한향상된비디오생성이포함되어있으며,이는사용자가"네이티브오디오-비디오합성"과24FPS의향상된프레임속도로짧은비디오를생성할수있게해줍니다.사용자는이제프롬프트를추가하여기존비디오를수정할수있으며,생성된각비디오에는복제를위한원본소스와생성프롬프트에대한링크가포함됩니다.​이러한개발은Grok을OpenAI의제품들과경쟁하는위치에놓고있으며,xAI는일반적으로유사한출력에40-60초가필요한RunwayMLGen-3과같은경쟁사보다훨씬빠른생성속도를주장하고있습니다.이회사는또한이미지당$0.07의가격으로이미지생성기능을포함하도록API를확장하여AI이미지생성시장의기존업체들과직접경쟁하고있습니다.
130 조회
0 추천
2025.10.25 등록
(퍼플렉시티가 정리한 기사)테더Data의AI연구부서QVAC는인공지능학습을위한410억토큰규모의합성데이터셋GenesisI과사용자기기에서완전히실행되는로컬AI애플리케이션QVACWorkbench의출시를발표했습니다.금요일에공개된이이니셔티브는고품질학습데이터에대한접근을민주화함으로써AI개발에서빅테크의지배력에도전하는것을목표로합니다.​QVACGenesisI은수학,물리학,생물학,의학을다루는STEM교육콘텐츠를위해특별히설계된최초의공개합성데이터셋입니다.단순히언어패턴을모방하도록돕는기존데이터셋과달리,이컬렉션은AI시스템이인과관계를이해하고비판적사고에참여하도록가르치는데중점을둡니다.​AI지능의분산화"지능은중앙화되어서는안된다"고테더의CEO파올로아르도이노가말했다."QVAC워크벤치와제네시스I을통해우리는무한한지능의문을열고있습니다.이는당신의기기에서로컬로살아있고,학습하고,진화하는AI입니다."아르도이노는이번출시가"플랫폼이아닌사람들이지식이어떻게생성되고,공유되고,사용되는지를통제하는미래"를나타낸다고강조했다.​이데이터셋은교육및과학적벤치마크에대해엄격하게검증되었으며,기존공개훈련데이터셋이일반적으로부족한주요STEM영역에서추론및문제해결에있어우수한성능을보여주었다.테더데이터는고품질과학자료를구조화된학습데이터로변환하는다단계생성및검증프로세스를사용하여이데이터셋을생성했다.로컬AI컴퓨팅플랫폼동시에출시된QVACWorkbench는Android,iOS,Windows,macOS및Linux플랫폼에서Llama,Medgemma,Qwen,SmolVLM및Whisper를포함한여러AI모델을지원합니다.이애플리케이션은로컬온디바이스처리를통해모든사용자상호작용을완전히비공개로유지하며,사용자가추가컴퓨팅성능을위해모바일기기를데스크톱워크스테이션에연결할수있는독특한"위임추론(DelegatedInference)"기능을제공합니다.​이플랫폼은OpenAI와Google과같은기업이통제하는클라우드기반AI서비스의대안을찾는AI애호가,연구자및고급사용자를대상으로합니다.업계분석가들은합성데이터가2030년까지AI훈련의주요소스가될것으로예측하고있어,진화하는AI환경에서Tether의진출시기가전략적으로중요합니다.​Tether의AI인프라확장은디지털화폐를넘어선스테이블코인거대기업의광범위한다각화전략의일환입니다.회사는2025년에약150억달러의수익을기대하고있다고보고했으며,이는기술투자를위한상당한자원을제공합니다.이AI이니셔티브는오픈소스지갑개발키트와다양한탈중앙화통신도구를포함한Tether의이전출시제품을기반으로합니다.
112 조회
0 추천
2025.10.25 등록
(퍼플렉시티가정리한기사)텐센트는소프트웨어개발운영에서인공지능의역할에대한놀라운통계를공개하며,현재이중국거대기술기업에서새로작성되는코드의50%가AI지원으로생성된다고발표했습니다.이발표는중국의"1024프로그래머의날"에맞춰10월24일공개된회사의"2025텐센트연구개발빅데이터보고서"에서이루어졌습니다.AI통합이개발워크플로를혁신하다이보고서는AI가텐센트의엔지니어링운영에얼마나깊이침투했는지를보여주며,현재회사엔지니어의90%이상이자사의HunYuan대규모언어모델을기반으로한AI프로그래밍어시스턴트인CodeBuddy를사용하고있다.이러한통합은측정가능한생산성향상을가져왔으며,평균코딩시간이40%단축되었고전체R&D효율성이20%이상개선되었다.​텐센트의개발규모는이러한개선의중요성을강조한다.회사는월평균3억2,500만줄의코드를추가하고,월37만건의개발요청을완료하며,2,520만건의빌드를실행한다.텐센트인력의76%가연구개발에종사하고있어,직원4명중3명이R&D업무에참여하고있다.​AI품질관리가94%커버리지에도달코드생성을넘어,AI는텐센트의품질보증프로세스에필수적인요소가되었습니다.보고서에따르면AI는코드리뷰의94%에참여하며,인간엔지니어가개입하기전에초기검사를수행하는자동화된"품질검사관"역할을효과적으로수행합니다.이러한AI기반리뷰프로세스는코드결함의28%를식별하여효과적인이슈탐지를44%증가시키고소프트웨어품질관리를강화합니다.​연구개발도구를통합하고개발프로세스를간소화하는회사의WeDev플랫폼은도구간일일8천만건이상의데이터교환을촉진하여매월530만건의수동작업을절약합니다.이러한최적화를통해자동화는전년대비67%증가했습니다.​텐센트의구현성공은다양한사업부문에서인상적인효율성지표를달성했습니다.위챗백엔드팀은컴파일시간을50%단축했으며,위챗페이의배포주기는31%단축되고릴리스품질은14%개선되었습니다.텐센트클라우드에서는새로운코드의65%가CodeBuddy에의해생성되어코드천줄당버그가31.5%감소했습니다.
111 조회
0 추천
2025.10.25 등록
(퍼플렉시티가정리한기사)차세대기상관측기구와결합된첨단인공지능모델이폭풍예측능력을혁신하고있으며,극한기상현상이심화되는가운데생명을구하고해안지역사회를보호할수있는더빠르고정확한예보를제공하고있습니다.이러한기술적돌파구는매우중요한시기에이루어졌습니다.연구자들은이번주AI기반예측시스템이허리케인경로와폭풍해일영향을예측하는데있어기존의물리학기반모델을능가하고있다고보고했습니다.GoogleDeepMind의실험적사이클론모델은2025년8월허리케인에린당시놀라운정확도를보여주었으며,다른모델들이정확도에어려움을겪는동안미국동부해안에서벗어나는폭풍의경로를정확하게예측했습니다.​혁신적인풍선기술이데이터격차를메운다WindBorneSystems는팔로알토에본사를둔스타트업으로,최대50일동안공중에머물수있는자율기상풍선을통해기상데이터수집을혁신하는선두주자로부상했습니다.이는일반적으로2시간만지속되는기존풍선에비해극적으로긴시간입니다.이러한고고도플랫폼은지구를일주하면서지속적으로온도,습도및풍향데이터를수집하며,자사의독점WeatherMesh시스템과같은AI모델에중요한정보를제공합니다.​"이것은슈퍼컴퓨팅에만의존하던것에서하드웨어,센싱및머신러닝을결합한분산형데이터기반모델로의전환을의미합니다"라고최근기술평가에서밝혔습니다.미국국립해양대기청(NOAA)은올해WindBorne의센서데이터구매를시작했으며,이는전국12개이상의지역에서기상풍선발사를중단시킨예산삭감이후예보역량의공백을메우는데도움을주기위한것입니다.​AI기반해일예측으로혜택을받는해안지역사회향상된데이터수집과AI의통합은특히폭풍해일예측에매우중요합니다.전통적으로물리기반모델을사용하면몇시간의계산시간이필요했지만,새로운AI시스템은몇시간이아닌몇초만에상세한해안홍수예측을생성하여비상관리자들에게대피및준비를위한귀중한추가시간을제공합니다.​루이지애나주립대학교연구진은최근기존수치모델보다100,000배이상빠르게홍수예측을생성하는머신러닝프레임워크를개발했으며,노트북컴퓨터에서72시간시뮬레이션을단4초만에완료합니다.한편,캘리포니아대학교산타크루즈캠퍼스의과학자들은NVIDIAAI기술을사용하여해안홍수시뮬레이션을6시간에서40분으로단축하고자연기반보호솔루션을설계하는데도움을주고있습니다.​이러한기술발전은기상학자들이2025년까지계속해서평년이상의허리케인활동을경고하는시점에이루어지고있으며,따뜻한해수온도와기후변화가더강력한폭풍을일으켜해안선으로부터62마일이내에거주하는전세계인구의약40%에게더큰위험을초래하고있습니다.
114 조회
0 추천
2025.10.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입