AI 뉴스

UCSD 엔지니어들이 AI 모델 맞춤화 비용을 300배 절감

페이지 정보

작성자 xtalfi
작성일 2025.10.22 16:39
1,701 조회
0 추천
0 비추천

본문

AI_major_rotator_and_thumb.jpg

(퍼플렉시티가 정리한 기사)

캘리포니아 대학교 샌디에이고의 엔지니어들은 조직이 훨씬 적은 데이터와 컴퓨팅 파워를 사용하여 대규모 인공지능 모델을 맞춤화할 수 있는 획기적인 방법을 개발했으며, 이는 소규模 연구소와 스타트업이 고급 AI 역량에 접근할 수 있도록 민주화할 잠재력을 가지고 있습니다.​

BiDoRA(Bi-level Optimization-Based Weight-Decomposed Low-Rank Adaptation)라고 불리는 이 새로운 기술은 기존 방법과 비교하여 성능을 유지하거나 심지어 향상시키면서 미세 조정에 필요한 매개변수 수를 300배 이상 줄입니다. 월요일 Transactions on Machine Learning Research에 게재된 이 연구는 AI 훈련 비용이 2020년 이후 4,300퍼센트 이상 급증한 시점에 나왔습니다.

 

특화된 AI 애플리케이션의 주요 비용 절감

 

UCSD 팀은 전기 및 컴퓨터 공학과의 Pengtao Xie 교수가 이끌었으며, 단백질 언어 모델—단백질 특성과 행동을 예측하는 특수 AI 시스템—을 사용하여 그들의 방법의 효과를 입증했습니다. 펩타이드가 혈액-뇌 장벽을 통과할 수 있는지 예측하는 데 있어 BiDoRA는 기존 방법보다 326배 적은 매개변수를 사용하면서도 더 높은 정확도를 달성했습니다. 단백질 열안정성 예측의 경우, 408배 적은 매개변수로 전체 미세 조정 성능과 동일한 결과를 보였습니다.​

"우리의 방법을 사용하면 막대한 예산, 슈퍼컴퓨터급 리소스 또는 대규모 데이터셋이 없는 소규모 연구실과 스타트업조차도 자신들의 필요에 맞게 대규모 AI 모델을 적응시킬 수 있습니다"라고 Xie는 말했습니다. "이 연구는 AI 민주화를 향한 한 걸음을 나타냅니다."​

전통적인 미세 조정 방법은 수십억 개의 매개변수를 포함할 수 있는 대규모 언어 모델의 모든 매개변수를 조정합니다. 이 접근법은 비용이 많이 들고 과적합에 취약한데, 과적합은 모델이 새로운 예시에 일반화하는 것을 학습하기보다 패턴을 암기하는 현상입니다. 증가하는 비용은 소규모 조직에 장벽을 만들어 왔으며, 최첨단 모델 훈련 비용은 현재 GPT-4의 경우 7,800만 달러, Google의 Gemini Ultra의 경우 추정 1억 9,100만 달러에 달합니다.

 

혁신적인 이중 레벨 최적화 접근법

 

BiDoRA는 미세 조정 과정을 크기와 방향 업데이트라는 두 가지 구성 요소로 분리하기 위해 이중 레벨 최적화를 사용하는 다른 접근 방식을 취합니다. 이 방법은 가장 중요한 매개변수만 업데이트하고 나머지는 동결된 상태로 유지하여 계산 요구 사항을 크게 줄입니다. 이러한 분리는 과적합을 방지하는 동시에 새로운 작업에 대한 모델의 일반화 능력을 유지하는 데 도움이 됩니다.​

이 연구는 미국 국립과학재단과 국립보건원의 지원을 받았으며, 이는 컴퓨터 과학과 생물의학 연구 모두에서 이 방법의 잠재적 응용 가능성을 반영합니다. 이 시기는 UCSD가 새로운 인공지능 학부 전공을 시작하는 시점과 일치하여, 대학을 AI 교육 및 연구의 최전선에 위치시키고 있습니다.​

이 개발은 AI 비용이 기하급수적으로 계속 증가함에 따라 중요한 과제를 해결합니다. 업계 데이터에 따르면 최첨단 모델의 훈련 비용은 2020년 이후 연간 약 3배씩 증가했으며, 일부 예측에서는 2027년까지 10억 달러 규모의 훈련 실행이 정상화될 수 있다고 제시합니다. 한국 스타트업 Trillion Labs가 최근 AI 평가 비용을 100배 이상 절감하는 방법을 발표한 것을 포함하여, 유사한 효율성 노력이 전 세계적으로 등장하고 있습니다.

댓글 0
전체 1,366 / 174 페이지
(퍼플렉시티가정리한기사)Anyscale과Microsoft는오늘Azure에서새로운AI네이티브컴퓨팅서비스를출시하기위한파트너십을발표했으며,즉시비공개프리뷰에진입하고Ray의분산컴퓨팅기능을엔터프라이즈규모의클라우드서비스로대폭확장하는계기가되었습니다.​완전관리형퍼스트파티Azure서비스는Anyscale이만든오픈소스분산컴퓨팅프레임워크인Ray를기반으로하며,기업들이AI워크로드를확장할때레거시컴퓨팅시스템으로직면하는한계를해결합니다.이서비스는코드변경없이도자체관리형Ray에비해최대10배빠른성능을제공합니다.​엔터프라이즈급AI컴퓨팅솔루션"AI는모든산업을재정의하고있지만,이를확장하는것은여전히가장어려운과제중하나입니다"라고Anyscale의CEO인KeertiMelkote는말했습니다."Microsoft와함께,우리는기업들이대규모로AI를구축하고실행하는것을획기적으로더쉽게만들고있습니다—Ray를위해특별히제작된Anyscale의플랫폼과Azure의신뢰할수있는인프라를결합하여기업들이인프라관리가아닌혁신에집중할수있도록합니다".​새로운서비스는AzureKubernetesService(AKS)에서직접실행되며,AzurePortal을통한간소화된클러스터배포,대화형개발환경,그리고배치처리와저지연서빙모두를위한장애허용Ray클러스터를기업에제공합니다.Azure고객들은통합청구의혜택을받을수있으며,기존MicrosoftAzureConsumptionCommitments를이서비스에적용할수있습니다.​Ray의성장하는엔터프라이즈도입Ray는월간2,700만건이상의다운로드와39,000개의GitHub스타를기록하며AI인프라의핵심기술로부상했습니다.Uber,Spotify,Canva,Coinbase를포함한주요기업들이이미분산AI컴퓨팅을위해Ray를활용하고있습니다.이프레임워크는단일파이프라인에서CPU와GPU와같은특수가속기전반에걸쳐데이터처리,모델학습및추론을통합함으로써현대AI의복잡성을해결합니다.​Microsoft의클라우드네이티브컴퓨팅담당CorporateVicePresident이자Kubernetes공동창시자인BrendanBurns는"기업들은AI워크로드를확장할때유연성과제어권을원합니다"라고말했습니다."Azure의Anyscale을통해Ray를AzureKubernetesService에도입함으로써,우리는개발자들에게익숙한클라우드네이티브패턴을사용하여AI애플리케이션을구축하고확장할수있는능력을제공하고있습니다".​이서비스는AzurePortal을통해비공개프리뷰로유지되며,2026년에정식출시될예정입니다.
1389 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)Google는화요일에가장야심찬문샷프로젝트를발표했습니다:프로젝트선캐처(ProjectSuncatcher)는회사의인공지능칩을탑재한위성네트워크를사용하여우주에태양광발전데이터센터를구축하는연구이니셔티브입니다.이거대기술기업은지구대기권밖에서머신러닝확장가능성을테스트하기위해PlanetLabs와협력하여2027년초까지두개의프로토타입위성을발사할계획입니다.​이프로젝트는컴퓨팅수요가급증함에따라AI개발이직면한에너지제약문제를해결합니다."우리의TPU가우주로향합니다!"GoogleCEO순다르피차이(SundarPichai)는이이니셔티브를발표하며말했습니다."양자컴퓨팅에서자율주행에이르기까지우리의문샷역사에서영감을받아,프로젝트선캐처는언젠가우주에서확장가능한ML컴퓨팅시스템을구축하여태양의더많은에너지를활용할수있는방법을탐구하고있습니다".​AI인프라에대한혁신적인접근방식Google의시스템은태양광패널이지상설치보다최대8배많은전력을생성할수있고거의지속적인햇빛을받을수있는새벽-황혼태양동기저궤도에서위성군집에텐서처리장치(TPU)를배치할예정입니다.위성들은Starlink와같은기존군집보다훨씬가깝게수백미터간격으로배치되며,초당1.6테라비트를달성하는자유공간광학링크를통해연결될것입니다.​이프로젝트를이끄는Google의지능패러다임선임이사TravisBeals는"AI사용이계속증가하고이를구동하기위해더많은에너지를원하는방향으로계속진행된다면,이것은확장할수있는엄청난잠재력을가지고있습니다"라고말했습니다.회사의분석에따르면발사비용이2035년까지킬로그램당약200달러로떨어질수있으며,이는우주기반데이터센터를킬로와트당기준으로지상시설과경제적으로비교가능하게만들것입니다.​테스트및기술적과제Google은이미최신Trillium세대TPU에대해입자가속기를사용하여수년간의우주노출을시뮬레이션하는유망한방사선테스트를수행했습니다.이칩들은예상되는5년임무선량의최대15배까지손상없이견뎌냈으며,이는우주응용분야에서놀라운방사선내성을나타냅니다.Beals는"칩들이상당히잘버텼습니다"라고언급하며,프로세서가5~6년임무를쉽게처리할수있을것이라고시사했습니다.​그러나진공상태에서의열관리,고대역폭지상통신,그리고서로수킬로미터이내에서위성편대를유지하는것등상당한공학적과제가남아있습니다.이는현재의우주기술을훨씬뛰어넘는정밀도를요구합니다.Planet과의2027년프로토타입임무는이러한핵심시스템들을테스트하고위성네트워크전반에걸친분산머신러닝워크로드를검증할것입니다.
1397 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)SAP와Snowflake는오늘데이터플랫폼통합을위한전략적파트너십을발표했으며,이를통해기업들은데이터중복없이의미론적으로풍부한비즈니스데이터를사용하여AI애플리케이션을구축할수있게되었습니다.베를린에서열린SAP의TechEd2025행사에서공개된이번협력은Snowflake의AIDataCloud와SAP의BusinessDataCloud간에제로카피데이터공유시스템을구축합니다.​새로운"SAPSnowflakesolutionextensionforSAPBusinessDataCloud"는조직이정보를이동하거나중복하지않고두플랫폼에서실시간으로데이터에액세스하고분석할수있도록합니다.정식출시는2026년1분기로예정되어있으며,SAPBusinessDataCloudConnectforSnowflake는2026년상반기에출시될예정입니다.​기업AI과제해결이파트너십은기업AI프로젝트의핵심병목현상을목표로합니다:데이터분석에적절한비즈니스맥락을제공하는것입니다."AI를사용할때는데이터의올바른맥락을제공하는것을피할수없습니다.이것은매우어렵고비용이많이드는일이었습니다"라고SAP데이터및분석부문의최고마케팅책임자인DanielYu는SiliconANGLE과의인터뷰에서말했습니다.​Snowflake의제품담당수석부사장인ChristianKleinerman은통합의단순성을강조했습니다:"SAP와Snowflake를긴밀하게통합함으로써,우리는기업들이SAP의풍부한맥락을가진중요한비즈니스데이터를Snowflake에서대규모로원활한AI앱및데이터에이전트개발의힘과연결하는것을간단하게만들고있습니다".​산업채택및확장주요고객들은이미이파트너십을활용하고있으며,여기에는거대제약회사아스트라제네카가포함됩니다.아스트라제네카의ERP혁신기술부사장인러셀스미스는"데이터와AI는이목표달성의핵심이며,SAP및Snowflake와의긴밀한협력은실시간데이터를액세스하고,처리하고,분석할수있는우리의역량을보완합니다"라고말했습니다.​Snowflake통합은이미Databricks및GoogleCloud와의파트너십을포함하고있는SAP의데이터생태계전략을확장합니다.SAP데이터및애널리틱스사장겸최고제품책임자인이르판칸은이번협력이"고객에게개방성과선택권을부여"하는동시에"전체생태계에걸쳐비즈니스데이터의가치를확장"한다고말했습니다.
1381 조회
0 추천
2025.11.05 등록
(퍼플렉시티가정리한기사)NatureMachineIntelligence에발표된포괄적인연구에따르면,ChatGPT를포함한주요AI챗봇들이참된믿음과거짓된믿음을안정적으로구분하지못하는것으로밝혀졌으며,이는의료,법률,저널리즘과같은중요한분야에서의배치에대한심각한우려를제기하고있다.​AI모델들,신념인식에서근본적인약점보여스탠퍼드대학교연구진은13,000개의질문을사용하여24개의대규모언어모델을테스트한결과,모든시스템이참인믿음에비해거짓믿음을식별하는데어려움을겪는것으로나타났다.연구에따르면GPT-4o를포함하여2024년5월이후에출시된최신모델들은참인1인칭믿음에비해거짓1인칭믿음을인정할가능성이34.3%낮았다.구형모델들은더욱낮은성능을보여거짓믿음을정확하게식별하는비율이38.6%감소했다.​이러한모델들은단순한참또는거짓진술을식별할때91.1%에서91.5%사이의정확도를달성했지만,"나는...라고믿는다"와같은믿음기반언어를다룰때는성능이급격히저하되었다.연구진에따르면,AI시스템은"일관성없는추론전략"을보였으며,깊이있는이해보다는피상적인패턴매칭에의존했다.​실제응용분야에대한우려증가이번연구결과는AI챗봇사용이급속도로확대되고있는중요한시점에나왔다.최근AdobeExpress보고서에따르면ChatGPT를사용하는미국인의77%가이를검색엔진으로간주하며,사용자3명중1명은기존검색엔진보다더신뢰한다고밝혔다.이러한추세는규제조치를촉발했으며,OpenAI는2025년10월29일부로ChatGPT가의료,법률또는금융조언을제공하는것을공식적으로금지했다.​마드리드자치대학교의컴퓨터언어학전문가인PabloHayaColl은정확성이필수적인중요한분야에서"믿음과지식을혼동하면판단에심각한오류를초래할수있다"고경고했다.연구진은이러한한계가"진단을오도하고,사법적판단을왜곡하며,잘못된정보를증폭시킬수있다"고강조했다.​최근사건들은실제로이러한위험을부각시켰다.5월에캘리포니아판사는법률문서에AI가생성한허위정보를포함시킨두로펌에31,000달러의벌금을부과했다.또한스탠퍼드대학의허위정보전문가는ChatGPT의도움으로작성된법정진술서에서"환각적인용"을간과했음을인정했다.​연구저자들은AI기술이고위험분야에광범위하게배포되기전에"긴급한개선"이필요하다고결론지었으며,특히주관적믿음과객관적사실을구분하지못하는기술의무능력은근본적인구조적약점을나타낸다고밝혔다.
1407 조회
0 추천
2025.11.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입