Loading...

AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 2026.01.08 10:06
427 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 85 페이지
바이두CEO로빈리는화요일로보택시가"중국과미국모두에서전환점에도달했다"고선언하며,자율주행차량이주류채택에근접하고있다는신호를보내는기술경영진들의대열에합류했다.이발언은미국과중국기업들이글로벌로보택시시장을장악하기위한경쟁이심화되는가운데바이두의3분기실적발표에서나왔다.​리는변곡점의증거로대중의수용도증가를언급하며,현재충분한수의사람들이무인주행을경험하고소셜미디어에호의적인인상을공유함으로써규제승인을가속화할가능성이있다고지적했다.그의발언은엔비디아CEO젠슨황의최근성명과일치하는데,황은10월우버와의파트너십을발표하며2027년부터전세계적으로10만대의자율주행차량을배치할계획이며,이러한변화가"빠르게일상적인현실이되고있다"고언급했다.​중국기업들이국제확장을주도하다중국의로보택시기업들이글로벌확장에서미국경쟁사들을앞서고있으며,Baidu의ApolloGo,Pony.ai,WeRide가중동,동남아시아,유럽전역에서상업운영을시작했습니다.ApolloGo는현재두바이,아부다비,베이징,상하이,우한을포함한전세계22개도시에서매주25만건이상의완전무인주행서비스를제공하고있습니다.이회사는아부다비에서완전자율주행서비스에대해승객에게요금을부과할수있는승인을받았습니다.​Baidu는ApolloGo가총1,700만건의주행을달성하여5월에1,000만건의주행을발표한Alphabet의Waymo에필적한다고주장합니다.11월회사컨퍼런스에서Li는ApolloGo의차량이에어백전개전까지평균1,014만킬로미터를주행하여"인간운전자의성능을크게능가"하며Waymo의안전지표를초과한다고밝혔습니다.​GoldmanSachs는글로벌로보택시시장이2030년까지250억달러를초과할수있으며,중국시장만으로도2035년까지470억달러에달할것으로예측합니다.이투자은행은2025년부터2030년까지약90%의연평균성장률을전망합니다.​미국기업들의배치가속화Waymo는이번주미니애폴리스,탬파,뉴올리언스로확장할계획을발표했으며,최근마이애미및기타도시에서의출시에이어추가됩니다.1,500대이상의차량을운영하는이회사는화요일마이애미에서완전자율주행운영을시작했으며2026년대중서비스를계획하고있습니다.Tesla는이번주애리조나에서차량호출허가를받아미국내세번째시장에서운영을가능하게했습니다.​XPeng은내년광저우에서세가지로보택시모델을출시할계획을발표했으며,Alibaba의지도서비스Amap과파트너십을맺었습니다.이차량들은라이다나고해상도지도에의존하지않고3,000TOPS의컴퓨팅성능을특징으로합니다.
870 조회
0 추천
2025.11.21 등록
기술억만장자일론머스크는수요일워싱턴D.C.에서열린미국-사우디투자포럼에서인공지능과로봇공학이향후10년에서20년내에돈을"무의미하게"만들고일을선택적활동으로변화시킬것이라고예측했다."제생각에는,충분히먼미래를내다본다면,AI와로봇공학의지속적인발전이있을것으로보이는데,미래의어느시점에서돈은더이상의미가없어질것입니다"라고머스크는11월19일케네디센터에서열린패널토론에서말했다."전력과같은에너지와질량에대한제약은여전히존재할것입니다"라고그는덧붙였다."하지만어느시점에서는화폐가무의미해질것이라고생각합니다."​AI영향력에대한대조적인비전Tesla,SpaceX,그리고xAI를이끄는머스크는NvidiaCEO젠슨황과함께AI주도경제에서의업무와생산성의미래에대해논의하기위해나타났다.머스크가일이없는미래에대한광범위한비전을제시한반면,황은보다신중한관점을제시했다.​황은여러매체에따르면"모든사람의직업이달라질것이며,그것은확실하다고생각한다"고말했다.그는AI가업무를완전히없애기보다는사람들을더생산적으로만들것이라고제안하며,"엘론은AI의결과로더바빠질것이라는것이내추측이다.나도AI의결과로더바빠질것이다"라고예측했다.​사우디왕세자무함마드빈살만의백악관방문과동시에열린이포럼에서는양국간확대된투자약속에대한발표가있었다.같은날,Nvidia는월스트리트예상을뛰어넘는570억달러의3분기매출을보고했다.​​선택적여가로서의일머스크는미래의고용에대한자신의비전을여가활동에비유했다."그것은스포츠나비디오게임을하는것과비슷할것입니다,"라고그는말했다."당신은상점에가서채소를그냥살수도있고,집뒤뜰에서채소를직접키울수도있습니다.집에서채소를기르는것은훨씬더어렵지만,어떤사람들은채소를기르는것을좋아해서여전히그렇게합니다.앞으로의일은이런식이될것입니다:선택적입니다".​테슬라CEO는자신의회사옵티머스휴머노이드로봇이"빈곤을없앨것"이라고여러차례주장했다.그는긍정적인AI미래가어떨지보여주는예시로1987년부터2012년까지쓰여진SF작가이언뱅크스의컬처시리즈를언급했다.​머스크는10월에조로건과의인터뷰에서보편적기본소득(universalbasicincome)이아니라"보편적고소득(universalhighincome)"을옹호하며말했다:"누구나원하는제품이나서비스를가질수있습니다.하지만그과정에는많은트라우마와혼란이있을것입니다".
875 조회
0 추천
2025.11.21 등록
일론머스크는이번주에태양광인공지능위성을궤도에배치하겠다는야심찬비전을제시하면서,이러한위성들이인공지능컴퓨팅의에너지수요를충족시키고지구에도달하는태양복사량을정밀하게제어함으로써지구온난화를방지할수있다고주장했다.수요일열린미-사우디투자포럼에서머스크는스페이스X의스타십로켓이“연간약300GW,어쩌면500GW정도의태양광인공지능위성을궤도에쏘아올릴수있을것”이라고말했다.그는세일즈포스(Salesforce,Inc.)의CEO마크베니오프가머스크가우주기반데이터센터가지상시설대비비용효율성이높다고논의하는영상을공유한것에답변했다.​이제안은기술업계리더들이급증하는AI의전력수요문제를해결하기위해경쟁하는가운데나왔다.머스크는AI의전력수요가미국전체에너지소비의“3분의2”에도달할수있다고언급했으며,이는연방에너지규제위원회(FERC)데이터에따르면현재약473GW에해당한다.포럼에서머스크와함께무대에오른엔비디아(NVIDIACorporation)CEO젠슨황은현재AI슈퍼컴퓨터가랙당2톤이넘고,그중“1.95톤은아마도냉각을위한것”이라고말했다.머스크는우주가냉각목적으로"매우매력적인장소가될것"이라며동의했고,"우주에서는항상해가비치기때문에배터리가필요없다"고덧붙였다.​우주기반컴퓨팅경쟁가열머스크의발언은궤도컴퓨팅인프라를향한업계전반의움직임과일치한다.알파벳(AlphabetInc.)은11월3일,플래닛랩스(PlanetLabs)와협력해2027년초까지텐서프로세싱유닛이탑재된두대의프로토타입위성을발사하는'프로젝트선캐처(ProjectSuncatcher)'를발표했다.이프로젝트는대기간섭없이태양광을이용해궤도에서머신러닝워크로드를테스트하는것이목표다.​블루오리진(BlueOrigin)CEO인제프베조스는지난달이탈리아테크위크에서"향후10에서20년내에기가와트규모의데이터센터가우주에건설될것"이라고예측했다.베조스는자동차및항공우주애플리케이션에초점을맞춘새로운AI하드웨어스타트업인프로젝트프로메테우스(ProjectPrometheus)도지원하고있는것으로알려졌다.​이달초머스크는"대형태양광AI위성군집을이용해지구에도달하는태양에너지를미세하게조정함으로써지구온난화를방지하자"고제안했다.이개념은'태양복사관리(solarradiationmanagement)'로알려져있으며,기후를인위적으로통제하는것은예기치못한부작용이있을수있다고경고하는과학자들사이에서논쟁을불러일으키고있다.​하지만머스크는칩생산을"해결해야할가장큰퍼즐조각"이라고지적했다.그는테슬라(Tesla,Inc.)가AI프로세서수요를충족하기위해인텔(IntelCorporation)과개발중인것으로알려진자체'테라팹(TeraFab)'파운드리를지어야할수도있다고밝혔다.
825 조회
0 추천
2025.11.21 등록
알리바바는Qwen대규모언어모델을매우허가친화적인오픈소스라이선스로공개함으로써궁극적으로자사의클라우드컴퓨팅및전자상거래비즈니스에이로운광범위한AI도입을이끌것이라고전망하고있으며,이는회사의AI전략에대한BismarckBrief의분석에근거한것이다.​에어비앤비CEO브라이언체스키는자사가고객서비스에Qwen모델을적극적으로활용한다고밝혔으며,그이유로"우수함","빠른속도","합리적인비용"을꼽았고,플랫폼통합요구사항에"완전히준비되지않은"ChatGPT대신선택했다고설명했다.​Qwen오픈소스모델은전세계적으로6억회이상다운로드됐으며,현재아마존,애플등미국대형기업의AI시스템에도적용되어,알리바바가세계최대오픈소스AI생태계를구축하게되었다.
880 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입