Loading...

AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 2026.01.08 10:06
327 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 43 페이지
인공지능은 노동 시장에 예상치 못한 반전을 가져올 태세다. 자동화에 대한 기존의 두려움을 뒤집는 최근 보고서와 전문가 분석 물결에 따르면, 만연한 실업 대신 숙련된 인력 부족이 발생할 전망이다.11월 24일 맨해튼 연구소가 블룸버그 오피니언에 발표한 분석에 따르면, AI가 빠르게 발전하더라도 이 기술은 일자리를 없애기보다는 “노동력 부족, 또는 최소한 새로운 기술을 최대한 활용할 수 있는 숙련된 인력의 부족”을 초래할 가능성이 더 높다고 주장한다. 분석에 인용된 대형 대학 정보학 프로그램 책임자에 따르면, 주요 장애물은 많은 학생들이 AI가 주도하는 노동력에 필요한 수학 능력을 갖추지 못했다는 점이다. 특히 AI 분야를 전공하지 않는 학생들에서 이런 경향이 두드러진다.이러한 역설은 경제 전반에 예상치 못한 방식으로 퍼지고 있다. 베어링포인트가 2025년 8월에 실시한 전 세계 1,000명 이상의 경영진 대상 설문조사에서 92%는 AI 자동화로 인해 최대 20%의 인력 과잉을 보고했다. 하지만 동시에, 94%는 AI 특화 직무(거버넌스 전문가, 프롬프트 엔지니어, 인간-AI 협업 전문가 등)에서 심각한 인력 부족을 겪고 있으며, 3분의 1은 40~60%의 인력 공백을 보고하고 있다.기술 격차가 건설 붐을 주도하다AI 주도 노동력 부족의 가장 명확한 증거는 예상치 못한 분야인 건설업에서 나타났습니다. Amazon, Google Microsoft를 포함한 거대 기술 기업들이 AI 시스템을 구동하기 위해 수백 개의 새로운 데이터 센터를 건설하기 위해 경쟁하고 있지만, Associated Builders and Contractors 업계 단체에 따르면 약 439,000명의 숙련된 근로자가 부족한 상황에 직면해 있습니다.이러한 시설을 건설하는 건설 근로자들은 25%에서 30%의 급여 인상을 경험하고 있으며, 일부는 연간 200,000달러 이상을 벌고 있다고 월스트리트 저널이 11월 30일 보도했습니다. 기업들은 난방이 되는 휴게 텐트, 무료 점심, 최대 100달러의 일일 인센티브 보너스로 제안을 더욱 매력적으로 만들고 있습니다.이주에서 변혁으로매사추세츠공과대학교(MIT)가 11월 26일에 발표한 연구에 따르면, 인공지능(AI)이 이미 미국 일자리의 11.7%에 해당하는 업무를 수행할 수 있는 것으로 나타났습니다. 이는 약 1조 2천억 달러 규모의 임금에 해당합니다. 하지만 연구진은 이러한 수치가 기술적 능력을 반영하지만, 일자리 손실이 불가피하다는 일정을 의미하는 것은 아니라고 강조했습니다. 이 연구의 ’아이스버그 지수(Iceberg Index)’는 32,000가지 기술을 보유한 1억 5,100만 명의 노동자를 시뮬레이션하여 정책 입안자들이 노동력 전환을 계획하는 데 도움을 줍니다.MIT의 슬론 경영대학원이 이전에 실시한 연구에 따르면, AI에 대규모 투자를 하는 기업들은 실제로 고용을 늘렸습니다. AI 도입은 5년간 고용 증가율 6%, 매출 증가율 9.5%와 연관이 있었습니다. Anthropic이 2025년 2월에 400만 건 이상의 AI 프롬프트를 분석한 별도의 연구에서는 근로자들이 AI를 주로 업무를 대체하기보다 보완하는 데 활용하는 것으로 나타났습니다.]2028년까지 BearingPoint가 조사한 경영진의 거의 절반은 인력 초과 현상이 30%를 넘을 것으로 예측하고 있으며, 중요한 AI 기술 격차는 계속될 것으로 보입니다. 세계경제포럼(WEF)은 2030년까지 전 세계적으로 9,200만 개의 일자리가 사라지는 반면, 1억 7,000만 개의 새로운 일자리가 생겨 순증 7,800만 개의 일자리가 창출될 것으로 전망하고 있습니다.
509 조회
0 추천
2025.12.02 등록
• Apple은 월요일 기계 학습 및 AI 전략 담당 수석 부사장인 John Giannandrea가 2026년 봄에 물러나 은퇴할 것이며, Microsoft와 Google에서 근무한 Amar Subramanya가 AI 담당 부사장으로 합류할 것이라고 발표했습니다.[investing +2]• 이번 리더십 개편은 Apple이 AI 강화 Siri 어시스턴트 출시 지연으로 비판을 받고 있는 가운데 이루어졌습니다. Siri는 원래 2024년에 약속되었으나 이제 2026년으로 연기되었으며, 회사는 생성형 AI 경쟁에서 OpenAI, Google, Microsoft와 같은 경쟁사들을 따라잡기 위해 고군분투하고 있습니다.[investing +2]• CEO Tim Cook에게 직접 보고했던 Giannandrea와 달리, Subramanya는 소프트웨어 책임자인 Craig Federighi에게 보고할 예정입니다. Federighi의 AI 책임은 확대되어 “내년에 사용자들에게 더 개인화된 Siri를 제공”하기 위한 Apple의 노력을 감독하게 된다고 Cook이 말했습니다.[nbcnews +2]
520 조회
0 추천
2025.12.02 등록
• Nvidia는 NeurIPS 컨퍼런스에서 Alpamayo-R1을 공개했으며, 이는 사고 연쇄(chain-of-thought) AI 추론과 경로 계획을 통합하여 자율주행 자동차가 실시간으로 자신의 결정을 설명할 수 있도록 하는 세계 최초의 개방형 산업 규모 추론 비전 언어 행동 모델로 설명되었습니다.[quantumzeitgeist +1]• 이 모델은 센서 데이터를 자연어 설명으로 변환하고 주행 결정을 단계별로 추론함으로써 자율주행 차량 소프트웨어의 “블랙박스” 문제를 해결하며, 강화 학습 후처리 후 추론 품질이 45% 향상되었습니다.[quantumzeitgeist +1]• Nvidia는 비상업적 연구 용도로 GitHub와 Hugging Face에 이 모델을 공개했으며, 개발자들이 자율주행 차량 및 로봇공학을 위한 물리적 AI 모델을 맞춤화할 수 있도록 Cosmos Cookbook과 AlpaSim 평가 프레임워크도 함께 제공했습니다.[quantumzeitgeist +1]
541 조회
0 추천
2025.12.02 등록
Runway는 월요일에 Gen 4.5를 공개했으며, 이는 독립 벤치마킹 업체 Artificial Analysis가 관리하는 Video Arena 리더보드에서 1위를 차지한 새로운 AI 비디오 생성 모델로, 2위인 Google의 Veo 3 모델과 7위인 OpenAI의 Sora 2 Pro를 능가했다.PitchBook에 따르면 35억 5천만 달러의 가치를 평가받은 이 100명 규모의 스타트업은 블라인드 테스트를 사용하며, 투표자들이 어느 회사가 제작했는지 모르는 상태에서 비디오 결과물을 비교하여 순수한 사용자 선호도를 기반으로 편향되지 않은 순위를 보장한다.CEO Cristóbal Valenzuela는 CNBC에 Runway가 “100명의 팀으로 수조 달러 규모의 기업들을 능가하는 데 성공했다”고 말했으며, “David”라는 코드명의 이 모델은 주말까지 회사의 플랫폼, API 및 파트너 통합을 통해 모든 고객에게 제공될 예정이다.
514 조회
0 추천
2025.12.02 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입