AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 2026.01.08 10:06
332 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 38 페이지
메타는 “Avocado”라는 코드명의 독점 AI 모델을 개발하고 있으며, 2026년 1분기에 출시될 것으로 예상됩니다. 이는 CEO 마크 저커버그가 오랫동안 약속해온 오픈소스 인공지능에 대한 입장을 뒤집는 것입니다. 이러한 전환은 회사가 내부 혼란 증가, 라이선스 분쟁, 그리고 OpenAI, 구글, Anthropic과의 경쟁 심화에 직면하면서 이루어졌습니다.이 전략적 전환은 민주화된 AI 접근의 옹호자로서 메타의 이전 입장에서 벗어난 것을 의미합니다. 저커버그는 2025년 초 회사의 오픈소스 모델인 Llama 제품군을 광범위하게 홍보했지만, 메타의 10월 실적 발표에서는 Llama를 단 한 번만 언급했습니다. CNBC에 따르면, 메타 내부의 많은 사람들이 2025년 말까지 Avocado가 출시될 것으로 예상했지만, 모델이 성능 테스트를 거치면서 일정이 변경되었습니다.라마 4의 실수로 리더십 개편 촉발방향 전환은 개발자들의 참여를 이끌어내지 못하고 Meta의 오픈소스 전략에 대한 우려를 불러일으킨 Llama 4의 실망스러운 반응에 따른 것입니다. 2025년 6월, Meta는 Scale AI의 지분을 인수하고 28세의 창립자인 Alexandr Wang을 최고 AI 책임자로 임명하기 위해 143억 달러를 투자했습니다. Wang은 이제 제품 개발 및 응용 연구를 총괄하는 전 GitHub CEO Nat Friedman과 함께 Meta Superintelligence Labs(MSL)를 이끌고 있습니다.월간 활성 사용자가 7억 명 이상인 기업이 Meta로부터 특별 허가를 받아야 한다는 Llama 4의 라이선스 조건은 주요 파트너들과의 마찰을 야기했습니다. 삼성전자의 반도체 부문은 Meta가 신중함을 요청한 후 11월 말 Llama 4 사용을 중단하고, 대신 내부 개발한 Gauss 모델을 업그레이드하기로 결정했습니다. 삼성 관계자는 한국 언론에 “Meta와의 불필요한 마찰을 피하기로 결정했다”고 말했습니다.경쟁자들이 앞서 나가며 압박이 커진다경쟁사들이 경쟁력 있는 모델을 출시하면서 긴박감이 더욱 고조되었습니다. Google은 11월에 Gemini 3를 공개했으며, OpenAI는 GPT-5.1 업데이트를 출시했고 Anthropic은 Claude Opus 4.5를 선보였습니다. Meta는 2025년 자본 지출 가이던스를 700억~720억 달러로 상향 조정했으며 2026년에는 더 높은 지출을 예상하고 있습니다. 10월에 회사는 운영 간소화를 위해 MSL 내에서 약 600개의 직책을 없앴으며, 팀들은 주당 70시간 근무를 보고하고 있습니다.“우리는 이미 업계에서 가장 높은 인재 밀도를 가진 연구소를 구축했다고 믿습니다”라고 Zuckerberg는 10월 실적 발표에서 밝혔습니다. Meta는 Avocado가 독점 소유가 될지에 대해 논평을 거부했으며, 대변인은 “모델 훈련 작업이 계획대로 진행되고 있다”고만 언급했습니다.
471 조회
0 추천
2025.12.10 등록
• Anthropic의 연구원 Barry Zhang와 Mahesh Murag는 수많은 특수 목적 AI 에이전트를 계속 만들어 내기보다는, 재사용 가능한 “스킬(skills)”에 의해 구동되는 단일 범용 에이전트를 사용할 것을 기업들에게 촉구하고 있으며, 이 개념을 뉴욕에서 열린 AI Engineering Code Summit와 월요일에 공개된 강연에서 설명했다.• 이러한 **에이전트 스킬(Agent Skills)**은 절차적 지식, 지침, 스크립트를 정리한 폴더 형태로 구성되어 있으며, 에이전트가 도메인 전문성과 실제 세계 문맥을 결여한 부분을 보완하는 것을 목표로 한다. 이들은 이미 회계, 법률, 채용 등 다양한 분야에 도입되었고, 10월 16일 해당 기능이 출시된 이후 일부 포춘 100대 기업에서는 내부용 AI 플레이북으로 활용하고 있다.• 스킬 중심 모델은 AI 에이전트의 영향력을 둘러싸고 업계가 양분된 상황에서 등장했다. Sam Altman과 Microsoft의 AI 임원 Asha Sharma와 같은 리더들은 에이전트가 사무 업무를 혁신하고 조직의 위계를 평탄화할 것이라고 예측하는 반면, Guido Appenzeller와 같은 투자자들은 “에이전트”가 종종 더 높은 가격을 정당화하기 위해 단지 이름만 바꾼 챗봇에 불과하다고 경고한다.
468 조회
0 추천
2025.12.09 등록
The Verge는 크리에이터 이코노미가 인터넷을 광고로 포화된 환경으로 변모시킴으로써 인터넷을 파괴했다고 주장하며, 가장 성공한 콘텐츠 크리에이터들조차 혁신적인 수익화 전략을 포기하고 소비재 제품 판매로 회귀했다고 말한다.4억 5천만 명이 넘는 유튜브 구독자를 보유하고 있음에도 불구하고, MrBeast의 제작사는 2024년에 1억 1천만 달러 이상의 손실을 기록했으며, 그의 바이럴 영상들은 주로 Walmart와 같은 소매업체에서 판매되는 그의 Feastables 초콜릿 바를 홍보하는 도구로 활용되었다.MrBeast의 미디어 부문이 2024년에 거의 8천만 달러의 손실을 기록한 반면, 그의 Feastables 브랜드는 비슷한 수익을 창출하면서도 2천만 달러 이상의 수익을 올렸으며, 이는 크리에이터들이 콘텐츠 자체보다는 실물 제품에 점점 더 의존하여 사업을 유지하고 있음을 보여준다.
489 조회
0 추천
2025.12.09 등록
Nvidia CEO 젠슨 황은 12월 3일 조 로건과의 인터뷰에서 칩 가용성이 아닌 전력 공급이 AI의 주요 병목 현상이 되었다고 말하며, 기술 기업들이 6~7년 내에 데이터 센터 근처에서 수백 메가와트를 생산하는 자체 소형 원자로를 운영할 것이라고 예측했습니다.황의 예측은 업계 동향과 일치하는데, Google은 2024년 10월 소형 원자로 개발업체 Kairos Power로부터 500메가와트를 구매할 계획을 발표했으며, 첫 번째 첨단 원자로는 2030년을 목표로 하고 있습니다.Goldman Sachs는 데이터 센터 전력 소비가 2023년 대비 2030년까지 175% 급증할 것으로 예상하며, 국제에너지기구는 전 세계 데이터 센터 소비가 2030년까지 945테라와트시로 두 배 이상 증가할 것으로 전망합니다.
456 조회
0 추천
2025.12.09 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입