AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 01.08 10:06
310 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 30 페이지
• Rodney Brooks, 70세의 전 MIT 연구소 소장이자 Roomba의 공동 개발자는, 휴머노이드 로봇이 최소 15년 동안은 안전하게 가정에 도입되지 않을 것이라고 경고하며, Tesla [TSLA +2.71%]와 Figure AI 같은 회사들이 비용을 정당화하는 데 필요한 정교함을 달성하지 못해 수십억 달러가 사라질 것이라고 예측했다.[nytimes +1]• Brooks는 인간 비디오의 시각 데이터를 사용하는 현재의 훈련 방식이 근본적으로 결함이 있다고 주장하는데, 이는 인간이 조작을 위해 의존하는 필수적인 촉각 및 힘 감지 데이터가 부족하기 때문이며, Figure AI의 전 제품 안전 책임자가 11월에 회사의 로봇이 인간에게 위험을 초래할 수 있다고 경고했다가 해고되었다며 부당 해고 소송을 제기한 이후 안전 우려가 증폭되었다.[nytimes +1]• Brooks의 회의론에도 불구하고, 벤처 캐피탈리스트들과 기술 기업들은 휴머노이드 로봇 공학에 계속해서 수십억 달러를 쏟아붓고 있으며, Figure AI는 390억 달러 가치 평가로 10억 달러 이상을 모금했고, Elon Musk는 Tesla의 Optimus 로봇을 연속 작동으로 인간 생산성의 5배를 달성할 수 있는 “무한 돈 버그”라고 칭했다.[nytimes]
413 조회
0 추천
2025.12.15 등록
OpenAI의 코딩 에이전트 Codex의 제품 개발을 이끌고 있는 Alexander Embiricos는 일요일에 공개된 Lenny’s Podcast에서 인간의 타이핑 속도와 프롬프트를 지속적으로 작성하고 AI 작업을 검증해야 하는 필요성이 인공 일반 지능을 달성하는 데 있어 “현재 과소평가되고 있는 제한 요인”이라고 말했다.Codex는 8월 출시 이후 20배 성장했으며 현재 매주 수조 개의 토큰을 처리하고 있다. Embiricos는 시스템이 AI 에이전트가 지속적인 인간의 감독 없이 기본적으로 작동할 수 있도록 하면 생산성 향상이 가속화될 것이라고 주장했다.Embiricos는 얼리 어답터들이 2026년부터 극적인 생산성 증가를 경험할 것이며, AGI는 이러한 초기 성과와 주요 기업들이 AI 에이전트를 통해 완전한 자동화를 달성하는 시점 사이 어딘가에 도래할 것이라고 예측했다.
431 조회
0 추천
2025.12.15 등록
한국은 2026년 1월 22일부터 국가 인공지능 기본법을 시행할 예정이며, 2026년 8월부터 대부분의 AI 규칙을 시행할 유럽연합보다 앞서 포괄적인 인공지능 규제를 시행하는 세계 최초의 국가가 됩니다. 이러한 움직임은 최근 조사에서 한국 AI 스타트업의 98%가 대대적인 변화에 여전히 준비되지 않은 것으로 나타나면서, 국내 급성장하는 기술 부문에서 중소기업의 생존에 대한 우려를 불러일으키고 있습니다.​2025년 1월에 법률로 서명된 인공지능 육성 및 신뢰 기반 조성 등에 관한 기본법은 국가 AI 위원회 설립, 기본 3개 년 AI 계획 수립, 특정 AI 시스템에 대한 공개 의무를 포함한 안전성 및 투명성 요구사항 부과를 의무화하고 있습니다. 이 법은 위험 기반 접근 방식을 적용하며, 특히 의료, 교육, 공공 서비스와 같은 중요 부문에서 운영되는 고영향 AI 시스템에 대해서는 엄격한 규칙을 적용합니다.스타트업들, 준비 시간 부족에 경보 발령스타트업 얼라이언스가 2025년 12월 국내 AI 기업 101곳을 대상으로 실시한 조사에 따르면, 신규 규제를 준수하기 위한 대응 시스템을 구축한 기업은 단 2%에 불과한 것으로 나타났다. 나머지 기업 중 48.5%는 법에 대해 익숙하지 않고 준비가 되어 있지 않다고 답했으며, 다른 48.5%는 인지하고 있으나 준비가 부족하다고 응답했다. 조사는 불명확한 기준, 특히 통지 범위, 생성형 AI의 정의, 고영향 AI 시스템 지정 기준 등을 주요 부담 요인으로 지적했다.​한국인터넷기업협회 관계자는 현지 언론에 "절차상 요건으로 인해 시행령이 법 시행 직전에야 확정될 것으로 예상되어 기업들이 새로운 규정에 대비할 충분한 시간을 갖지 못할 수 있다"고 말했다. "특히 스타트업에게는 매우 부담스러울 것이다."​업계 관계자들은 일부 기업들이 1월 22일 이후 서비스를 갑작스럽게 수정하거나 중단해야 할 수도 있다고 경고한다. 이러한 규제 압박은 엄격한 준수 요건보다 혁신 촉진에 초점을 맞춘 부드러운 자율 거버넌스 접근 방식을 채택한 일본으로의 이전을 고려하는 한국 AI 스타트업의 수를 증가시키는 것으로 여겨진다.워터마크 요구사항이 논란을 촉발하다AI 생성 콘텐츠에 라벨을 표시하도록 요구하는 의무적 워터마킹 조항은 새로운 프레임워크에서 특히 논란이 되는 측면으로 부상했습니다. 딥페이크와 허위정보를 억제하기 위한 목적이지만, 업계 관계자들은 요구사항이 너무 모호하며 소비자들이 AI 생성 제품을 기피하게 만들 수 있다고 주장합니다.​"AI 생성 콘텐츠라도 일반적으로 품질을 향상시키기 위해 수많은 개인들이 협력하지만, 'AI 생성'으로 표시되면 소비자들이 꺼릴 수 있습니다"라고 한 AI 콘텐츠 기업의 관계자가 밝혔습니다. 2025년 12월에 발표된 AI 생성 광고에 대한 모니터링 강화 계획은 소셜 미디어 플랫폼 전반에 걸쳐 확산되는 조작된 콘텐츠와 딥페이크에 대한 우려를 더욱 강조합니다.​우려에도 불구하고, 과학기술정보통신부는 행정 벌금을 부과하기 전에 최소 1년의 유예 기간을 발표하여 기업들에게 추가 준비 시간을 제공했습니다. 배경훈 장관은 시행령이 "대한민국이 글로벌 AI 강국 3위로 도약하기 위한 제도적 초석"이 될 것이라고 강조했습니다.
402 조회
0 추천
2025.12.15 등록
인공지능(AI) 모델들의 성능 경쟁이 치열해지면서, 추론, 수리 등 종합적인 역량을 객관적으로 평가하는 다양한 벤치마크에 대한 관심이 높아지고 있습니다. 사용자의 직접적인 평가를 반영하는 '엘엠아레나(LMArena)'는 익명으로 받은 두 개의 AI 답변 중 더 우수한 것을 고르거나 무승부를 선언하여 순위를 매기는 방식입니다.기존 벤치마크의 한계를 극복하기 위해 만들어진 '인류의 마지막 시험(HLE)'은 수학, 물리학 등 100개 이상 과목의 고난도 문제를 통해 AI의 정답률을 측정합니다. 또한, AI의 자율적인 경제활동 능력을 측정하는 '벤딩 벤치(Vending-Bench)'는 AI가 재고 관리와 가격 책정 등을 얼마나 잘 수행하는지 평가합니다.이 외에도 코딩 오류 해결 능력을 평가하는 'SWE벤치'와 수학 올림피아드 난이도의 '매스아레나 에이펙스' 등 다양한 전문 벤치마크들이 활용됩니다. 하지만 이러한 AI 벤치마크는 윤리나 안전보다는 높은 경제적 보상이 기대되는 과업에만 초점을 맞춘다는 비판도 제기됩니다.
401 조회
0 추천
2025.12.14 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입