AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 2026.01.08 10:06
338 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 46 페이지
• **커서(Cursor)**는 11월에 293억 달러의 가치로 23억 달러를 조달했는데, 이는 6월의 99억 달러 가치에서 거의 세 배로 오른 것이다. 한편, **앤트로픽(Anthropic)**은 9월에 183억 달러로 두 배 이상 올랐고, **오픈AI(OpenAI)**는 10월에 500억 달러에 도달했다. 이는 상위 AI 스타트업들이 불과 몇 달 사이에 여러 차례 자금을 유치하며, 각 단계마다 기업 가치가 두 배, 세 배로 증가하는 현상을 보여준다.[cnbc +5]• 2021년의 모멘텀에 기반했던 시대와 달리, 이들 스타트업은 전례 없는 매출 성장세를 보이고 있다. 커서는 2023년 출시 이후 연환산 매출 10억 달러를 돌파했으며, 앤트로픽은 2025년 1월에서 8월 사이에 러너레이트(연간 환산) 매출이 10억 달러에서 50억 달러 이상으로 급증했다. 투자자들에 따르면, AI 기업들은 기존 소프트웨어 기업들보다 두세 배 빠른 속도로 주요 이정표를 달성하고 있다.[cnbc +2]• 벤처 투자자들은 과도한 현금 소진률과 부풀려진 기업 가치가 위험을 초래할 수 있다고 경고한다. 바이슨 벤처스(Bison Ventures)의 탐 비갈라(Tom Biegala)는 “이들 기업 중 상당수는 반드시 그러한 밸류에이션까지 성장하지 않을 수 있으며, 분명히 손실이 발생하는 경우도 보게 될 것”이라고 경고했다. 시장 집중과 잠재적 조정에 대한 우려가 커지고 있다.[fortune]
560 조회
0 추천
2025.11.30 등록
• OpenAI는 ChatGPT 내에서 광고를 내부적으로 테스트하고 있으며, Android 앱 베타 버전에서 “search ad” 및 “search ads carousel”에 대한 코드 참조가 발견되어 초기에는 검색 경험으로 광고를 제한할 것으로 보입니다.[bleepingcomputer +2]• 이 회사는 2025년 말까지 연간 반복 수익 200억 달러를 달성할 궤도에 있지만, 올해 80억 달러를 소진하고 2029년까지 1,150억 달러의 손실이 예상되며 8년에 걸쳐 1.4조 달러의 컴퓨팅 지출을 약속하면서 재정적 압박이 커지고 있습니다.[observer +2]• 광고 테스트는 ChatGPT가 매일 약 5천만 건의 쇼핑 쿼리를 처리하는 가운데 OpenAI가 11월에 Shopping Research 기능을 출시한 것에 따른 것이며, CEO Sam Altman은 구독 및 엔터프라이즈 솔루션을 넘어 수익을 다각화하기 위해 회사가 “언젠가 광고를 시도할 것”이라고 인정했습니다.[digitalcommerce360 +2]
549 조회
0 추천
2025.11.30 등록
Palantir [ +1.89%] 주가는 11월에 17% 급락하여 2023년 8월 이후 최악의 월간 하락률을 기록했습니다. 이는 투자자들이 밸류에이션 우려와 공매도 투자자 마이클 버리가 회사에 대한 9억 달러 규모의 공매도 포지션을 공개한 후 AI 관련 주식에서 손을 뗐기 때문입니다.[cryptorank]이번 매도는 월스트리트 예상을 상회하는 11억 8천만 달러의 매출로 강력한 3분기 실적을 기록했음에도 불구하고 발생했습니다. Jefferies, RBC Capital Markets, Deutsche Bank를 포함한 여러 애널리스트들이 회사의 선행 주가수익비율(forward earnings)이 약 233배로 Nvidia [ -2.08%]의 38배와 비교해 “극단적인” 밸류에이션이라고 지적했습니다.[cryptorank]CEO 알렉스 카프는 버리를 시장 조작으로 비난하고 공매도 포지션을 “완전히 미친 짓”이라고 부르며 회사를 방어했습니다. 한편 광범위한 AI 섹터 후퇴로 Nvidia는 12% 이상 하락했고, Microsoft [ +1.34%]와 Amazon [ +1.75%]은 약 5% 하락했으며, Apple [ +0.29%]과 Alphabet만이 11월에 상승세를 기록했습니다.[cryptorank]
562 조회
0 추천
2025.11.30 등록
2025년스마트워치산업은웨어러블기기를단순한피트니스트래커에서만성질환의조기경고신호를감지할수있는임상등급센서와인공지능을갖춘정교한건강모니터링시스템으로변모시켰습니다.삼성,애플,Garmin의최신세대기기들은이제수면의질부터심혈관부담까지모든것을추적할수있는고급바이오센서를탑재하여손목에서예방적헬스케어로의전환을보여주고있습니다.임상급모니터링이소비자기기에도달하다2025년7월출시된삼성의GalaxyWatch8시리즈는일주기리듬을분석하여최적의수면시간을권장하는취침가이드(BedtimeGuidance)와수면중심혈관부담을측정하는혈관부하(VascularLoad)추적을포함한여러건강혁신기능을도입했습니다.이기기들은또한5초만에카로티노이드수치를평가하여산화스트레스와전반적인웰빙에대한통찰력을제공하는항산화지수(AntioxidantIndex)기능을탑재하고있습니다.​애플은2025년9월WatchSeries11의고혈압감지기능에대해FDA승인을받았으며,이기능은광학센서를사용하여30일동안심장박동에대한혈관의반응을분석합니다.이알고리즘은만성고혈압과관련된일관된패턴을수동적으로모니터링하며,애플에따르면이전에진단받지못한100만건이상의사례를잠재적으로식별할수있습니다.Series11은또한24시간배터리수명과AppleIntelligence로구동되는수면점수기능을제공합니다.​가민의2025년11월소프트웨어업데이트는수십개의워치모델에건강상태(HealthStatus)기능을도입했으며,이는안정시심박수,심박수변이도,맥박산소측정,호흡,피부온도를분석하여개인화된건강기준선을생성합니다.이시스템은지표가정상범위를벗어나는경향을보일때사용자에게알림을보내며,이는질병,과훈련또는스트레스를나타낼수있습니다.​AI통합확대로시장급등글로벌스마트워치시장은2025년1,083억1,000만달러에달할것으로예상되며,연평균12.9%의성장률을기록할것으로전망됩니다.고급건강모니터링기능이도입을촉진하고있으며,웰니스애플리케이션이시장점유율의35%이상을차지하고있습니다.북미는건강중심웨어러블의조기도입과확장된무선인프라에힘입어전세계성장의40%를차지합니다.​이러한기기들은이제여러데이터스트림을동시에처리하는AI기반분석을통합하여,개인화된웰니스점수와불규칙한심장리듬,탈수위험및수면장애에대한예측알림을제공합니다.삼성의갤럭시워치8은구글제미나이통합을특징으로하는최초의스마트워치가되어,음성제어건강추적및운동관리를가능하게했습니다.
576 조회
0 추천
2025.11.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입