AI 뉴스

AI 모델, 스스로 질문하며 학습하는 새로운 방식 등장

페이지 정보

작성자 symbolika
작성일 2026.01.08 10:06
344 조회
0 추천
0 비추천

본문

AI 모델 학습 연구

• 칭화대·BIGAI 연구진, 스스로 문제를 만들고 푸는 AI 시스템 'Absolute Zero Reasoner' 개발

• 인간 데이터 없이도 학습 가능한 '셀프플레이' 방식으로 추론 능력 크게 향상

• Salesforce·Meta 등 주요 AI 기업들도 유사한 접근법 연구 착수

• 연구진 "초지능(superintelligence) 달성의 첫걸음 될 수 있어"


가장 똑똑한 AI 모델조차도 본질적으로는 모방자에 불과하다. 이들은 인간이 만든 예시를 학습하거나 인간 강사가 설정한 문제를 풀면서 배운다.

하지만 AI도 보다 인간적인 방식으로 학습할 수 있다. 스스로 흥미로운 질문을 찾아내고 정답을 찾아가는 방식이다. 칭화대학교, 베이징일반인공지능연구소(BIGAI), 펜실베이니아주립대 공동 연구 프로젝트가 AI가 컴퓨터 코드를 다루며 이런 방식으로 추론을 학습할 수 있음을 보여줬다.

연구진이 개발한 'Absolute Zero Reasoner(AZR)' 시스템은 먼저 대형언어모델(LLM)을 사용해 도전적이지만 풀 수 있는 파이썬 코딩 문제를 생성한다. 그런 다음 같은 모델이 해당 문제를 풀고, 코드를 실행해 결과를 검증한다. 마지막으로 AZR 시스템은 성공과 실패를 신호로 삼아 원래 모델을 개선하며, 더 나은 문제를 제시하고 해결하는 능력을 함께 향상시킨다.

연구팀은 이 접근법이 오픈소스 언어모델 Qwen의 70억 및 140억 파라미터 버전의 코딩과 추론 능력을 크게 향상시켰음을 발견했다. 인상적인 점은, 일부 경우 인간이 선별한 데이터를 받은 모델보다 더 나은 성능을 보였다는 것이다.

이 아이디어의 원안을 제시한 칭화대학교 박사과정 연구원 Andrew Zhao와 함께 프로젝트를 진행한 BIGAI 연구원 Zilong Zheng은 화상 인터뷰에서 이 접근법이 암기나 모방을 넘어서는 인간의 학습 방식과 유사하다고 설명했다.

Zhao는 "처음에는 부모님을 따라하고 선생님처럼 행동하지만, 결국에는 스스로 질문을 던져야 합니다. 그래야 학교에서 가르쳐준 사람들을 넘어설 수 있습니다"라고 말했다.

Zhao와 Zheng은 '셀프플레이'라고도 불리는 이런 방식의 AI 학습 아이디어가 수년 전부터 있었으며, 저명한 AI 선구자 Jürgen Schmidhuber와 프랑스 Inria의 컴퓨터 과학자 Pierre-Yves Oudeyer 등이 이전에 탐구했다고 언급했다.

Zheng에 따르면 이 프로젝트의 가장 흥미로운 요소 중 하나는 모델의 문제 제시 능력과 문제 해결 능력이 함께 성장한다는 점이다. "모델이 더 강력해질수록 난이도도 높아집니다"라고 그는 말했다.

핵심 과제는 현재 이 시스템이 수학이나 코딩처럼 쉽게 검증할 수 있는 문제에서만 작동한다는 점이다. 프로젝트가 진행됨에 따라 웹 브라우징이나 사무 작업 같은 에이전트형 AI 업무에도 적용할 수 있게 될 것이다. 여기에는 AI 모델이 에이전트의 행동이 올바른지 판단하도록 하는 방식이 포함될 수 있다.

Absolute Zero 같은 접근법의 매력적인 가능성 중 하나는 이론적으로 모델이 인간의 가르침을 넘어설 수 있다는 점이다. Zheng은 "일단 그것을 달성하면 초지능에 도달하는 방법이 됩니다"라고 말했다.

Absolute Zero 접근법이 일부 대형 AI 연구소에서 주목받고 있다는 초기 징후가 나타나고 있다. Salesforce, 스탠포드, 노스캐롤라이나대학교 채플힐 캠퍼스의 'Agent0' 프로젝트는 셀프플레이를 통해 스스로를 개선하는 소프트웨어 도구 사용 에이전트를 포함한다. Absolute Zero처럼 이 모델도 실험적 문제 해결을 통해 일반적인 추론 능력을 향상시킨다.

Meta, 일리노이대학교, 카네기멜론대학교 연구자들이 작성한 최근 논문은 소프트웨어 엔지니어링에 유사한 종류의 셀프플레이를 사용하는 시스템을 제시한다. 이 연구의 저자들은 이것이 "초지능 소프트웨어 에이전트를 위한 훈련 패러다임의 첫걸음"이라고 제안했다.

AI 학습의 새로운 방법을 찾는 것은 올해 기술 업계의 주요 테마가 될 전망이다. 기존 데이터 소스가 희소해지고 비용이 증가하며, 연구소들이 모델을 더 유능하게 만들 새로운 방법을 모색하는 가운데, Absolute Zero 같은 프로젝트가 모방자에서 인간에 더 가까운 AI 시스템으로 이어질 수 있다.

댓글 0
전체 1,366 / 53 페이지
WIRED에 따르면, 1,000명 이상의 Amazon 직원들이 회사의 “모든 비용을 정당화하는 빠른 속도의 AI 혁신 접근법”이 민주주의, 고용, 환경을 위협한다고 경고하는 공개 서한에 서명했다.고위 엔지니어부터 창고 근로자까지 다양한 청원 서명자들은 Amazon이 데이터 센터에서 화석 연료 사용을 중단하고 감시 목적의 AI 배포를 금지할 것을 요구하고 있으며, 회사의 AI 추진이 해고를 정당화하는 구실로 사용되고 있고 에너지 수요로 인해 전력 공급업체들이 석탄 및 탄소 집약적 에너지원으로 회귀하도록 강요하고 있다는 우려를 제기했다.이러한 활동은 Amazon이 AI 전략과 관련하여 약 14,000개의 일자리 감축을 발표한 가운데 이루어졌으며, 해고된 직원의 거의 40%가 엔지니어였고, 회사의 탄소 배출량은 2019년 탄소 중립 서약을 발표한 이후 35% 급증했다.
605 조회
0 추천
2025.11.27 등록
WIRED는 Jeff Bezos의 비밀스러운 AI 벤처인 Project Prometheus가 컴퓨터, 차량, 우주선을 제조하기 위한 AI 시스템을 개발하는 데 62억 달러를 조달한 가운데, “번개 같은 속도”로 작동하는 컴퓨터 자동화 에이전트 Ace를 개발한 스타트업 General Agents를 조용히 인수했다고 보도했습니다.이 인수는 공동 창립자 Vik Bajaj가 General Agents 공동 창립자 Sherj Ozair를 포함한 AI 연구자들과 함께 샌프란시스코에서 프라이빗 저녁 식사를 주최한 지 불과 4일 후에 이뤄졌으며, 이후 프로젝트는 OpenAI, DeepMind, Google 출신의 100명이 넘는 직원들을 영입하며 인력을 확장했습니다.이번 계약으로 Prometheus는 2025년 70억 6천만 달러에서 2032년 932억 달러로 성장할 것으로 예상되는 빠르게 확장하는 에이전틱 AI 시장에서 유리한 위치를 선점했으며, 컴퓨터 자동화에서 속도적 우위를 가진 경쟁자를 제거함으로써 다른 경쟁자들이 따라잡기 어려운 이점을 얻게 되었습니다.
595 조회
0 추천
2025.11.27 등록
OpenAI는 11월 27일 타사 분석 제공업체인 Mixpanel의 보안 침해로 인해 API 플랫폼 고객의 제한된 사용자 데이터가 노출되었다고 확인했습니다. Mixpanel의 시스템 내에서 발생했으며 OpenAI의 인프라에는 영향을 미치지 않은 이 사건으로 인해 인공지능 회사는 해당 공급업체와의 관계를 종료하고 포괄적인 공급업체 보안 감사를 시작했습니다.Mixpanel은 11월 9일 공격자가 “스미싱(smishing)“으로도 알려진 SMS 피싱 공격을 통해 상승된 권한을 획득한 후 자사 시스템에 대한 무단 접근을 탐지했습니다. 공격자는 고객 식별 정보와 분석 데이터가 포함된 데이터셋을 유출했습니다. Mixpanel은 같은 날 OpenAI에 이를 통지했지만 11월 25일까지 영향을 받은 데이터셋을 공유하지 않았습니다.어떤 데이터가 노출되었는가침해된 정보에는 API 계정에 제공된 이름, 이메일 주소, 도시 및 주와 같은 브라우저 메타데이터를 기반으로 한 대략적인 위치 데이터, 운영 체제 및 브라우저 정보, 참조 웹사이트, API 계정과 연결된 조직 또는 사용자 ID가 포함됩니다.OpenAI는 민감한 데이터는 침해되지 않았다고 강조했습니다. 채팅 로그, API 요청, API 사용 데이터, 비밀번호, 자격 증명, API 키, 결제 세부 정보 및 정부 발급 신분증 문서는 노출되지 않았습니다. ChatGPT 사용자 및 기타 OpenAI 소비자 대상 제품은 이번 침해 사고의 영향을 받지 않았습니다.더 넓은 시사점Mixpanel 침해 사고는 OpenAI를 넘어 여러 기업에 영향을 미쳤습니다. 암호화폐 세금 플랫폼인 CoinTracker는 동일한 사고로 사용자 이메일 주소, 지리적 위치 및 기기 메타데이터가 노출되었다고 밝혔습니다. 이러한 광범위한 영향으로 기술 부문 전반에 걸쳐 제3자 공급업체 보안에 대한 우려가 제기되었습니다.OpenAI는 노출된 정보가 피싱 또는 소셜 엔지니어링 공격에 악용될 수 있다고 경고하며 사용자들에게 의심스러운 통신에 대해 경계심을 유지할 것을 촉구했습니다. 회사는 이메일, 문자 또는 채팅을 통해 비밀번호, API 키 또는 인증 코드를 요청하지 않는다고 강조했습니다.이번 사고에 대응하여 OpenAI는 즉시 모든 프로덕션 서비스에서 Mixpanel을 제거하고 전체 공급업체 생태계에 걸쳐 강화된 보안 검토를 시작했습니다. OpenAI는 “신뢰, 보안 및 개인정보 보호는 우리 제품, 조직 및 사명의 기반”이라고 밝히며, 파트너와 공급업체에게 최고 수준의 보안 기준을 요구한다고 덧붙였습니다.
628 조회
0 추천
2025.11.27 등록
네이버와 암호화폐 거래소 업비트 운영사 두나무가 27일 인공지능(AI)과 웹3 기술 융합을 통한 글로벌 시장 공략을 선언하며, 향후 5년간 10조원을 투자하겠다고 밝혔다. 전날 이사회에서 네이버파이낸셜과 두나무 간 포괄적 주식 교환을 의결한 데 따른 후속 조치다.경기 성남시 네이버 1784 사옥에서 열린 공동 기자간담회에는 이해진 네이버 의장, 송치형 두나무 회장, 최수연 네이버 대표, 오경석 두나무 대표, 박상진 네이버파이낸셜 대표 등 3사 최고 경영진이 총출동했다.차세대 금융 인프라 구축 나선다최수연 대표는 “블록체인 대중화 흐름과 AI가 스스로 판단하고 일을 처리하는 에이전틱 AI 단계로 넘어가는 과정이 맞물린 현재는 새로운 기회가 열리는 중요한 시점”이라며 기업 융합 배경을 설명했다.송치형 회장은 “3사가 힘을 합쳐 AI와 블록체인이 결합한 차세대 금융 인프라를 설계하고, 지급결제를 넘어 금융 전반, 나아가 생활 서비스까지 아우르는 새로운 글로벌 플랫폼 질서를 만들어가고자 한다”고 밝혔다.이해진 의장은 “네이버의 AI 역량은 웹3와 시너지를 발휘해야만 차세대 시장을 선점할 수 있다”며 “글로벌 기업들이 하지 않는 새로운 시도와 도전을 해야 경쟁에서 살아남을 수 있다”고 강조했다.생태계 육성에 10조원 투입최 대표는 “AI·웹3 관련 생태계 육성을 위해 5년간 10조원을 투자하겠다”며 “10조원은 최소한의 규모”라고 밝혔다. 투자는 GPU 등 기반 인프라, 기술 인재 양성, 스타트업 지원, 보안 환경 구축 등에 집중될 예정이다.이번 거래가 성사되면 국내 최대 인터넷 기업 네이버, 연간 80조원 결제 규모를 보유한 네이버파이낸셜, 글로벌 톱티어 디지털 자산 거래량의 업비트를 운영하는 두나무의 역량이 결집된다. 주식 교환 비율은 두나무 1주당 네이버파이낸셜 신주 2.54주로, 기업가치 비율은 1대 3.065로 산정됐다.송치형 회장은 “타이밍을 놓치면 글로벌 경쟁자들의 선전을 따라가기 어려운 환경이 될 것”이라며 시급성을 강조했다. 합병 완료를 위해서는 내년 5월 예정된 주주총회에서 출석 주주 3분의 2 이상, 발행주식 총수 3분의 1 이상의 찬성이 필요하다.
616 조회
0 추천
2025.11.27 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입