'트랜스포머' 저자, 첫 모델 출시..."중국보다 앞선 8B 오픈 소스"
페이지 정보
작성자
nedge
작성일
12.15 17:53
본문
'트랜스포머' 논문의 제1 저자인 아시시 바스와니 박사가 설립한 에센셜 AI가 80억개 매개변수(8B)를 가진 첫 오픈 소스 모델 'Rnj-1'을 출시했습니다. 이 모델은 저명한 수학자의 이름을 땄으며, 동급 오픈 소스 중 최고 수준의 성능을 목표로 '젬마 3' 아키텍처를 기반으로 구축되었습니다.
에이전트 코딩 및 STEM에 최적화된 'Rnj-1-인스트럭트'는 'MBPP+'와 '휴먼이벨' 등 광범위한 코딩 벤치마크에서 비슷한 크기의 중국 모델보다 우수하거나 동등한 성적을 거두었습니다. 특히 수학 능력 테스트인 'AIME 2025'에서 43.3점을 기록하며 더 큰 모델에 근소하게 뒤졌을 뿐, 다른 유사 크기 모델들을 크게 앞질렀습니다.
에센셜 AI는 모델 자체 역량 강화를 위해 강화 학습보다는 사전 훈련에 집중하는 개발 철학을 밝혔으며, 이로 인해 기업의 미세조정에 더 유리한 모델을 제공하고자 합니다. 회사는 소수 기업의 AI 기술 통제가 교육이나 의료 등 사람에게 이로운 분야의 발전을 저해해서는 안 된다고 강조하며 오픈 소스 정책을 고수할 것을 밝혔습니다.
댓글 0