Thinking Machines, LLM 파인튜닝을 위한 Tinker API 출시
페이지 정보
본문

(퍼플렉시티가 정리한 기사)
전 OpenAI 최고기술책임자(CTO) 미라 무라티의 인공지능 스타트업인 씽킹 머신즈 랩이 오늘 첫 상업용 제품을 공개했습니다. 이들은 틴커(Tinker)를 출시했는데, 이는 연구자와 개발자를 위해 대형 언어 모델의 복잡한 미세 조정 과정을 간편하게 해주는 파이썬 기반 API입니다.
현재 비공개 베타로 제공되는 클라우드 기반 서비스인 틴커는 사용자가 값비싼 GPU 인프라나 복잡한 분산 컴퓨팅 시스템을 관리하지 않고도 AI 모델을 맞춤 설정할 수 있게 해줍니다. 무라티는 소셜 미디어 플랫폼 X에서 “티커는 연구자에게 첨단 도구를 제공하고, 실험 설계 및 학습 워크플로우 작성을 위한 깔끔한 추상화 기능을 제공하며 분산 학습의 복잡성을 처리합니다”라고 발표했습니다.
틴커는 Meta의 Llama, Alibaba의 Qwen 시리즈를 비롯해 6개 이상의 오픈 소스 모델을 지원하며, 사용자는 단 한 줄의 코드로 소형과 대형 모델을 자유롭게 전환할 수 있습니다. 이 서비스는 LoRA(Low-Rank Adaptation) 기술을 활용하여 여러 학습 작업이 컴퓨트 자원을 공유할 수 있게 해주어 하드웨어 요구사항과 비용을 줄여줍니다.
최고 연구 기관에서의 조기 도입
공개 발표 이전에, Tinker는 엘리트 연구팀들 사이에서 인기를 얻기 시작했습니다. 프린스턴의 Goedel 팀은 이 플랫폼을 사용하여 수학 정리 증명기를 훈련시켰으며, 보통의 훈련 데이터의 20%만을 사용하면서도 공식 수학 벤치마크에서 88%의 정확도를 달성했습니다. 스탠포드의 Rotskoff 연구실은 복잡한 분자 작업에서 화학 추론 모델의 정확도를 15%에서 50%로 향상시켰습니다.
버클리의 SkyRL 그룹은 Tinker의 인프라 추상화 없이는 실현이 어려웠을 다중 에이전트 강화학습 실험을 수행했습니다. AI 안전을 중시하는 조직인 Redwood Research는 어려운 제어 과제에 대해 Qwen3-32B 모델을 미세 조정했습니다.
“강화학습을 처음부터 시작하는 것보다 확실히 Tinker가 훨씬 단순하다,“라고 Redwood Research의 Eric Gan은 언급했습니다. 이 도구는 전 OpenAI 공동 창립자인 Andrej Karpathy를 포함한 인공지능 분야의 거장들로부터 찬사를 받았습니다. Karpathy는 Tinker를 “더 스마트한 접근 방식”이라고 칭하며, “약 90%의 알고리즘적 통제력을 제공하는 동시에 약 90%의 인프라 문제를 완화한다”고 말했습니다.
OpenAI 출신의 기록을 깨는 스타트업
Thinking Machines Lab는 실리콘밸리에서 가장 야심찬 AI 벤처 중 하나로, 2024년 7월에 20억 달러의 시드 자금과 120억 달러의 기업 가치를 달성했습니다. 이 라운드는 Andreessen Horowitz가 주도했으며, Nvidia, AMD 및 기타 주요 기술 기업들이 참여하여 실리콘밸리 역사상 최대 규모의 시드 라운드 중 하나로 평가받고 있습니다.
Murati는 OpenAI의 베테랑들인 John Schulman을 비롯한 동료들과 함께 회사를 공동 설립했습니다. Schulman은 ChatGPT의 강화 학습 개발을 이끌었습니다. 이 팀의 OpenAI 퇴사는 조직적 혼란 이후에 이루어진 것으로, 유명 연구자들이 기존 AI 연구소를 떠나 보다 개방적인 AI 개발 접근 방식을 추구하는 광범위한 흐름을 반영합니다.
서비스는 베타 테스트 기간 동안 무료로 제공되며, 몇 주 내로 사용량 기반 요금제가 도입될 예정입니다.