Loading...

AI 뉴스

Thinking Machines, LLM 파인튜닝을 위한 Tinker API 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.02 17:57
1,402 조회
0 추천
0 비추천

본문

b10dfcdf1ddb299a8d4f644634e2abb0xmrW.png

(퍼플렉시티가 정리한 기사)

전 OpenAI 최고기술책임자(CTO) 미라 무라티의 인공지능 스타트업인 씽킹 머신즈 랩이 오늘 첫 상업용 제품을 공개했습니다. 이들은 틴커(Tinker)를 출시했는데, 이는 연구자와 개발자를 위해 대형 언어 모델의 복잡한 미세 조정 과정을 간편하게 해주는 파이썬 기반 API입니다.


현재 비공개 베타로 제공되는 클라우드 기반 서비스인 틴커는 사용자가 값비싼 GPU 인프라나 복잡한 분산 컴퓨팅 시스템을 관리하지 않고도 AI 모델을 맞춤 설정할 수 있게 해줍니다. 무라티는 소셜 미디어 플랫폼 X에서 “티커는 연구자에게 첨단 도구를 제공하고, 실험 설계 및 학습 워크플로우 작성을 위한 깔끔한 추상화 기능을 제공하며 분산 학습의 복잡성을 처리합니다”라고 발표했습니다.


틴커는 Meta의 Llama, Alibaba의 Qwen 시리즈를 비롯해 6개 이상의 오픈 소스 모델을 지원하며, 사용자는 단 한 줄의 코드로 소형과 대형 모델을 자유롭게 전환할 수 있습니다. 이 서비스는 LoRA(Low-Rank Adaptation) 기술을 활용하여 여러 학습 작업이 컴퓨트 자원을 공유할 수 있게 해주어 하드웨어 요구사항과 비용을 줄여줍니다.

 

최고 연구 기관에서의 조기 도입


공개 발표 이전에, Tinker는 엘리트 연구팀들 사이에서 인기를 얻기 시작했습니다. 프린스턴의 Goedel 팀은 이 플랫폼을 사용하여 수학 정리 증명기를 훈련시켰으며, 보통의 훈련 데이터의 20%만을 사용하면서도 공식 수학 벤치마크에서 88%의 정확도를 달성했습니다. 스탠포드의 Rotskoff 연구실은 복잡한 분자 작업에서 화학 추론 모델의 정확도를 15%에서 50%로 향상시켰습니다.


버클리의 SkyRL 그룹은 Tinker의 인프라 추상화 없이는 실현이 어려웠을 다중 에이전트 강화학습 실험을 수행했습니다. AI 안전을 중시하는 조직인 Redwood Research는 어려운 제어 과제에 대해 Qwen3-32B 모델을 미세 조정했습니다.


“강화학습을 처음부터 시작하는 것보다 확실히 Tinker가 훨씬 단순하다,“라고 Redwood Research의 Eric Gan은 언급했습니다. 이 도구는 전 OpenAI 공동 창립자인 Andrej Karpathy를 포함한 인공지능 분야의 거장들로부터 찬사를 받았습니다. Karpathy는 Tinker를 “더 스마트한 접근 방식”이라고 칭하며, “약 90%의 알고리즘적 통제력을 제공하는 동시에 약 90%의 인프라 문제를 완화한다”고 말했습니다.

 

OpenAI 출신의 기록을 깨는 스타트업


Thinking Machines Lab는 실리콘밸리에서 가장 야심찬 AI 벤처 중 하나로, 2024년 7월에 20억 달러의 시드 자금과 120억 달러의 기업 가치를 달성했습니다. 이 라운드는 Andreessen Horowitz가 주도했으며, Nvidia, AMD  및 기타 주요 기술 기업들이 참여하여 실리콘밸리 역사상 최대 규모의 시드 라운드 중 하나로 평가받고 있습니다.


Murati는 OpenAI의 베테랑들인 John Schulman을 비롯한 동료들과 함께 회사를 공동 설립했습니다. Schulman은 ChatGPT의 강화 학습 개발을 이끌었습니다. 이 팀의 OpenAI 퇴사는 조직적 혼란 이후에 이루어진 것으로, 유명 연구자들이 기존 AI 연구소를 떠나 보다 개방적인 AI 개발 접근 방식을 추구하는 광범위한 흐름을 반영합니다.


서비스는 베타 테스트 기간 동안 무료로 제공되며, 몇 주 내로 사용량 기반 요금제가 도입될 예정입니다.

댓글 0
전체 1,266 / 296 페이지
Genspark에서 세계 최초의 Apple Watch용 AI 회의 노트 도구인 'Genspark AI Meeting Notes'를 출시했습니다. 이 도구는 iOS 및 Android 앱에서도 사용할 수 있으며, Super Agent와의 긴밀한 통합을 통해 Apple Watch에서 더블 탭 한 번 또는 휴대폰에서 한 번의 클릭만으로 모든 회의를 포괄적이고 전문적인 회의록으로 변환할 수 있습니다.이 도구의 가장 뛰어난 점은 즉시 우수한 회의록을 생성할 수 있다는 것입니다. Apple Watch에서는 더블 탭으로 녹음을 시작하면 백그라운드에서 자동으로 지속됩니다. Google이나 Outlook 캘린더와 통합하여 회의를 탭하면 바로 녹음이 시작되며, Genspark Super Agent와 원활하게 작동하여 향상된 처리 능력을 제공합니다. 고급 AI가 대화를 분석하고 핵심 정보를 추출하여 몇 분 내에 모든 참가자에게 전문적인 노트를 전달합니다.Genspark AI Meeting Notes는 '바이브 워킹(vibe working)'의 미래를 대표합니다. 이는 AI가 일상적인 업무를 처리하여 인간이 창의적 사고, 전략적 협업, 의미 있는 연결에 집중할 수 있게 하는 작업 방식입니다. AI가 문서화의 마찰을 제거함으로써 사람들이 회의에 완전히 집중하고 함께 획기적인 솔루션을 만들 수 있도록 도와줍니다.전체 프로세스는 자동으로 완료되며, 사용자는 완전하고 전문적인 수준의 회의 문서화를 받을 수 있습니다. 이 혁신적인 도구를 통해 회의 생산성의 혁명을 경험하고 회의 관리의 새로운 가능성을 발견할 수 있습니다.
2161 조회
0 추천
2025.08.13 등록
Anthropic 은 100만 토큰 컨텍스를 처리하는 클로드4 를 발표했다. 이는 기존 처리량의 5배 규모이다.이를 통해 7.5만 줄 이상의 코드를 한번에 처리하거나 수십개의 연구논문을 분석하는 것이 가능해졌다고 발표했다.현재 Anthropic API 및 아마존 Bedrock 에서 퍼블릭으로 사용 가능하며, 조만간 구글 클라우드 Vertex AI에서도 사용이 가능할 예정이라고 한다.클로드 브래드 에이브럼스는 "이전에는 문제를 작은 조각으로 나눠야 했지만, 100만 토큰 컨텍스트 윈도우로 모델이 전체 맥락을 파악할 수 있게 됐다"라며 "2500페이지 분량의 텍스트도 쉽게 처리할 수 있다"고 밝혔다.이번 발표는 오픈AI가 최근 발표한 ChatGPT-5에 대항하기 위한 것으로 보인다.
2222 조회
0 추천
2025.08.13 등록
퍼플렉시티가 구글에게 크롬을 사겠다고 제안했다.는 보도가 월스트리저널을 통해 나왔다.https://www.wsj.com/tech/perplexity-ai-google-chrome-offer-5ddb7a22퍼플렉시티는 345억달러(47조8000억원)에 크롬을 인수하겠다고 구글에 제안했다고 12일(현지시간) 보도했다.퍼플렉시티는 구글 에게 보낸 서한에서 크롬 인수 제안이 “크롬을 유능하고 독립적인 운영자에게 맡김으로써 최고 수준의 공익에 부합하는 반독점 구제책을 만족시키기 위한 것”이라고 재언했다.퍼플렉시티의 이번 제안은 미 법원이 온라인 검색 시장 경쟁 회복을 위한 방안을 제시할 예정인 가운데 나왔다.워싱턴 D.C. 연방법원 판사는 지난해 8월 미 법무부가 제기한 검색 시장 반독점 소송에서 구글의 시장 지위를 불법적인 독점이라고 판결했다. 이어 지난 4월부터 독점 해소 방안에 대한 재판이 진행됐으며, 법무부는 방안 중 하나로 구글 크롬 매각을 제안한 바 있다.물론 구글이 이에 응할지는 회의적이다.
2283 조회
0 추천
2025.08.13 등록
오픈AI가 출시하고 불만이 많아진 GPT-5를 잘쓰기 위한 프롬프트 가이드를 공개했다.https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide?ref=blog.secondbrush.co.kr이 가이드에서는 모델을 학습하고 실제 작업에 적용해 온 경험을 바탕으로 모델 출력의 품질을 극대화하기 위한 프롬프트 팁을 다루고 있다.. 에이전트 작업 성능 향상, 명령어 준수 보장, 새로운 API 기능 활용, 프런트엔드 및 소프트웨어 엔지니어링 작업을 위한 코딩 최적화 등의 개념을 살펴보고, GPT-5를 활용한 AI 코드 편집기 Cursor의 프롬프트 튜닝 작업에 대한 핵심 인사이트도 제공한다고..가이드에 따르면,"모범 사례를 적용하고 가능한 한 표준 도구를 도입함으로써 상당한 성과를 거두었으며, 이 가이드와 저희가 개발한 프롬프트 최적화 도구가 GPT-5 사용의 발판이 되기를 바랍니다. 하지만 항상 그렇듯이 프롬프트는 모든 경우에 적용되는 것은 아니라는 점을 명심하십시오. 여기에 제시된 기반을 바탕으로 실험을 수행하고 반복하여 문제에 대한 최상의 해결책을 찾을 것을 권장합니다."라고 되어 있다.Goal: Get enough context fast.목표: 빠르게 충분한 콘텍스트를 얻는다.Parallelize discovery and stop as soon as you can act.탐색을 병렬로 진행하고, 행동할 수 있게 되면 즉시 중단한다.Method:방법:Start broad, then fan out to focused subqueries.먼저 넓게 시작하고, 이후에는 구체적인 하위 쿼리로 확장한다.In parallel, launch varied queries; read top hits per query. Deduplicate paths and cache; don’t repeat queries.다양한 쿼리를 병렬로 실행하고, 각 쿼리의 상위 결과를 읽는다. 경로는 중복 제거하고 캐시에 저장한다. 동일한 쿼리를 반복하지 않는다.Avoid over searching for context. If needed, run targeted searches in one parallel batch.콘텍스트를 지나치게 탐색하지 않는다. 필요할 경우, 한 번의 병렬 배치로 목표 검색을 수행한다.Early stop criteria:조기 중단 기준:You can name exact content to change.변경할 정확한 내용을 지정할 수 있다.Top hits converge (~70%) on one area/path.상위 결과의 약 70%가 한 영역 또는 경로로 모인다.Escalate once:한 번에 에스컬레이션한다:If signals conflict or scope is fuzzy, run one refined parallel batch, then proceed.신호가 상충하거나 범위가 불분명하면, 정제된 병렬 배치를 한 번 실행한 후 진행한다.Depth:깊이:Trace only symbols you’ll modify or whose contracts you rely on; avoid transitive expansion unless necessary.변경하거나 의존하는 심볼만 추적하고, 필요하지 않다면 전이적인 확장은 피한다.Loop:반복:Batch search → minimal plan → complete task.배치 검색 → 최소 계획 → 작업 완료.Search again only if validation fails or new unknowns appear. Prefer acting over more searching.검증에 실패하거나 새로운 미지의 요소가 나타난 경우에만 다시 검색한다. 추가 검색보다는 행동을 우선한다.
2430 조회
0 추천
2025.08.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입