Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
881 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 8 페이지
구글 동영상 ai 서비스 veo3 가 업데이트 되었네요..https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video/아래 예는 일관성 부분해상도 개선과 숏폼 형태 (세로) 지원등도 소개되어 있습니다.
384 조회
0 추천
2026.01.14 등록
Executive Summary• 앤스로픽(Anthropic)이 최고제품책임자(CPO) 마이크 크리거를 내부 인큐베이터 '랩스(Labs)' 팀 공동 리더로 전환 배치• 2024년 중반 2명으로 시작한 랩스 팀, 향후 6개월 내 인원 2배 확대 계획• 인스타그램 공동창업자 출신 크리거, "AI 활용 방식을 결정할 수 있는 결정적 시기" 강조• 애플·구글 등 빅테크와 AI 스타트업 간 경쟁 심화 속 조직 개편 단행Background앤스로픽은 2024년 중반 내부 인큐베이터 '랩스' 팀을 창설해 실험적 제품 개발에 착수했다. 클로드(Claude) AI 모델로 주목받는 앤스로픽은 빅테크 기업들과의 경쟁 속에서 조직 혁신을 통해 시장 대응력을 강화하고 있다.Impact & Implications경쟁 구도 변화애플과 구글이 AI 분야에서 방어선을 강화하는 가운데, 앤스로픽의 이번 조직 개편은 AI 업계 경쟁 심화를 반영한다. 인스타그램 공동창업자 출신인 크리거의 제품 개발 역량을 실험적 프로젝트에 집중 투입함으로써, 앤스로픽은 빠르게 변화하는 AI 시장에서 선제적 대응을 꾀하고 있다.기술적 의미크리거는 "AI 모델의 역량이 너무 빠르게 발전해 활용 방식을 결정할 수 있는 시간이 바로 지금"이라고 밝혔다. 이는 AI 기술의 급속한 발전 속에서 제품화 속도가 경쟁력의 핵심이 되고 있음을 시사한다.산업/시장 영향다니엘라 아모데이(Daniela Amodei) 앤스로픽 사장은 "AI 발전 속도가 기존과 다른 방식의 구축, 조직, 집중을 요구한다"고 강조했다. 랩스 팀 확대는 앤스로픽이 실험적 제품을 통해 새로운 시장 기회를 선점하려는 전략으로 해석된다.Key Data & Facts항목수치/내용인물마이크 크리거 (Mike Krieger)이전 직책최고제품책임자 (CPO)신규 역할랩스 팀 공동 리더랩스 창설2024년 중반초기 인원2명확대 계획6개월 내 2배 증원Key Quote"We've reached a watershed moment in AI—model capabilities are advancing so fast that the window to shape how they're used is now."— 마이크 크리거, 앤스로픽 랩스 팀 공동 리더
810 조회
0 추천
2026.01.14 등록
Executive Summary• 앤스로픽이 파일 시스템과 직접 상호작용하는 AI 에이전트 기능 'Claude Cowork'를 연구 프리뷰로 공개• 기존 Claude Code의 기능을 비개발자도 활용할 수 있도록 확장한 것이 핵심• 사용자 컴퓨터의 폴더에 접근해 파일을 읽고, 편집하고, 생성하는 자율적 작업 수행 가능• Claude Max 구독자 대상 우선 제공, 일반 사용자는 대기자 명단 등록 필요BackgroundAI 업계는 단순 질의응답을 넘어 실질적인 업무를 수행하는 'AI 에이전트' 개발 경쟁이 치열하다. 앤스로픽은 지난 10월 'Skills for Claude'를 통해 개인화된 작업 학습 기능을 선보인 바 있으며, 이번 Cowork는 그 연장선에서 더욱 광범위한 자율 작업 능력을 부여한 것이다.Impact & Implications기술적 의미Claude Cowork는 AI가 사용자의 로컬 파일 시스템에 직접 접근해 문서 정리, 파일 편집, 콘텐츠 생성 등을 수행한다. 기존 Claude Code가 개발자 중심이었다면, Cowork는 비개발자도 활용할 수 있는 범용 AI 에이전트로 포지셔닝된다. 사용자가 지속적으로 컨텍스트를 제공하거나 출력물을 별도로 변환할 필요 없이, AI가 작업 중간에도 피드백을 반영하며 진행할 수 있다는 점이 특징이다.경쟁 구도 변화OpenAI, Google 등 빅테크 기업들도 AI 에이전트 개발에 박차를 가하는 상황에서, 앤스로픽의 선제적 출시는 시장 주도권 확보를 위한 전략으로 해석된다. 특히 macOS 앱 사이드바에서 바로 접근 가능한 UX는 일상적 업무 통합을 노린 것으로 보인다.사용자 영향 및 리스크앤스로픽은 발표와 함께 AI 에이전트의 잠재적 위험성도 경고했다. 명확하지 않은 지시가 있을 경우, Claude가 예상치 못한 행동을 할 수 있다는 점을 명시했다. 파일 시스템에 대한 광범위한 접근 권한이 부여되는 만큼, 보안과 프라이버시 측면에서 사용자의 주의가 필요하다.Key Data & Facts항목수치/내용기능명Claude Cowork출시 형태연구 프리뷰(Research Preview)이용 대상Claude Max 구독자 우선, 일반 사용자 대기자 등록플랫폼macOS 앱선행 기능Skills for Claude (2025년 10월 발표)Key Quote"Cowork can take on many of the same tasks that Claude Code can handle, but in a more approachable form for non-coding tasks."— Anthropic
420 조회
0 추천
2026.01.13 등록
으아.. 애플이 아이폰에 제미나이를 쓰겠다고 하네요..그럼 정말 안드로이드 폰하고 뭐가 달라질라나...Apple picks Google’s Gemini AI for its big Siri upgrade애플은 올해 출시될 더욱 개인화된 시리(Siri)에 구글의 제미니(Gemini) AI 모델을 적용할 예정이다.구글과 애플은 월요일에 "신중한 평가 끝에 애플은 구글의 AI 기술이 애플 파운데이션 모델(Foundation Models)에 가장 적합한 기반을 제공한다고 판단했으며,이를 통해 애플 사용자들에게 혁신적인 새로운 경험을 제공할 수 있게 되어 기쁘다"고 발표했다 .최초 보도는 cnbchttps://www.cnbc.com/2026/01/12/apple-google-ai-siri-gemini.html“After careful evaluation, we determined that Google’s technology provides the most capable foundation for Apple Foundation Models and we’re excited about the innovative new experiences it will unlock for our users,” Apple said in astatementMonday.
403 조회
0 추천
2026.01.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입