Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 11.20 14:56
10 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,117 / 11 페이지
(퍼플렉시티가정리한기사)MetaPlatforms,Inc.는오늘오픈소스컴퓨터비전모델컬렉션인SegmentAnythingCollection의최신버전인SAM3와SAM3D를발표했으며,텍스트기반객체감지및3D재구성기능을도입하여비디오편집및콘텐츠제작워크플로우를혁신할것이라고밝혔습니다.​이번릴리스는사용자가수동선택이아닌자연어프롬프트를사용하여객체를감지하고분할할수있도록함으로써이전SegmentAnything모델과는다른방향을제시합니다.Meta의발표에따르면,SAM3는"노란색스쿨버스"또는"빨간야구모자를쓰지않고앉아있는사람들"과같은텍스트문구로설명된객체의모든인스턴스를식별할수있습니다.SAM3D는단일이미지에서객체,사람및장면의3차원모델을재구성합니다.​텍스트프롬프트와향상된정확도SAM3는Meta의연구논문에따르면LVIS벤치마크에서47.0의제로샷마스크평균정밀도를달성하여기존시스템대비22%향상된성능을나타냅니다.이모델은H200GPU에서프레임당약30밀리초로이미지를처리하며동시에100개이상의객체를처리합니다.​Meta는발표에서"SAM3는이러한제한을극복하여훨씬더광범위한텍스트프롬프트를수용합니다"라고밝혔습니다.회사는Roboflow와협력하여개발자들이특정애플리케이션을위해데이터에주석을달고,미세조정하며,SAM3를배포할수있도록했습니다.​메타제품전반에걸친즉각적인통합Meta는이미자사의제품생태계전반에두모델을배포하고있습니다.SAM3는회사의Edits비디오제작앱과Vibes플랫폼에서새로운효과를지원하여,크리에이터들이콘텐츠내특정객체에수정을적용할수있도록합니다.SAM3D는FacebookMarketplace의새로운"방에서보기"기능을구현하여,사용자들이구매전에가구및홈데코아이템을자신의공간에서시각화할수있도록돕습니다.​​두모델모두Meta의새로운SegmentAnythingPlayground플랫폼을통해접근할수있으며,기술적전문지식이필요하지않습니다.Meta는SAM3모델가중치,평가벤치마크및연구논문을공개하고있으며,SAM3D모델체크포인트와추론코드는연구커뮤니티와공유되고있습니다.
10 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)OpenAI는월요일에GPT-5.1-Codex-Max를출시하며,복잡한다중시간프로그래밍프로젝트를다루는개발자들을위한획기적인최신에이전틱코딩모델로포지셔닝했습니다.내부적으로24시간개발작업을완료한것으로알려진이모델은컨텍스트를잃지않고수백만개의토큰에걸쳐일관되게작동할수있도록하는"압축(compaction)"기술을도입했습니다.​이번출시는Google이Gemini3Pro를공개한지하루만에이루어져,개발자도구시장에서AI거대기업들간의경쟁을심화시키고있습니다.OpenAI의발표에따르면,GPT-5.1-Codex-Max는이제모든Codex플랫폼에서GPT-5.1-Codex를대체하는기본모델이되었습니다.​성능향상및벤치마크결과GPT-5.1-Codex-Max는표준소프트웨어엔지니어링벤치마크인SWE-BenchVerified에서77.9%의정확도를달성하여,Gemini3Pro의보고된76.2%를근소하게앞질렀습니다.이모델은또한SWE-LancerICSWE에서79.9%를기록하여이전버전의66.3%와비교되며,TerminalBench2.0에서는58.1%에도달했습니다.​벤치마크점수를넘어,이모델은실질적인효율성개선을제공합니다.OpenAI는GPT-5.1-Codex-Max가실제코딩작업을완료할때GPT-5.1-Codex보다약30%적은토큰을사용하면서27%에서42%더빠르게작업을완료한다고보고합니다.ZDNET에따르면,이러한효율성향상은사용량제한이있는ChatGPTPlus구독자들에게잠재적으로추가1시간의프로그래밍시간으로환산됩니다.​압축시스템은주요아키텍처발전을나타내며,컨텍스트한계에접근할때필수정보를유지하면서세션기록을자동으로압축할수있게합니다.TheDecoder에따르면"모델이컨텍스트창을채우면자동으로세션기록을압축합니다".OpenAI의시스템카드는이모델이"압축이라는프로세스를통해여러컨텍스트창에걸쳐작동하도록기본적으로훈련된최초의모델"이라고명시합니다.​가용성및내부채택GPT-5.1-Codex-Max는ChatGPTPlus,Pro,Business,Edu및Enterprise사용자를위한Codex를통해즉시사용할수있습니다.OpenAI에따르면API액세스는"곧"제공될예정입니다.이모델은또한Windows환경에최적화된최초의Codex버전입니다.​OpenAI내부채택률은상당합니다.회사의10월발표에따르면,OpenAI엔지니어의95%가매주Codex를사용하고있으며,이도구를채택하기전과비교하여현재70%더많은풀리퀘스트를병합하고있습니다.OpenAI는"7월에절반을조금넘었던것에비해오늘날거의모든엔지니어가Codex를사용합니다"라고밝혔습니다.​이모델은프롬프트인젝션및데이터유출을포함한보안위험을완화하기위해기본적으로네트워크액세스가비활성화된샌드박스환경내에서작동합니다.
11 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)Google은이번주자율에이전트를통해소프트웨어개발을혁신하겠다는야심찬AI기반개발플랫폼Antigravity를공개했지만,초기사용자들은무료프리뷰를둘러싼초기흥분을가라앉힌상당한기술적장애물에직면하고있습니다.기술적문제가출시를방해하다11월17일Gemini3AI모델과함께발표된이플랫폼은빠른크레딧소진과신뢰성문제로비판을받고있습니다.HackerNews의사용자들은집중적으로사용한지약20분만에크레딧이소진되었으며,추가할당량을구매할수있는방법이없다고보고했습니다.한개발자는"내프로젝트에사용하기시작했는데약20분후에—오,안돼.크레딧이다떨어졌어요"라고쓰면서,경쟁플랫폼인Cursor로다시전환했다고덧붙였습니다.​기술저널리스트SimonWillison은테스트중에"모델공급자과부하로인해에이전트실행이종료되었습니다.나중에다시시도해주세요"라는오류메시지를받았다고기록했습니다.DevClass출판물도유사한문제를겪었으며,에이전트매니저가무한정사용중표시를나타내다가과부하메시지와함께종료되었습니다.​VisualStudioCode의포크로구축된Antigravity는AI에이전트가코드편집기,터미널및Chrome브라우저전반에걸쳐자율적으로작동하는"에이전트우선"개발패러다임을도입합니다.이플랫폼은Gemini3Pro,Anthropic의ClaudeSonnet4.5,OpenAIGPT-OSS를포함한여러AI모델을지원합니다.Google엔지니어KevinHou는이시스템이작업을위한세가지주요인터페이스를제공한다고설명했습니다:에이전트매니저창,코드편집기,자동화된브라우저.​보안우려사항및설계선택플랫폼의이용약관은"Antigravity는특정보안제한사항이있는것으로알려져있다"고명시적으로경고하며,데이터유출과코드실행을구체적인위험으로식별하고있습니다.이러한경고에도불구하고,기본구성은"에이전트지원개발"모드로작동하며,여기서AI는어떤작업이사람의승인을필요로하는지자율적으로결정합니다.​"이용약관은민감한데이터처리를피하고에이전트가수행하는모든작업을검증할것을권고합니다.하지만Google이이를진지하게받아들였다면에이전트에게상당한자율성을부여하는제품기본값을설정하지않았을것이라고생각할수있습니다"라고DevClass는언급했습니다.​추가적인문제점으로는GoogleWorkspace계정과의호환성문제가있으며,플랫폼의FAQ는사용자가개인Gmail주소로전환할것을권장합니다.또한플랫폼은더포괄적인VisualStudioCode마켓플레이스가아닌OpenVSX확장레지스트리에의존합니다.​어려운출시에도불구하고,Google은Antigravity를개발자가코드를직접작성하기보다AI에이전트를조율하는설계자로서작동하는"에이전트우선소프트웨어개발"의미래상으로포지셔닝하고있습니다.회사는Team및Enterprise가격책정등급이곧출시될것이라고밝혔지만,에이전트워크플로우의컴퓨팅집약적특성을고려할때현재무료등급의지속가능성은여전히불확실합니다.
10 조회
0 추천
11.20 등록
(퍼플렉시티가정리한기사)YannLeCun은수요일에12년이상근무한를연말에떠나자신의인공지능스타트업을설립할것이라고발표했으며,이는소셜미디어거대기업의AI운영내지속적인격변속에서이분야의가장영향력있는선구자중한명의퇴사를의미한다.​65세의LeCun은LinkedIn게시물에서자신의새로운회사가AdvancedMachineIntelligence연구에집중할것이며,"물리적세계를이해하고,지속적인기억을가지며,추론할수있고,복잡한행동순서를계획할수있는"AI시스템을개발할것이라고밝혔다.Meta는이새로운벤처와파트너십을맺을예정이지만,협력의세부사항은아직불분명하다.​메타AI의불안정성시대이번퇴사는메타의AI부문이격동의시기를겪고있는가운데발생했습니다.10월에회사는슈퍼인텔리전스랩스에서약600개의직책을삭감했으며,이는LeCun이설립을도운기초AI연구부서에영향을미쳤습니다.이번주초,널리채택된PyTorch프레임워크의창시자인SoumithChintala가MiraMurati의스타트업에합류하기위해떠났습니다.​메타는올해ScaleAI의전CEO였던28세의AlexandrWang하에AI운영을극적으로재편했으며,그는메타가그의회사에143억달러를투자한후합류했습니다.재편성은훈련,연구,제품및인프라에집중하는네개의별개팀을만들었으며,회사의Llama4모델출시는내부적으로나외부적으로미온적인반응을얻었습니다.​갈라지는비전LeCun의Meta방향성과의철학적분열은최근몇달동안깊어졌습니다.Meta가OpenAI와Google과경쟁하기위해대규모언어모델에막대한투자를한반면,LeCun은그러한접근방식을"막다른길"이라고공개적으로비판하며,텍스트만으로훈련된AI는인간수준의지능을달성할수없다고주장했습니다.그의새로운스타트업은세계모델—물리적현실을이해하기위해비디오와공간데이터로부터학습하는AI시스템—을추구할것입니다.​LeCun은2013년Facebook에FAIR의창립이사로합류했으며,2018년이사직에서물러났지만수석AI과학자로는남아있습니다.그는딥러닝분야의혁신적업적으로GeoffreyHinton및YoshuaBengio와함께2019년튜링상을수상했습니다.그는뉴욕대학교에서시간제로계속강의할예정입니다.
10 조회
0 추천
11.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입