Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
683 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 65 페이지
Alphabet가MetaPlatforms와Meta의데이터센터에맞춤형AI칩을공급하는수십억달러규모의계약을논의중이라고TheInformation이월요일저녁보도했습니다.이는구글이AI인프라시장에서엔비디아의지배력에도전하는전략적변화를의미합니다.​제안된협약에따르면Meta는2027년부터자사시설에구글의텐서프로세싱유닛(TPU)을도입할예정이며,이르면내년부터구글클라우드에서TPU용량을임대받을계획입니다.이번거래는구글이기존에GoogleCloudPlatform을통한클라우드임대에만독점적으로TPU를제공해온오랜방침에서크게벗어난것이라할수있습니다이소식이발표된후,알파벳의주가는월요일장마감후시간외거래에서2.1%에서2.5%상승한반면,엔비디아의주가는1.8%하락했습니다.주가변동은알파벳이최근새롭게출시한Gemini3AI모델의긍정적인반응에힘입어정규장거래에서이미6%이상급등한직후에나타났습니다.​AI칩시장의전략적변화Google은Meta를비롯하여고빈도거래회사와주요금융기관등다양한잠재고객들에게TPU를적극적으로제안하고있으며,온프레미스배포가조직의엄격한보안및규정준수요구사항을충족하는데도움이될수있다고강조하고있습니다.Meta는현재자사애플리케이션전반에걸쳐매일30억명이상의사용자에게서비스를제공하는대규模AI인프라를구동하기위해주로NvidiaGPU에의존하고있습니다.​GoogleCloud경영진은TPU채택확대를통해Nvidia의연간매출의최대10%를확보할수있으며,이는수십억달러의잠재적이익을의미한다고믿고있습니다.이러한추진은AI컴퓨팅에대한글로벌수요가계속급증하고업계전반에걸쳐공급제약이지속되고있는상황에서이루어지고있습니다.​심화되는경쟁잠재적인Meta거래는맞춤형AI칩에대한Google의10년간의투자를입증할것입니다.Google은최근7세대TPU인Ironwood를출시했으며,이는이전세대보다4배의성능을제공하고2018년첫번째CloudTPU보다거의30배더에너지효율적이라고회사는주장합니다.​10월에Anthropic은수백억달러규모의거래에서Google의TPU최대100만개에액세스하기로약속했습니다.이AI스타트업은TPU의"가격대비성능및효율성"을결정의주요요인으로꼽았습니다.Google은TPU설계및제조를위해Broadcom과파트너십을맺고있으며,Broadcom의주가는월요일Google의AI모멘텀에대한긍정적인sentiment을반영하여10%급등했습니다.
553 조회
0 추천
2025.11.25 등록
Anthropic은월요일에ClaudeOpus4.5를출시하며,코딩,자율에이전트,사무생산성분야에서향상된기능을갖춘Claude4.5모델패밀리를완성했다.Amazon과Alphabet의지원을받는이AI스타트업은새로운플래그십모델을Google과OpenAI의최근출시제품에대한직접적인경쟁자로포지셔닝했다.​이모델은실제소프트웨어엔지니어링작업을위한벤치마크인SWE-benchVerified에서80.9%를달성하여,Google의Gemini3Pro(76.2%)와OpenAI의GPT-5.1CodexMax(77.9%)를능가했다.Anthropic의개발자관계책임자인AlexAlbert는BusinessInsider에이모델이"우리가정말로중요하게생각하는분야에서세계에서가장지능적인모델"을대표한다고말했다.​향상된직장역량ClaudeOpus4.5는확장된대화에서맥락을유지하는"무한채팅"과개발자가응답품질과토큰효율성의균형을맞출수있는새로운"노력매개변수"를포함하여기업사용자를대상으로하는여러기능을도입했습니다.Anthropic에따르면,중간노력수준에서이모델은ClaudeSonnet4.5의성능과일치하면서도출력토큰을76%적게사용합니다.​이번릴리스에는MicrosoftExcel및Chrome과의통합이포함되어있어AI가스프레드시트를분석하고브라우저기반작업을자동화할수있습니다.초기고객들은재무모델링에서20%의정확도향상과복잡한작업에서15%의효율성증가를보고했습니다.​시장경쟁이심화된다이번출시는지난주Google의Gemini3출시와이달초OpenAI의GPT-5.1데뷔에이어이루어졌습니다.MenloVentures의2025년중반보고서에따르면,Anthropic은기업AI시장의32%를점유하여OpenAI의25%점유율을추월했습니다.회사의시장점유율은2023년12%에서상승했으며,같은기간OpenAI는50%에서하락했습니다.​Amazon은Anthropic에80억달러를투자했으며,Google은20억달러를투입했습니다.두회사모두최근분기실적에서Anthropic지분으로인한수십억달러의미실현이익을보고했으며,Amazon은95억달러의세전이익을,Alphabet은이투자로인한지분증권에서107억달러의순이익을인식했습니다.​ClaudeOpus4.5는월$17부터시작하는Pro사용자,월$100의Max사용자,그리고Enterprise고객에게제공됩니다.이모델은GitHubCopilot과도통합되어있으며프로모션기간동안코딩에이전트의기본모델로제공될예정입니다.
543 조회
0 추천
2025.11.25 등록
OpenAI와전설적인디자이너조니아이브(JonyIve)는그들의비밀스러운AI하드웨어장치의작동가능한프로토타입이존재한다는사실을처음으로공개적으로확인했으며,새로운애플엔지니어링인재들의대거이탈이프로젝트개발일정을가속화시키고있다.2023년11월23일,EmersonCollective의DemoDay에서로렌파월잡스(LaurenePowellJobs)와의무대대화중,OpenAICEO샘알트먼(SamAltman)과아이브(Ive)는"우아하게단순하면서도약간장난기있는"이장치가2년이내에출시될수있다고밝혔다.이러한사실은OpenAI가불과지난한달동안40명이상의애플하드웨어엔지니어들을채용했다고블룸버그가보도한가운데나오게되었으며,이는최근실리콘밸리역사상가장공격적인인재영입사례중하나로평가되고있다.​"드디어첫프로토타입이나왔습니다,"라고인터뷰중알트먼은밝히며,디자인이"엄청나게멋지다"고극찬했다.아이브는이기기를덜위협적이고더직관적으로느껴지는기술을원하는사용자들에게매력적이라고설명하며,"거의생각할필요가없다"고말해,오늘날알림이넘치는스마트폰에서의도적으로벗어났음을시사했다.​인재유출이애플을좌절시키다이번대규모채용은OpenAI가지난해전애플임원에반스행키,탕탄,스콧캐넌과함께Ive가설립한AI하드웨어스타트업ioProducts를65억달러에인수한데에따른것입니다.이번거래는2025년7월에마무리됐으며약55명의엔지니어와디자이너가OpenAI로합류했습니다.Ive가이끄는디자인업체LoveFrom은독립성을유지하지만,회사전반에걸쳐"심층디자인및창의적책임"을맡게됩니다.​블룸버그의마크거먼에따르면,최근채용된40명은카메라엔지니어링,실리콘설계,기기테스트,제조,오디오,그리고VisionPro개발등애플의거의모든주요하드웨어부서를아우릅니다.이들이직자에는시니어디렉터와매니저도포함되어있으며,애플경영진은이번상황을중대한문제로인식하고있는것으로전해집니다.​이러한인재유출은애플이하드웨어수장존터너스(JohnTernus)의지휘아래스마트홈기기,로보틱스프로젝트,그리고잠재적으로카메라가탑재된에어팟등자사의AI기반하드웨어이니셔티브를추진하는도전적인시점에일어났습니다.또한애플은혁신된시리를2026년봄에출시하며이를구동할목적으로구글(알파벳)에게연간약10억달러를지불해제미니(Gemini)AI모델을라이선스하기로합의했으며,이모델은1.2조개의파라미터로구성되어애플이현재보유한1,500억파라미터모델을크게능가합니다.​AI하드웨어의새로운시대OpenAI와Ive의협업은인공지능이스마트폰과컴퓨터를넘어서완전히새로운물리적인터페이스를필요로한다는전략적선택을보여줍니다.기기의정확한형태는아직공개되지않았지만,이전보도에따르면화면이없고주머니에들어갈수있으며사용자의주변환경에맥락적으로반응한다는점이시사되고있습니다.알트만은사용자가기술과상호작용하고싶도록만드는것을목표라고밝혔으며,Ive는"마치한입베어물고싶을만큼매력적인"디자인테스트를적용했다고언급했습니다.​이파트너십은사용자가AI를경험하는데있어OpenAI가AI모델뿐만아니라하드웨어까지통제하겠다는의지를보여주는것으로,이는애플의수직통합이라는역사적전략을따르는셈입니다.Ive의팀이완전히합류했고애플출신인재가점점더늘어나면서,이프로젝트는원래의2026년목표에서더욱가속화되어2026년말이나2027년초에첫선을보일가능성이커지고있습니다.
576 조회
0 추천
2025.11.25 등록
OpenAI의개발자경험팀은AI를사용하여캐주얼한자연어프롬프트를통해코드를생성하는인기있는트렌드인"바이브코딩"에반대하고있으며,이러한접근방식이기업조직에심각한보안위험을초래한다고경고하고있습니다.OpenAI개발자경험팀의창립멤버인KatiaGilGuzman은최근CtrlAltLead팟캐스트에피소드에서이러한관행에반대의견을밝히며,빠르고느슨한프롬프팅이취미프로젝트에서는효과적일수있지만,기업팀은예측불가능한블랙박스가아닌구조화된팀원처럼행동하는AI시스템이필요하다고강조했습니다.​"기업팀은블랙박스가아닌팀원처럼행동하는AI시스템이필요합니다"라고Guzman은말하며,현대의AI코딩도구는구조화된풀리퀘스트를생성하고,프로젝트규칙을따르며,문서를사용하여제약을받아야한다고강조했습니다.이는규제환경에서운영되는조직에중요한기능입니다.​보안취약점이우려를증가시키다이러한거부는AI생성코드의보안위험에대한증거가증가하는가운데나온것입니다.2025년11월Veracode의연구에따르면AI생성코드의거의45%가크로스사이트스크립팅,SQL인젝션,인증취약점과같은치명적인결함을포함한보안취약점을포함하고있는것으로나타났습니다.보안회사Kaspersky는2025년10월에유사한패턴을확인했으며,AI생성애플리케이션에하드코딩된API키,클라이언트측인증로직,누락된입력검증이자주포함되어있음을발견했습니다.​2025년2월전OpenAI공동창립자AndrejKarpathy가만든용어인바이브코딩(vibecoding)은개발자가AI생성코드를완전히검토하거나이해하지않고받아들이는접근방식을설명합니다.이용어는11월에CollinsDictionary의2025년올해의단어가되었습니다.​다중에이전트복잡성보다단일에이전트Guzman은또한다중에이전트오케스트레이션에대한업계의현재집착에이의를제기하며,대부분의조직은단순히추가적인복잡성이필요하지않다고주장했습니다."적절한도구,가드레일및컨텍스트를갖춘단일에이전트는이미대부분의실용적인워크로드를처리할수있습니다"라고그녀는말했습니다.​다중에이전트아키텍처는복잡한워크플로우에서그자리가있다고Guzman은인정했지만,종종개발을가속화하기보다는오히려늦추는불필요한복잡성을도입한다고했습니다.이러한입장은여러기술제공업체들이엔터프라이즈AI도입에필수적이라고홍보해온다중에이전트시스템에대한광범위한업계의과대광고와대조를이룹니다.​앞을내다보며Guzman은사용자가시스템에적응하도록강요하는대신사용자에게맞춰적응하는보다개인화된생성형인터페이스로의전환을예측했습니다.떠오르는소프트웨어개발키트생태계와결합하여,그녀는직원들이단일지능형인터페이스를통해여러서비스와상호작용하는통합되고맥락이풍부한경험을기대하고있습니다.​2025년9월에출시된OpenAI의GPT-5-Codex는샌드박스환경,기본적으로비활성화된네트워크액세스,그리고기업배포를위해설계된내장보안제어기능을통해이러한구조화된접근방식을구현하고있습니다.
563 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입