Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
842 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 18 페이지
구글이오픈소스모델인'젬마3(Gemma3)'의내부작동원리를분석할수있는도구인'젬마스코프2(GemmaScope2)'를출시하며AI의'블랙박스'현상을규명하기위한연구결과를공개했습니다.이도구모음은인공지능이탈옥이나환각증상을보이거나아첨하는태도를취할때내부의어떤기능이활성화되고네트워크를통해어떻게전달되는지를실시간으로추적하여AI의안전성과정렬상태를정밀하게검사할수있도록돕습니다.특히모든레이어에포함된'트랜스코더'기술을통해인공지능내부에서정보가어떻게전파되고계산되는지그구체적인경로를파악할수있게함으로써,AI모델의신뢰도를높이고윤리적인행동제어를가능하게하는데기여할것으로기대됩니다.
409 조회
0 추천
2025.12.29 등록
구글은생성AI가단순히텍스트답변을내놓는것을넘어,대화맥락에맞는사용자인터페이스(UI)를직접생성할수있도록돕는오픈소스프로토콜'A2UI'를출시했습니다.기존에는AI가HTML코드등을보내UI를구현하려했으나,보안위험과앱디자인과의부조화문제가있었습니다.A2UI는UI구성요소를'데이터(JSON)'형태로전달하여각앱의프레임워크에맞춰안전하고자연스럽게렌더링하도록설계되었습니다.이프로토콜의가장큰특징은보안성과유연성입니다.실행가능한코드가아닌사전에약속된컴포넌트정보만주고받기때문에임의스크립트실행과같은보안공격을방지할수있습니다.또한앵귤러,플러터,리액트등다양한개발환경에서재사용이가능하며,AI가계산을수행하는동안UI가실시간으로구성되는스트리밍방식의점진적렌더링을지원해사용자경험을크게향상시킵니다.A2UI는여러기업의AI에이전트들이협업하는'멀티에이전트'환경에서복잡한작업을효율적으로처리하기위해개발되었습니다.예를들어레스토랑예약처럼텍스트로만대화하기번거로운상황에서AI가즉시예약폼이나버튼을생성해사용자에게보여줌으로써작업속도를높여줍니다.구글은이표준기술을통해서로다른시스템의AI들이안전하고일관된방식으로사용자와소통할수있는기반을마련할계획입니다.
420 조회
0 추천
2025.12.28 등록
미국이인공지능(AI)패권전쟁에서초기승기를잡았음에도불구하고,화석연료중심의에너지정책때문에결국중국에역전당할수있다는경고가나왔습니다.트럼프행정부는생산성회복을위해AI발전을강조하고있지만,재생에너지를확대하는중국과달리화석연료의존도를높이고있어장기적인비용경쟁력에서뒤처질위험에처해있습니다.중국은태양광과해상풍력등재생에너지를빠르게늘리며AI전력비용을낮추고있는반면,미국은2030년대까지데이터센터전력의상당부분을천연가스등비싼화석연료에의존할전망입니다.에너지비용곡선이하락하는재생에너지와달리화석연료는비용압박이커질수밖에없어,저렴한에너지를확보한중국AI산업이가격경쟁력에서유리한고지를점할것으로분석됩니다.또한,화석연료발전과데이터센터운영에필요한막대한용수공급문제도미국AI산업의발목을잡는요인으로지적되었습니다.현재미국신규데이터센터의상당수가물부족지역에위치해있어,향후물부족심화와식량안보위기가사회적비용상승으로이어져AI발전을가로막는경제적부담이될수있다는진단입니다.
410 조회
0 추천
2025.12.28 등록
많은기업이인건비를줄이기위해인공지능(AI)도입을서두르고있지만,직원의역할을지나치게단순화해판단하는'도어맨의오류'에빠져오히려비용이증가하는부작용을겪고있습니다.이는겉으로드러난핵심업무만자동화하면인간을완전히대체할수있다는잘못된믿음에서비롯됩니다.실제로AI상담원을도입했던금융권이나패스트푸드체인등에서고객불만이폭증하고서비스품질이저하되는사례가잇따르고있습니다.인간직원이제공하던섬세한응대나맥락이해같은'보이지않는가치'가사라지면서,결국해고했던직원을복귀시키거나서비스를재검토하는등추가비용을지불하게된것입니다.전문가들은AI가인간을완전히대체하기보다인간의판단력과결합될때가장큰효과를낼수있다고강조합니다.효율성만을기준으로기술을도입하기에앞서,해당직무가실제현장에서어떤복합적인가치를창출하는지깊이이해하는능력이기업경영의핵심과제로떠오르고있습니다.
412 조회
0 추천
2025.12.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입