Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
643 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 79 페이지
MITTechnologyReview는계획,추론및작업을독립적으로수행할수있는자율시스템인에이전틱AI가기존의운영사일로를해체하는통합데이터패브릭아키텍처를통해머신데이터를통합함으로써조직이디지털복원력을근본적으로재고할것을요구한다고보도했습니다.​Cisco의자회사인Splunk의KamHathi에따르면,전세계AI투자가2025년까지1조5천억달러에달할것으로예상됨에도불구하고,예기치않은상황에서서비스연속성과보안을보장할수있는조직의능력에대해확신을표명하는비즈니스임원은절반도되지않습니다.​인간이생성한콘텐츠로훈련된초기AI시스템과달리,에이전틱AI는장치와애플리케이션의로그,메트릭및텔레메트리와같은머신데이터에대한원활한접근을필요로하지만,현재이러한자율시스템을완전히활성화하는데필요한통합수준을달성하는조직은거의없으며,이는이상징후와부정확성의위험을초래합니다.
669 조회
0 추천
2025.11.21 등록
취리히에본사를둔로보틱스스타트업Flexion은전Nvidia연구원들이설립한회사로,휴머노이드로봇이다양한환경에서자율적으로작동할수있도록하는인공지능소프트웨어개발을위해시리즈A펀딩으로5천만달러를확보했습니다.이번라운드는DSTGlobalPartners가주도했으며,NVentures,Redalpine,ProsusVentures,MoonfireVentures가참여했습니다.​11월20일발표된이번펀딩으로Flexion은1월설립이후총5,735만달러의자본을조달했으며,이는베이에리어에미국본사를개설하고,31명으로구성된팀을확장하며,컴퓨팅인프라와로봇플릿을확대하는데사용될예정입니다.회사는연간로봇당소프트웨어라이선스모델을통해주요주문자상표부착생산(OEM)파트너들과함께자율플랫폼의상용화를가속화할계획입니다.​원격조작에서벗어나기Flexion은인간작업자가원격으로로봇을제어하는원격조작방식을지양하고,대신고성능물리시뮬레이션에서생성된합성데이터와강화학습기법을결합한방식을선호함으로써경쟁사들과차별화됩니다.ETH취리히에서수년간의연구를거쳐CTODavidHoeller,JulianNubert,FabianTischhauser와함께회사를공동설립한CEONikitaRudin은원격조작기반접근방식이"수십만시간의수동인간시연을필요로하며"이는근본적으로확장될수없다고주장합니다.​이회사의플랫폼은Rudin이설명하는"완전자율스택"을제공하며,언어수준추론,비전-언어-행동모션생성,트랜스포머기반전신제어기능을갖추고있어로봇이최소한의인간개입으로명령을이해하고새로운상황에적응할수있습니다.단일로봇형태에초점을맞춘경쟁사들과달리,Flexion의형태무관시스템은휴머노이드로봇,바퀴형플랫폼,다중팔시스템전반에걸쳐작동하도록설계되었습니다.​급증하는로봇공학투자Flexion의투자유치는로봇공학벤처캐피털에있어활발한한해동안이루어졌으며,Crunchbase데이터에따르면11월19일기준전세계적으로107억달러이상이투자되어이미2021년이후모든연도를넘어섰다.이분야는2025년2분기에만거래가치가88억달러로급증하여전분기대비170.5%증가했다.경쟁사인PhysicalIntelligence는최근56억달러의기업가치로6억달러를유치했으며,FigureAI와Apptronik을포함한다른휴머노이드로봇스타트업들도10억달러이상의기업가치를확보했다.​Redalpine의투자자PhilipKneis는Flexion이"스택에서가장어렵고방어가능한부분인로봇을위한공유두뇌구축"에집중하기때문에두각을나타냈다고말했다.ProsusVentures의SandeepBakshi는로봇기반모델개발자들이"결국시뮬레이션기반훈련을크게활용해야할필요가있기"때문에이스타트업의시뮬레이션우선접근방식이승리할수있는위치에있다고언급했다.
613 조회
0 추천
2025.11.21 등록
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
641 조회
0 추천
2025.11.21 등록
Google은사용자가"이것이AI로생성된것인가요?"라고질문하여이미지가GoogleAI도구에의해생성되었거나수정되었는지확인할수있는기능을Gemini앱에추가하고있으며,향후에는이검증기능을동영상,오디오,그리고Google검색으로확대할계획입니다.​이기능은현재Google의독점적인보이지않는워터마킹기술인SynthID에기반하고있지만,앞으로는업계표준인C2PA(콘텐츠출처및진위연합)자격증명을지원하게되어,OpenAI의Sora를포함한더다양한AI도구에서생성된콘텐츠도탐지할수있습니다.​TikTok도이번주에AI생성콘텐츠에C2PA워터마킹을도입하겠다고발표했으나,이러한탐지시스템의보다광범위한활용은소셜미디어플랫폼이수동사용자검증이아니라자동플래그기능을개발하는데달려있습니다.
669 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입