Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
692 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 63 페이지
TheAIGRID비디오는TheInformation의보도를바탕으로OpenAICEOSamAltman이Google의부활한Gemini3모델이경쟁력을확보함에따라"험난한분위기"와일시적인경제적역풍에대해직원들에게경고한내부메모를분석합니다.​Anthropic은더늦게출시했음에도불구하고2025년동안API수익에서OpenAI를추월할것으로예상되며,OpenAI의생성형AI트래픽점유율은지난1년간Google이5.6%에서13.7%로상승하면서하락했습니다.​​SalesforceCEOMarcBenioff는3년간의일일사용끝에ChatGPT를포기하고Gemini3로전환한다고발표하며이를"놀라운"도약이라고평가했으며,OpenAI는2029년까지1,150억달러의현금소진이예상되는반면Google은연간700억달러의잉여현금흐름을보유하고있습니다.
610 조회
0 추천
2025.11.25 등록
OpenAI는월요일에ChatGPT의새로운쇼핑리서치기능을출시하여,무료계정부터유료구독까지모든사용자에게블랙프라이데이쇼핑러시직전에제품발견과비교를간소화하도록설계된AI기반쇼핑어시스턴트에대한액세스를제공했습니다.​이기능은OpenAI의커머스분야로의가장과감한진출을나타내며,이미수억명의소비자가제품조사를위해ChatGPT를이용하는수익성높은온라인쇼핑시장에서Amazon및Google과직접경쟁할수있는위치에회사를놓았습니다.온라인쇼핑에대한새로운접근ShoppingResearch는제품검색을대화형상호작용으로전환하여,리뷰사이트,소매업체목록,Reddit과같은커뮤니티포럼에서최신정보를검색하기전에명확한질문을던집니다.사용자는"작은아파트를위한가장조용한무선스틱청소기찾기"와같이자연어로자신의요구사항을설명할수있으며,몇분안에맞춤형구매가이드를받을수있습니다.​이도구는강화학습을사용하여쇼핑작업에특화되도록훈련된GPT-5mini의특수버전으로구동됩니다.OpenAI는이모델이사용자쿼리의모든측면과일치하는항목을정확하게식별하는비율이64%로,이전ChatGPT버전의37%에서향상되었다고주장합니다.이기능은전자제품,뷰티제품,가전제품,스포츠장비와같이세부정보가많은카테고리에서뛰어난성능을발휘합니다.​연휴쇼핑객을지원하기위해OpenAI는시즌내내모든계정유형에서거의무제한사용을제공하고있습니다.사용자는항목을"관심없음"또는"이와유사하게"로표시하여실시간으로검색을개선할수있으며,AI는그에따라추천을조정합니다.​심화되는경쟁이번출시는기술대기업들이AI기반상거래지배를두고경쟁하는가운데이루어졌습니다.지난주아마존은루퍼스(Rufus)쇼핑어시스턴트를업그레이드하여가격이력추적과목표가격에도달하면자동으로상품을구매하는기능을추가했습니다.구글또한11월중순에현지매장에전화해상품재고와가격을확인하는AI등유사한도구들을도입했습니다.​오픈AI의접근방식은단일소매업체의재고가아닌전체웹을스캔하는점에서차별화됩니다.그러나현재이기능은아마존상품목록은제외하며,사용자가아마존사이트에서직접재고를확인하도록안내합니다.오픈AI는추천이"유기적이며광고지원이아닌",특정소매업체를우대하지않는다는점을강조합니다.​현재ShoppingResearch는사용자가구매를위해외부소매업체웹사이트로연결되지만,오픈AI는이미Walmart와Target과의파트너십을맺고있어InstantCheckout기능을통해앱내에서바로결제가가능합니다.이기능은결국새로운도구와통합될예정입니다.​소비자데이터에따르면stakes는상당히높습니다.ChatGPT는이미매일약5천만건의쇼핑관련질의를처리하며,이는25억건의총일일프롬프트중약2%에해당합니다.웹분석기업Similarweb에따르면,ChatGPT는이제Walmart,Etsy,Target등주요소매업체로넘어가는레퍼럴트래픽의20%이상을유도하고있습니다.
575 조회
0 추천
2025.11.25 등록
월트디즈니이미지니어링이월요일차세대로봇올라프캐릭터를공개하며,인공지능과첨단로봇공학을통한생동감넘치는애니메이션캐릭터구현이라는엔터테인먼트거대기업의새로운장을열었다."겨울왕국"의실물크기눈사람은NVIDIA및GoogleDeepMind와의파트너십으로개발된심층강화학습으로구동되는완전한관절구조,대화능력,그리고움직임을특징으로한다.​이로봇캐릭터는2026년봄디즈니랜드파리에서3월29일개장하는월드오브프로즌랜드에서데뷔할예정이며,홍콩디즈니랜드에서도기간한정등장이계획되어있다.월트디즈니이미지니어링의사장겸최고크리에이티브책임자인브루스본(BruceVaughn)과디즈니랜드파리의사장인나타샤라팔스키(NatachaRafalski)가프랑스리조트에서열린기자회견에서이캐릭터를공개했다.​기술혁신올라프로봇은2023년부터스타워즈:갤럭시스엣지에등장한디즈니의BDX드로이드보다한단계도약한것을보여줍니다.로봇처럼보이도록설계된BDX드로이드와달리,올라프는디즈니가물리적으로불가능한방식으로움직이는애니메이션캐릭터를진정성있게재현해야했습니다.​월트디즈니이매지니어링연구개발수석부사장인카일로플린은"올라프는실제세계에서생명을불어넣기훨씬더어려운애니메이션캐릭터입니다"라고말했습니다.이캐릭터는변형가능한"눈"의상,완전히관절로연결된입과눈,탈부착가능한당근코,그리고말하고대화에참여할수있는능력을갖추고있습니다.​디즈니는2025년3월NVIDIAGTC컨퍼런스에서발표된,NVIDIA와구글딥마인드와함께개발한오픈소스시뮬레이션프레임워크인뉴턴을사용하여이캐릭터를개발했습니다.이프레임워크는로봇이시뮬레이션을통해아티스트가제공한동작을학습할수있게하여,디즈니가기계설계와애니메이션사이를빠르게반복할수있도록합니다.​확장계획디즈니랜드파리에서올라프는아렌델베이쇼에등장할예정이며,이는WorldofFrozen랜드의일부로,FrozenEverAfter어트랙션,안나와엘사와의캐릭터만남,그리고식사장소를특징으로합니다.이확장은거의두배의규모로확장될디즈니어드벤처월드(리브랜딩된월트디즈니스튜디오파크)의일부입니다.​"우리가새로운캐릭터를만들고손님들앞에선보일수있는속도는전례가없는수준입니다"라고Laughlin은말했습니다.디즈니는이기술을통해전세계파크와크루즈선에더감정적이고표현력있는캐릭터들을선보일수있을것이라고밝혔습니다.
598 조회
0 추천
2025.11.25 등록
Amazon은월요일,해커들이취약점을악용하기전에이를찾아내기위해경쟁하는인공지능에이전트팀들을배치하는새로운사이버보안방어시스템을공개했으며,이는이거대기술기업이광범위한인프라를보호하는방식에중대한변화를나타낸다.자율위협분석(AutonomousThreatAnalysis)시스템,즉ATA는2024년8월내부해커톤에서시작되었으며,회사가공개하고WIRED가최초로보도한세부사항에따르면이후Amazon의보안운영을위한중요한도구가되었다.단일AI모델에의존하는대신,이시스템은공격자를시뮬레이션하는레드팀으로작동하는전문화된에이전트들과방어를개발하는블루팀을조율하며,모두Amazon의프로덕션시스템을반영하는격리된테스트환경에서기계속도로작동한다.​파이썬공격탐지에서입증된결과이시스템은이미해커들이손상된시스템에대한원격제어를확립하기위해사용하는일반적인기술인Python역방향셸공격을탐지하는데효과성을입증했습니다.ATA의레드팀에이전트는체계적으로37개의역방향셸기술변형을생성하고실행한후,64개의위협변형에대해테스트된개선된탐지규칙을개발했습니다.Amazon의공식발표에따르면,새로운규칙은프로덕션감사데이터에대해검증했을때1.00의완벽한정밀도와재현율점수를달성했습니다.WIRED는별도로이시스템이테스트에서100%효과성에도달했음을확인했습니다.​Amazon의최고보안책임자인SteveSchmidt는WIRED에"초기개념은보안테스트의중요한한계—제한된범위와빠르게진화하는위협환경에서탐지능력을최신상태로유지하는과제—를해결하기위한것이었습니다"라고말했습니다.Amazon에따르면,이시스템은일반적인보안테스트워크플로를수주의수동작업에서약4시간으로단축하여시간을96%줄였습니다.​인간감독하의기계속도이아키텍처는Amazon이"groundedexecution"이라고부르는것을중심으로하며,모든기술과탐지주장은테스트시스템의실제원격측정데이터와타임스탬프가찍힌로그로검증되어야합니다.레드팀에이전트는검증가능한로그를생성하는실제명령을실행하고,블루팀에이전트는실제데이터베이스를쿼리하여제안된방어가작동하는지확인합니다.이는AI환각을방지하기위한설계입니다.​자동화에도불구하고Amazon은"humanintheloop"접근방식을유지하며,프로덕션시스템에배포하기전에보안전문가가모든변경사항을승인하도록요구합니다.2024년해커톤에서ATA를제안한보안엔지니어중한명인MichaelMoran은이시스템을통해보안팀이일상적인테스트작업보다는복잡한과제에집중할수있다고언급했습니다.
608 조회
0 추천
2025.11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입