Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
912 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 140 페이지
(퍼플렉시티가정리한기사)AntInternational은전세계기업을위한시계열예측을혁신하도록설계된오픈소스인공지능모델인FalconTST를공개했습니다.2025년싱가포르핀테크페스티벌에서발표된이모델은현재GitHub와HuggingFace에서전세계개발자및연구기관이이용할수있습니다.​싱가포르에본사를둔이핀테크회사는FalconTST를여러패치토크나이저를갖춘업계최초의MixtureofExperts아키텍처기반시계열예측모델로설명하며,최대25억개의매개변수를지원합니다.AntInternationalCEOYangPeng에따르면,이모델은현재회사글로벌거래의약60%를처리하고있으며,2025년첫10개월동안거래액은1.5조달러에달해2024년대비36%증가했습니다.​통화관리에서입증된결과FalconTST는2024년부터AntInternational에내부적으로배포되어시간별,일별,주별현금흐름및외환익스포저예측에서90%를초과하는정확도를달성했습니다.이모델은여러출처에따르면회사의외환비용을최대60%까지절감하는데기여했습니다.​AntInternational의최고혁신책임자인Jiang-MingYang은"검증된FalconTST모델을오픈소스화함으로써전세계과학자들이실제피드백을제공하고시계열학습의혁신을가속화하도록초대하여글로벌협업을통해이분야를발전시키는것을목표로합니다"라고말했습니다.​이모델은이미여러부문의산업파트너들과함께배포되었습니다.2025년7월,Citi와AntInternational은아시아의한항공사와함께FalconTST모델을시범운영하여초기실제거래에서외환헤지비용을30%절감했습니다.별도로CapitalA는AirAsia를위해이모델을활용하여90%의예측정확도를달성하면서외환헤지비용을최대40%까지절감했습니다.​산업전반에걸친광범위한응용재무예측을넘어,FalconTST는기업들이날씨패턴,달력이벤트,금융시장변동,국경간교통량을포함한다양한시계열데이터를예측할수있도록지원합니다.국제공항협의회(AirportsCouncilInternationalWorld)가2025년전세계항공여행객이98억명에달할것으로전망하는가운데,항공사자금관리분야에서이모델의활용은전세계소비자들의비용절감으로이어질수있습니다.​이회사는또한Shield라는두번째AI기초모델을개발했습니다.이는80억개의매개변수를가진결제위험통제모델로,매일2,200만건의거래를보호하며사기를13.5%감소시킵니다.
1253 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)바이두는11월11일ERNIE-4.5-VL-28B-A3B-Thinking을공개했다.이는오픈소스멀티모달AI모델로,중국기술대기업은이모델이여러벤치마크에서OpenAI의GPT-5와구글의Gemini2.5Pro를능가한다고주장한다.이번출시는중국과서구기술기업간격화되는인공지능경쟁에서중요한확대를의미한다.​허용적인Apache2.0라이선스로공개된이모델은총280억개의파라미터를가진전문가혼합(Mixture-of-Experts)아키텍처를사용하지만,추론당30억개만활성화하여높은성능을유지하면서도계산비용을획기적으로줄인다.바이두의발표에따르면,이모델은문서및차트이해분야의VQA,MMBench,SEED-Bench평가에서Gemini2.5Pro를능가한다.​효율성과성능의만남경량설계를통해ERNIE-4.5-VL은비슷한수준의전체매개변수모델보다2~3배빠른추론속도를제공하면서도훨씬적은메모리를요구합니다.이모델은이미지의특정영역을확대하고,잘라낸뷰를분석하며,국소적관찰을종합적인답변으로통합할수있는혁신적인"이미지를통한사고(ThinkingwithImages)"기능을도입했습니다.​바이두연구진은동적난이도샘플링을적용한GSPO및IcePop을포함한고급강화학습전략을활용하여대규모시각-언어추론데이터에대한광범위한중간학습단계를통해이모델을훈련했습니다.이모델은시각적추론,STEM문제해결,시각적그라운딩,도구활용및비디오이해분야에서뛰어난성능을발휘합니다.​전략적오픈소스추진이번출시는중국이미국기업들과경쟁하기위해오픈소스AI전략을강화하는가운데이루어졌습니다.최근분석에따르면,중국은오픈소스AI다운로드에서미국을앞질렀으며,DeepSeek,Alibaba,Baidu같은기업들이서구경쟁사들보다더빠르고저렴하게고성능모델을생산할수있음을입증하고있습니다.​남가주대학교(UniversityofSouthernCalifornia)의SeanRen은CNBC에"주요연구소가강력한모델을오픈소스로공개할때마다업계전체의기준이높아진다"고말했습니다.이러한움직임은독점API와프리미엄가격에의존하는OpenAI와Anthropic같은비공개소스제공업체들에압박을가하고있습니다.​Baidu는11월13일베이징에서열리는BaiduWorld2025컨퍼런스에서ERNIE라인업과추가AI발전사항을선보일예정입니다.이는중국의경쟁적인AI환경에서선두주자로서의입지를굳히기위한노력의일환입니다.
1321 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)막스플랑크기상연구소의연구자들은기후과학자들이그들의분야에서"성배"라고부르는것을달성했습니다:기상예보와기후모델링을완벽하게결합한1.25킬로미터해상도의지구디지털트윈입니다.​11월3일arXiv에제출된논문에자세히설명된이획기적인성과는거의킬로미터규모에서전체지구시스템의최초전지구시뮬레이션을나타내며,대기,해양,육지를통한에너지,물,탄소의흐름을포착합니다.DanielKlocke가이끄는팀은6억7천2백만개의셀을모델링했습니다—지구의육지와해양표면을덮는3억3천6백만개의셀과그위에쌓인동일한수의대기셀입니다.​전례없는컴퓨팅파워이시뮬레이션은유럽에서가장강력한두슈퍼컴퓨터에걸쳐방대한컴퓨팅리소스를필요로했습니다:스위스의Alps시스템에서8,192개의GPU와독일의JUPITER에서20,480개의GPU를사용했습니다.두시스템모두Nvidia의새로운GH200GraceHopper슈퍼칩을활용하며,이는GPU와CPU기능을결합하여모델의다양한측면을처리합니다.​연구팀은하루당145.7일의시뮬레이션을수행하는시간압축을달성했으며,거의1조개의자유도(모델이계산해야하는값의총개수)를사용했습니다.이러한성능은유사한해상도의이전대기전용시뮬레이션을능가하며,지구시스템상호작용에대한장기연구를가능하게합니다.​해상도장벽돌파하기진정한혁신은이해상도에서"빠른"지구시스템프로세스와"느린"지구시스템프로세스를결합하는데있습니다.빠른시스템에는날씨를지배하는에너지및물순환이포함되며,폭풍이개별격자셀을가로질러이동함에따라몇분마다업데이트됩니다.느린프로세스에는탄소순환,생물권변화,그리고수년또는수십년에걸쳐진화하는해양지구화학이포함됩니다.​UniverseToday에따르면,이러한복잡한시스템을통합하는일반적인모델은40킬로미터를초과하는해상도에서만계산적으로처리가능했습니다.돌파구는수십년된Fortran코드베이스를현대화한Data-CentricParallelProgramming프레임워크를사용한정교한소프트웨어엔지니어링을통해이루어졌습니다.​이연구로팀은11월18일슈퍼컴퓨팅컨퍼런스에서발표될예정인권위있는GordonBellPrizeforClimateModelling후보로지명되었습니다.
1206 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)대만의전자제품대기업폭스콘은수요일3분기실적발표에서인공지능수요에대한낙관적인전망을시사하며,다음주OpenAI협력에대한세부사항을공개할계획을밝혔고AI가2026년가장중요한성장동력이될것으로전망했다.세계최대전자제품위탁제조업체는7-9월기간동안순이익576억7천만대만달러(18억9천만달러)를기록했으며,이는전년대비17%증가한수치로애널리스트예상치인504억대만달러를상회했다.매출은11%증가한2조6백억대만달러를기록했으며,이는클라우드제공업체들이데이터센터인프라에수십억달러를쏟아붓는가운데AI서버에대한수요가급증한데따른것이다.​AI서버가아이폰을제치고매출선두로부상AI서버생산을포함하는폭스콘의클라우드및네트워킹부문은현재전체매출의42%를차지하며,AppleiPhone조립을포함하는스마트소비자전자제품부문을2분기연속앞지르고있습니다.이는소비자전자제품이폭스콘매출의54%를차지했던2021년과비교하면극적인변화를나타냅니다.​류영웨이(YoungLiu)회장은실적발표에서투자자들에게"2026년에는AI산업의발전이가장중요한성장동력이될것으로보고있습니다"라고말했습니다.그는"2026년에대해매우낙관적입니다"라고덧붙이면서도,회사가지정학적불확실성과외환변동성을모니터링할것이라고언급했습니다.​실적보고서에서폭스콘은4분기에전년대비상당한매출성장을전망했으며,AI서버매출은전분기대비증가할것으로예상했습니다.Nvidia의최대서버제조업체인이회사는Microsoft,Amazon,Alphabet의Google을포함한거대기술기업들의AI인프라에대한전례없는투자로이익을얻고있습니다.​OpenAI파트너십세부사항다음주공개예정Liu는Foxconn이다음주타이페이에서연례기술의날행사를개최할예정이며,이자리에서OpenAI와의협력에대한세부사항을발표할계획이라고밝혔다.OpenAICEOSamAltman은10월에대만을방문하여Foxconn및TaiwanSemiconductorManufacturingCompany와만나회사의Stargate프로젝트를위한AI서버인프라및칩생산에대해논의했다.​이번예고된발표는Foxconn이2002년그래픽카드용레퍼런스디자인제작을시작한이래이어온Nvidia와의기존관계를넘어AI파트너십을심화하고있음을시사한다.Foxconn은현재범용서버와AI서버모두에서전세계시장점유율약40%를차지하고있다고주장한다.
1223 조회
0 추천
2025.11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입