AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 11.20 14:56
25 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,144 / 27 페이지
(퍼플렉시티가정리한기사)기업회계자동화에초점을맞춘창업1년차인공지능스타트업Maxima가시드및시리즈A펀딩을합쳐4,100만달러를조달했다고캘리포니아주샌마테이오에본사를둔이회사가화요일발표했다.이번라운드는RedpointVentures와KleinerPerkins가주도했으며,AudaciousVentures와전NFL선수JoeMontana가참여하여회사가치를1억4,300만달러로평가받았다.​이번펀딩은AI기반기업용소프트웨어,특히백오피스운영을대상으로하는도구에대한투자자들의급증하는관심을반영한다.AI스타트업에대한벤처캐피탈투자는2025년전세계적으로1,927억달러라는기록적인수준에도달할것으로예상되며,이는전세계모든벤처펀딩의절반이상을차지한다.기업회계자동화시장은2025년124억4천만달러에서2033년까지284억3천만달러로성장할것으로예상된다.​기존공급업체에대한도전Maxima의플랫폼은조정,분개입력,재무마감워크플로우와같은노동집약적인회계업무를자동화하는것을목표로하며,SAP및BlackLine과같은기존업체들과경쟁하고있습니다.이회사는자사의AI에이전트가회계팀이검토할재무보고서를준비할수있으며,정확성을유지하면서마감주기를최대80%까지단축할수있다고주장합니다.​EY,Citigroup,Barclays,Rubrik에서재무업무를담당했던CEOYogiGoel은Reuters와의인터뷰에서"그들은인간이업무를수행하고감사자가와서업무를확인할수있도록업무를기록한다는핵심가정을가지고있었습니다"라고말했습니다."우리는에이전트가업무를수행하고인간이이를검토한다는관점에서완전히처음부터새로시작하고있습니다."​이번발표는올해초MIT연구에서AI파일럿프로젝트의95%가초기테스트를넘어서지못한다는결과가나온후기업환경에서AI신뢰성에대한우려가지속되는가운데나왔습니다.그러나Goel은회사가"고객을위해수백만건의거래를처리했으며단한건의오류도발생하지않았다"고밝혔습니다.​초기견인력Maxima의고객으로는핀테크기업SpotOn,HR소프트웨어스타트업Rippling,그리고ScaleAI가있으며,ScaleAI의회계책임자JoshuaWaldron은로이터에이플랫폼이변동분석과같은작업에소요되는시간을며칠에서몇시간으로단축했다고말했습니다.2024년8월Goel과전Twitter엔지니어AkshayaSrivatsa,그리고전Netflix엔지니어JackLiao가공동창립한이회사는신규자본을활용하여31명의팀을확장하고제품개발을가속화할계획입니다.​이번투자라운드에는전BlackLine임원인AndresBotero와EricBorrmann,그리고Rubrik과Vanta의CFO들도참여했습니다.10월에Maxima는RedpointVentures의첫번째AI64목록에선정되어기업용AI애플리케이션을형성하는가장유망한비상장기업으로인정받았습니다.
31 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)샌프란시스코에본사를둔엔터프라이즈AI스타트업Writer는11월17일,인공지능을대화형도구에서복잡한비즈니스워크플로를자율적으로실행하는시스템으로전환하도록설계된포괄적인자동화플랫폼WriterAgent를공개했다.​이번출시에는반복작업을재사용가능한템플릿으로변환하는Playbooks,자동화된워크플로를예약하는Routines,그리고GoogleWorkspace,Microsoft365,Snowflake,HubSpot을포함한애플리케이션에연결되는엔터프라이즈ModelContextProtocol게이트웨이가포함된다.WriterCEOMayHabib에따르면,이플랫폼은"한명의영업담당자가챗봇에게아웃리치이메일작성을요청하는것과기업이1,000명의담당자모두가브랜드에부합하고규정을준수하며상황을인식하는메시지를타겟계정에보내도록보장하는것사이의차이"를나타낸다.​혼잡한엔터프라이즈시장에서경쟁하기Writer에이전트는10월에AppBuilder와Workflows기능을출시한Microsoft의Copilot,그리고10월에사용자당월30달러에출시된Google의GeminiEnterprise에정면으로도전장을내밀고있다.Anthropic또한10월에Claude모델에맞춤형워크플로우기능을추가하는AgentSkills를선보였다.이러한움직임은챗봇에서엔터프라이즈소프트웨어스택전반에걸쳐다단계작업을수행할수있는자율시스템으로업계전체가전환하고있음을보여준다.​Writer의플랫폼은자체개발한PalmyraX5추론모델을기반으로동작하며,이모델은약1,500페이지에해당하는최대100만토큰컨텍스트윈도우를제공하고,입력을22초만에처리한다.이회사는합성데이터기법을사용해,약7십만달러라는비용으로모델을개발했으며,이는OpenAI가유사시스템에투자한것으로추정되는1억달러의일부분에불과하다.프로덕트매니지먼트디렉터인도리스주(DorisJwo)는브랜드프레젠테이션생성,캘린더요약을Slack과동기화,영업통화분석과같이전통적으로수시간의수작업이필요했던워크플로우데모를선보였다.​엔터프라이즈제어로플랫폼차별화Writer는소비자용AI도구와달리,관리자가웹액세스를제한하고,커넥터권한을관리하며,모든에이전트작업의감사추적을유지할수있도록하는세분화된IT제어기능을강조합니다.2024년11월2억달러규모의시리즈C라운드에서19억달러의기업가치를달성한이회사는컴캐스트,퀄컴,우버,액센츄어등다양한고객사를확보했습니다.NewAmericanFunding의시니어콘텐츠마케팅매니저인KarenRodriguez는WriterAgent가그녀의팀이캠페인업데이트와콘텐츠변환을“몇분만에”자동화할수있게해주며,이를“무엇을해야하는지알려주는AI에서실제로해주는AI로의전환”이라고설명했습니다.​Writer는160%의순유지율을보고하고있으며,올해계약액5,000만달러를두배인1억달러까지늘릴것으로예상합니다.2020년창업초기부터시작된Writer의엔터프라이즈우선전략은연구소중심으로출발한OpenAI와Anthropic와대조적이며,애널리스트들이2030년까지1,000억달러규모로성장할것으로예상하는엔터프라이즈AI자동화시장에서유리한입지를확보하고있습니다.
34 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)Google는월요일에GenerativeUI를공개했습니다.이는AI모델이정적인텍스트응답을제공하는대신완전히맞춤화된인터랙티브인터페이스를즉석에서생성할수있게하는기술입니다.Gemini앱과GoogleSearch의AIMode에출시되는이기능은개별프롬프트에맞춤화된전체사용자경험을생성함으로써전통적인챗봇경험에서벗어나는변화를의미합니다.​Gemini3Pro로구동되는이기술은모든질문이나지시에대한응답으로웹페이지,인터랙티브도구,게임및시뮬레이션을생성할수있습니다.발표와함께게시된연구논문"GenerativeUI:LLMsareEffectiveUIGenerators"에따르면,인간평가자들은생성속도를고려하지않았을때표준대규모언어모델출력보다이러한AI생성인터페이스를강력하게선호했습니다.​동적인터페이스에대한두가지접근방식Google은Gemini앱에서두가지구현방식을테스트하고있습니다.동적뷰(Dynamicview)는Gemini3의코딩기능을사용하여각프롬프트에맞는맞춤형인터페이스를설계하고코딩하며,컨텍스트에따라콘텐츠와기능을조정합니다.시각적레이아웃(Visuallayout)은사용자가추가로커스터마이징할수있는인터랙티브모듈이포함된매거진스타일의뷰를생성합니다.​회사는연구블로그에서"5세아동에게미생물군집을설명하는것과성인에게설명하는것은서로다른콘텐츠와다른기능세트가필요하다는점을이해하여경험을맞춤화합니다"라고밝혔습니다.​Google검색에서생성형UI기능은미국내GoogleAIPro및Ultra구독자를대상으로AI모드를통해제공됩니다.사용자는모델드롭다운메뉴에서"Thinking"을선택하여특정쿼리에맞춤화된인터랙티브도구와시뮬레이션을생성할수있습니다.​기술적기반및한계이구현은Gemini3Pro를세가지핵심구성요소와결합합니다:이미지생성및웹검색을위한도구액세스,신중하게작성된시스템지침,그리고일반적인오류를해결하기위한후처리.연구를촉진하기위해Google은전문가가설계한웹사이트데이터셋인PAGEN을만들었으며,이는연구커뮤니티에공개될예정입니다.​그러나이기술은한계에직면해있습니다.현재구현은결과를생성하는데1분이상걸릴수있으며,출력물에서때때로부정확성이나타납니다.GoogleFellow인YanivLeviathan과연구논문을공동집필한동료들에따르면,이러한부분은여전히진행중인연구영역으로남아있습니다.​이발표는Google이가장지능적인모델로설명한Gemini3의광범위한출시와동시에이루어졌습니다.Gemini3Pro는LMArena리더보드에서1,501점을기록하며이전버전을능가했습니다.또한이모델은박사수준추론을위한GPQADiamond에서91.9%,도구없이Humanity'sLastExam에서37.5%를달성하는등벤치마크에서강력한성능을보였습니다.
32 조회
0 추천
11.19 등록
(퍼플렉시티가정리한기사)Alphabet소유의Waymo는화요일에5개의새로운도시에완전자율주행로보택시를배치할것이라고발표했으며,이는자율주행기술회사로서가장광범위한출시를의미합니다.이서비스는마이애미에서즉시시작되며,댈러스,휴스턴,샌안토니오,올랜도가향후몇주내에뒤따를예정이지만,대중을위한운행은2026년까지이용할수없습니다.​이번확장은자율주행차량기술의중요한전환점을나타내며,Waymo가주요대도시지역에배치를가속화하는동시에최근마이애미,댈러스,휴스턴에서자체로보택시서비스를시작할계획을발표한Tesla로부터증가하는경쟁에직면하고있습니다.​테스트완료,내년공공서비스예정Waymo는5월부터이들도시에서인간운전자가탑승한차량을테스트해왔으며,이를통해자사의자율주행시스템이현지도로상황과교통패턴에관한데이터를수집할수있도록했습니다.11월18일부터는마이애미의차량에서안전운전자를제거하기시작했으며,나머지네도시에서도앞으로몇주안에완전무인운행으로전환할예정입니다.​하지만이초기단계에서는Waymo직원들만이승객으로탑승하게됩니다.회사는피닉스,샌프란시스코,로스앤젤레스,오스틴,애틀랜타등기존서비스지역에서사용했던것과동일한방식을따라2026년쯤이들시장에서일반대중에게도서비스를개방할계획입니다.​샌안토니오의응급구조대원들은이미무인차량과관련된비상상황을처리하기위한전문교육을시작했습니다.샌안토니오소방서의JoeArrington은“어릴때젯슨가족을보며자랐죠.이제쯤이면하늘을나는자동차가나올줄알았는데,”라며농담을했습니다.“아마이것이그다음단계일지도모르겠네요”.​안전기록과증가하는경쟁Waymo는2020년상용서비스를시작한이후1,000만건이상의유료탑승을완료했습니다.이회사는기존시장전역에서매주250,000건이상의이동서비스를제공하고있습니다.​2,530만마일의자율주행을분석한SwissRe연구에따르면,Waymo는인간운전자와비교하여재산피해청구는88%,신체상해청구는92%감소한것으로나타났습니다.별도의회사데이터에따르면Waymo차량은9,600만마일의완전자율주행동안인간운전자보다심각한부상사고가91%적게발생했습니다.​Waymo가자율주행차량시장을선도하고있는가운데,Tesla는같은도시들에서로보택시서비스를출시할계획을발표하여여러시장에서직접적인경쟁구도가형성되었습니다.Tesla는6월에오스틴에서,그직후샌프란시스코에서로보택시운영을시작했지만,일부관할구역에서는현재운전석에안전모니터요원이필요합니다.
52 조회
0 추천
11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입