Loading...

AI 뉴스

OpenAI, 긴 코딩 작업을 위한 GPT-5.1-Codex-Max 공개

페이지 정보

작성자 xtalfi
작성일 2025.11.20 14:56
655 조회
0 추천
0 비추천

본문

OpenAI-Codex-GPT-5-Codex.jpg

(퍼플렉시티가 정리한 기사)


OpenAI는 월요일에 GPT-5.1-Codex-Max를 출시하며, 복잡한 다중 시간 프로그래밍 프로젝트를 다루는 개발자들을 위한 획기적인 최신 에이전틱 코딩 모델로 포지셔닝했습니다. 내부적으로 24시간 개발 작업을 완료한 것으로 알려진 이 모델은 컨텍스트를 잃지 않고 수백만 개의 토큰에 걸쳐 일관되게 작동할 수 있도록 하는 "압축(compaction)" 기술을 도입했습니다.​

이번 출시는 Google이 Gemini 3 Pro를 공개한 지 하루 만에 이루어져, 개발자 도구 시장에서 AI 거대 기업들 간의 경쟁을 심화시키고 있습니다. OpenAI의 발표에 따르면, GPT-5.1-Codex-Max는 이제 모든 Codex 플랫폼에서 GPT-5.1-Codex를 대체하는 기본 모델이 되었습니다.​


성능 향상 및 벤치마크 결과

GPT-5.1-Codex-Max는 표준 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Verified에서 77.9%의 정확도를 달성하여, Gemini 3 Pro의 보고된 76.2%를 근소하게 앞질렀습니다. 이 모델은 또한 SWE-Lancer IC SWE에서 79.9%를 기록하여 이전 버전의 66.3%와 비교되며, TerminalBench 2.0에서는 58.1%에 도달했습니다.​

벤치마크 점수를 넘어, 이 모델은 실질적인 효율성 개선을 제공합니다. OpenAI는 GPT-5.1-Codex-Max가 실제 코딩 작업을 완료할 때 GPT-5.1-Codex보다 약 30% 적은 토큰을 사용하면서 27%에서 42% 더 빠르게 작업을 완료한다고 보고합니다. ZDNET에 따르면, 이러한 효율성 향상은 사용량 제한이 있는 ChatGPT Plus 구독자들에게 잠재적으로 추가 1시간의 프로그래밍 시간으로 환산됩니다.​

압축 시스템은 주요 아키텍처 발전을 나타내며, 컨텍스트 한계에 접근할 때 필수 정보를 유지하면서 세션 기록을 자동으로 압축할 수 있게 합니다. The Decoder에 따르면 "모델이 컨텍스트 창을 채우면 자동으로 세션 기록을 압축합니다". OpenAI의 시스템 카드는 이 모델이 "압축이라는 프로세스를 통해 여러 컨텍스트 창에 걸쳐 작동하도록 기본적으로 훈련된 최초의 모델"이라고 명시합니다.​


가용성 및 내부 채택

GPT-5.1-Codex-Max는 ChatGPT Plus, Pro, Business, Edu 및 Enterprise 사용자를 위한 Codex를 통해 즉시 사용할 수 있습니다. OpenAI에 따르면 API 액세스는 "곧" 제공될 예정입니다. 이 모델은 또한 Windows 환경에 최적화된 최초의 Codex 버전입니다.​

OpenAI 내부 채택률은 상당합니다. 회사의 10월 발표에 따르면, OpenAI 엔지니어의 95%가 매주 Codex를 사용하고 있으며, 이 도구를 채택하기 전과 비교하여 현재 70% 더 많은 풀 리퀘스트를 병합하고 있습니다. OpenAI는 "7월에 절반을 조금 넘었던 것에 비해 오늘날 거의 모든 엔지니어가 Codex를 사용합니다"라고 밝혔습니다.​

이 모델은 프롬프트 인젝션 및 데이터 유출을 포함한 보안 위험을 완화하기 위해 기본적으로 네트워크 액세스가 비활성화된 샌드박스 환경 내에서 작동합니다.

댓글 0
전체 1,366 / 75 페이지
샌프란시스코에 본사를 둔 BodyPark는 오늘 실시간 자세 교정과 적응형 코칭을 통해 일상적인 근력 운동에 전문가급 동작 인텔리전스를 제공하도록 설계된 AI 기반 피트니스 기기 ATOM을 공개했습니다.155그램의 컴팩트한 이 기기는 회사의 독자적인 DeepBody Engine을 탑재하고 있으며, 요추 자세 분석을 위한 고유한 “Lumbus” 포인트를 포함해 34개의 신체 키포인트를 추적하여 96%의 자세 추정 정확도를 제공합니다. ATOM은 근력 운동, 맨몸 운동, 기능성 피트니스 전반에 걸쳐 1,000개 이상의 운동을 인식하며, 운동 중 즉각적인 음성 기반 피드백을 제공합니다.엘리트 훈련에서 소비자 접근성으로BodyPark은 수년간 AI 피트니스 기술을 개발해왔으며, 이전에는 엘리트 운동선수들을 위한 Under Armour의 UA HOUSE 피트니스 테스트 시스템을 구동했습니다. 2021년에 설립되어 홍콩에 본사를 두고 실리콘밸리에도 거점을 둔 이 회사는 이제 ATOM을 통해 실험실 수준의 정밀도를 가정 및 체육관 사용자들에게 제공합니다.BodyPark의 창립자인 Yili Lin은 “ATOM은 휴대폰이나 스마트워치를 대체하기 위한 것이 아니라, 이들을 보완합니다”라고 말했습니다. “휴대폰은 숫자를 추적합니다. ATOM은 진정한 발전과 부상 예방의 원동력인 동작을 이해합니다.”이 기기는 160도 초광각 렌즈를 통해 전신 움직임을 포착하고 1.43인치 AMOLED 화면에 핸즈프리 반복 횟수 카운팅, SmartPath 궤적 분석, 무게중심 시각화를 포함한 실시간 지표를 표시합니다. 사용자는 설정 없이 팔 길이 거리에 ATOM을 배치하기만 하면 되므로, 홈짐, 상업용 시설 또는 야외 공간에서 휴대하여 사용할 수 있습니다.시장 모멘텀과 향후 계획ATOM은 11월 초 킥스타터에서 출시되어 3시간 만에 10만 달러를 모금했습니다. 얼리 백커들은 소매가 219달러에서 45% 할인된 119달러에 기기를 확보할 수 있으며, 전 세계 배송은 2026년 1분기로 예정되어 있습니다.Gemini, DeepSeek, Qwen을 포함한 대규모 언어 모델로 구동되는 이 기기의 멀티 에이전트 피트니스 엔진은 사용자의 성과, 피로 수준 및 이동성을 기반으로 진화하는 적응형 훈련 계획을 생성합니다. 이 기술은 2025년 250억 달러에 달할 것으로 예상되며 2033년까지 연평균 22% 성장할 것으로 전망되는 급속히 확장하는 AI 피트니스 시장에 진입합니다.
628 조회
0 추천
2025.11.22 등록
HumanSignal은 대규모 언어 모델의 발전에도 불구하고 전통적인 데이터 라벨링이 아닌 AI 에이전트 평가가 프로덕션 AI 시스템 배포의 중요한 병목 현상이 되었으며, 전문 인력 평가자에 대한 수요가 증가하고 있다고 주장한다.회사의 CEO인 Michael Malyuk은 의료 및 법률 컨설팅과 같은 고위험 애플리케이션에서 기업들이 여전히 인간 전문가 평가를 필요로 한다고 보고하며, 이러한 경우 에이전트는 단순한 이미지 분류가 아닌 다단계 추론, 도구 선택 및 멀티모달 출력에 대해 평가되어야 한다.이러한 변화는 AI 에이전트 시장이 2025년 78억 4천만 달러에서 2030년까지 526억 2천만 달러로 급증할 것으로 예상되는 것과 동시에 일어나고 있으며, 2025년 6월 Meta의 Scale AI에 대한 143억 달러 투자는 데이터 라벨링 산업을 교란시키고 HumanSignal에게 경쟁 기회를 창출했다.
639 조회
0 추천
2025.11.22 등록
이 기사의 핵심 주장은, AI 산업이 소수의 빅테크 기업들(예: Nvidia, Microsoft, Google, OpenAI, Anthropic) 간의 거대하고 복잡하게 얽힌 파트너십, 투자, 그리고 클라우드 계약들로 인해 사실상 하나의 ‘거대한 기계(Blob)’로 변했다는 데 있습니다. 이 구조는 기존에 AI의 이윤 중심 독점화를 막기 위해 세워졌던 원래의 취지와는 거리가 있습니다.이 ‘Blob’은 전통적인 담합(카르텔)과는 다릅니다. 분명 개발사 간의 경쟁은 여전히 치열하지만, 하이퍼스케일 AI 개발과 데이터센터 구축에 필연적으로 막대한 비용이 들기 때문에, 이 거대 기업들은 서로 의존적일 수밖에 없습니다. 즉, 각 사가 독립적으로 AI를 개발하기에는 너무 방대한 리소스가 필요해서, 결과적으로 모두가 서로 얽혀 있는 구조가 만들어졌다는 점이 핵심입니다.이러한 상황에서, AI 산업은 자본과 기술력이 집약된 소수 플레이어에 의해 사실상 지배되고 있으며, 미국 정부와 해외 자본(사우디, 아부다비 등)까지 여기에 큰 영향력을 미치고 있다는 점도 지적되고 있습니다. 만약 AI 버블이 꺼진다면 그 파장은 이 ‘Blob’ 전체에 미칠 수밖에 없다는 경고도 담고 있습니다.
654 조회
0 추천
2025.11.22 등록
미국의 주요 기술 기업들이 인공지능 인프라 구축 자금 조달을 위해 올해 1,200억 달러 이상의 부채를 발행했으며, 이는 전통적인 현금 자금 조달 모델에서 전례 없는 전환을 의미하고 투자자들의 시장 안정성과 투자 수익 실현 여부에 대한 우려를 제기하고 있습니다.9월 이후, 4개의 주요 “하이퍼스케일러” 기업들이 약 900억 달러의 공개 채권을 발행했습니다: Alphabet은 250억 달러, Meta는 300억 달러, Oracle은 180억 달러, 그리고 Amazon은 3년 만에 처음으로 미국 달러 채권을 발행하여 150억 달러를 조달했습니다. Microsoft만이 최근 채권 시장 활용을 자제했습니다. Meta가 10월에 최대 규모의 데이터센터 프로젝트를 위해 Blue Owl Capital과 체결한 270억 달러의 사모 금융 계약을 포함하면, 하이퍼스케일러들의 총 부채 발행액은 지난 5년간 평균 280억 달러에서 급증했습니다.Wellington Management Company의 포트폴리오 매니저인 Brij Khurana는 “시장은 AI 자금 조달이 사모 신용 시장이나 잉여 현금 흐름에서 나올 가능성이 낮다는 것을 인식하게 되었습니다. 공개 채권 시장에서 조달해야 할 것입니다”라고 말했습니다. “자금이 주식에서 채권으로 이동해야 할 수도 있다는 인식이 있습니다.”시장 압력이 가중되다부채 급증은 미국 투자등급 신용 스프레드 상승에 기여했으며, 9월 중순 74bp에서 11월 중순 84bp로 확대되었습니다. 알파벳과 메타는 최근 발행에서 기존 부채 대비 약 10-15bp 높은 금리를 지불했으며, 이는 투자자들의 신중한 태도를 반영합니다.오라클은 특히 면밀한 조사를 받았으며, 30년 만기 채권은 10월 이후 약 8% 하락하여 달러당 65센트에 거래되고 있습니다. S&P 글로벌 레이팅스는 예상되는 자본 지출과 부채 발행으로 인한 신용 프로필 악화를 이유로 오라클의 전망을 부정적으로 하향 조정했습니다. 바클레이스 애널리스트들은 오라클의 신용등급이 정크본드 영역에 근접할 수 있다고 경고했습니다.블룸버그 인텔리전스에 따르면, 5대 AI 투자 기업들은 2025년에 총 1,080억 달러의 기록적인 부채를 조달했으며, 이는 이전 9년 평균의 3배 이상입니다.버블 우려 재부상AI 자본 지출은 2024년 2,000억 달러 이상에서 2027년까지 6,000억 달러에 달할 것으로 예상되며, 순부채 발행은 2026년에 1,000억 달러에 이를 것으로 전망됩니다. 차입 급증에도 불구하고 UBS는 계획된 자본 지출의 약 80-90%가 여전히 현금 흐름에서 나올 것으로 추정합니다.부채 우려는 시장 변동성에 기여했습니다. 11월 19일 엔비디아의 강력한 실적 발표 이후, 주식은 처음에 상승했다가 급격히 반전되었으며, 나스닥은 11월 20일 2.2% 하락 마감했습니다. S&P 500은 AI 투자가 지출을 정당화할 만큼 충분한 수익을 창출할 수 있는지에 대한 의문이 커지면서 이번 달 3% 하락했습니다.모건스탠리웰스 매니지먼트의 최고 투자 책임자인 리사 샬렛(Lisa Shalett)은 “한때 단순했던 이야기가 이제 훨씬 더 복잡해지고 있다”고 말했습니다.
654 조회
0 추천
2025.11.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입