AI 뉴스

구글 오픈AI 모델, 코딩 결선에서 인간을 능가

페이지 정보

작성자 xtalfi
작성일 2025.09.18 17:34
858 조회
0 추천
0 비추천

본문

9de4d9cebf14335c3880e38d078588dceKWm.png

(퍼플렉시티가 정리한 기사)

구글은 화요일, 자사의 첨단 Gemini 2.5 Deep Think 모델이 2025년 국제 대학생 프로그래밍 경진대회 세계 결승에서 금메달 수준의 성능을 달성했다고 발표했습니다. 해당 모델은 139개 인간 팀이 도전한 12개의 복잡한 코딩 문제 중 10개를 해결했습니다. 반면 OpenAI는 자사의 추론 모델이 같은 대회에서 12문제 모두를 해결했다고 주장하며 더욱 인상적인 성과를 내세웠습니다.


ICPC 세계 결승은 9월 4일 아제르바이잔 바쿠에서 열렸으며, 대학생 프로그래밍 경진의 정점으로, 103개국 약 3,000개 대학에서 팀들이 참가합니다. 참가자들은 알고리즘 문제를 해결하기 위해 단 5시간이라는 긴박한 제한 시간 내에 완벽한 해답만이 점수를 받을 수 있는 혹독한 도전을 경험합니다.


AI 시스템이 인간 챔피언을 능가하다


구글 딥마인드의 발표에 따르면 Gemini 2.5 Deep Think는 단 45분 만에 8개의 문제를 해결했으며, 추가로 3시간 내에 2개의 문제를 완료했습니다. 시스템은 10개의 정답을 내는 데 총 677분의 시간을 기록했으며, 이는 인간 참가자 중 전체 2위에 해당하는 기록이었습니다.


특히 주목할 만한 점은 Gemini가 모든 인간 팀을 좌절시킨 복잡한 최적화 문제인 C번 문제를 성공적으로 해결했다는 것입니다. 이 문제는 서로 연결된 파이프와 저수지를 통한 액체 분배와 관련된 어려운 과제였습니다. AI는 각 저수지에 우선순위 값을 할당하고, 동적 프로그래밍 알고리즘을 활용하여 최적의 분배 구성을 찾아냈습니다.


이에 대해 OpenAI는 GPT-5 및 실험적 추론 모델을 포함한 범용 추론 모델 앙상블이 모든 12개 문제를 해결하여 완벽한 점수를 얻었다고 주장했습니다. 회사에 따르면, GPT-5가 11개의 문제를 정확히 해결했고, 실험적 모델이 가장 어려웠던 마지막 문제를 9번의 제출 시도 끝에 완수했다고 밝혔습니다.


AI 거대 기업들 간의 경쟁이 심화된다


경쟁적인 발표들은 인공지능 개발 분야에서 기술 대기업 간의 치열한 경쟁을 부각시킵니다. 두 회사 모두 자사 모델이 대회의 특정 훈련이 아닌 범용적인 추론을 사용했다고 강조했으며, 이는 이전의 전문화된 방식에서의 변화를 의미합니다.


이 성과들은 수학 경시 대회에서의 이전 성공을 바탕으로 이루어졌습니다. 오픈AI와 구글 딥마인드는 각각 2025년 7월 국제 수학 올림피아드(IMO)에서 금메달급 성과를 거두었으며, 각각 6문제 중 5문제를 해결했습니다.


ICPC 글로벌 사무국장인 Dr. Bill Poucher는 AI의 참여를 “차세대에 필요한 AI 도구와 학문적 기준을 정립하는 중요한 순간”이라고 평가했습니다. 구글은 이러한 돌파구가 프로그래밍을 넘어 반도체 공학, 신약 개발, 과학 연구 등 다양한 분야에 긍정적인 영향을 미칠 수 있다고 제시합니다.


2025년 ICPC의 인간 우승팀은 상트페테르부르크 국립대학 팀이었으며, 11문제를 해결해 세계 챔피언에 올랐습니다. 총 139개의 인간 팀 중 단 네 팀만이 금메달을 따냈습니다.

댓글 0
전체 723 / 127 페이지
(퍼플렉시티가 정리한 기사)구글 클라우드가 AI 에이전트가 사용자를 대신해 안전하게 결제를 처리할 수 있는 새로운 개방형 표준 ’에이전트 결제 프로토콜(AP2)’을 17일(현지시간) 공개했다. AP2는 기존 결제 시스템이 사람의 직접 승인을 전제로 설계된 한계를 넘어 AI 에이전트 기반 상거래의 신뢰와 보안을 강화하는 프레임워크를 제공한다.60개 이상 글로벌 기업과 협력한 새로운 결제 표준AP2는 구글 클라우드가 주요 결제 및 기술 기업과 공동 개발한 것으로, 기존 에이전트-투-에이전트(A2A) 및 모델 컨텍스트 프로토콜(MCP)의 확장판이다. 마스터카드, 아메리칸 익스프레스, 페이팔, 코인베이스, 세일즈포스 등 60개 이상의 글로벌 기업이 개발과 도입에 참여했다.아시아 지역에서는 한국사이버결제(NHN KCP), 에어월렉스(Airwallex), 피우(Fiuu), 라자다(Lazada), 쇼피(Shopee), 잘로라(ZALORA) 등이 참여해 글로벌 확산 기반을 마련했다.암호화된 디지털 위임장으로 신뢰성 확보AP2의 핵심은 위·변조가 불가하고 암호화 방식으로 서명된 디지털 계약인 ‘위임장(Mandate)’ 시스템이다. 이는 사용자의 구매 권한 부여와 진짜 의도 보장, 문제 발생 시 책임 규명이라는 AI 에이전트 결제의 핵심 과제를 해결한다.위임장은 두 가지 방식으로 작동한다. 실시간 구매 시에는 사용자가 “흰색 러닝화 찾아줘”라고 요청하면 ‘구매 의사 위임장’이 생성되고, 에이전트가 찾은 상품을 사용자가 승인하면 ‘장바구니 위임장’이 서명돼 변경 불가능한 거래 기록이 완성된다. 사용자 부재 시에는 가격 한도와 구매 조건을 담은 상세한 위임장을 사전에 설정해 에이전트가 조건 충족 시 자동으로 결제를 진행할 수 있다.신용카드부터 암호화폐까지 다양한 결제 지원AP2는 신용카드, 체크카드, 실시간 계좌이체 등 기존 결제 방식은 물론 스테이블코인과 같은 암호화폐까지 지원하는 결제 방식 중립적 프레임워크를 제공한다. 특히 구글은 코인베이스, 이더리움 재단, 메타마스크 등과 협력해 에이전트 기반 암호화폐 결제를 위한 A2A x402 확장 기능을 출시했다.구글 클라우드 비즈니스 애플리케이션 플랫폼 담당 라오 수라파네니 부사장은 “AP2는 에이전트와 판매업체 간 안전한 준법 거래를 위한 공통 언어를 제공해 생태계 분열을 방지한다”며 “사용자와 판매자에게 일관되고 안전하며 확장 가능한 경험을 보장한다”고 설명했다.AP2는 항공권과 호텔 예약을 동시에 처리하거나, 품절 상품의 재입고 시 자동 구매 등 완전히 새로운 커머스 경험을 가능하게 한다고 구글은 설명했다. 이 프로토콜의 전체 기술 명세는 깃허브를 통해 공개돼 개발자와 기업들이 활용할 수 있다.
846 조회
0 추천
2025.09.18 등록
손목밴드에서 조정을 하는 것 같고 전작과 많이 달라졌습니다.AI 기능으로 번역도 가능하네요..https://www.meta.com/kr/ai-glasses/meta-ray-ban-display/
831 조회
0 추천
2025.09.18 등록
조금 전 메타가 AI 기능이 있는 안경을 비롯하여 중요한 키노트를 진행하였습니다.CNET이 준비한 키노트 요약입니다.RAYBAN 과 새로 제작한 안경이 큰 화제입니다.
899 조회
0 추천
2025.09.18 등록
마이크로소프트가 코파일럿 메모장과 그림판 연동기능을 제공하기 시작했으며이 기능은 오피스365를 사용하지 않아도 코파일럿을 이욯하면 이용할 수 있다.예를 들어 메모장은 다음과 같은 기능을 갖게 된다.-요약: 긴 텍스트를 간략하게 요점만 추려내고, 문서의 핵심을 빠르게 파악할 수 있습니다.- 쓰기: 프롬프트나 선택한 텍스트를 활용해 새로운 문장을 AI로 쉽고 빠르게 작성합니다.- 다시 쓰기: 선택한 내용을 AI가 어투, 길이, 명확성 등 다양한 스타일로 변환해 줍니다.또한 그림판은 다음과 같은 기능을 추가하게 된다.- 프로젝트 파일 저장 기능: 그림판에서 작업을 .paint 파일로 저장해 언제든 이어서 편집이 가능.- 불투명도(Opacity) 슬라이더: 연필 및 브러시 도구의 투명도를 원하는 대로 조절해 더 섬세한 혼합이나 레이어링 효과 주기.- 크기 및 불투명도 슬라이더 병행 사용: 두 슬라이더를 활용해 부드럽게 배합하고 다양한 질감의 그림 그리기.
862 조회
0 추천
2025.09.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입