Loading...

AI 뉴스

구글 오픈AI 모델, 코딩 결선에서 인간을 능가

페이지 정보

작성자 xtalfi
작성일 2025.09.18 17:34
1,621 조회
0 추천
0 비추천

본문

9de4d9cebf14335c3880e38d078588dceKWm.png

(퍼플렉시티가 정리한 기사)

구글은 화요일, 자사의 첨단 Gemini 2.5 Deep Think 모델이 2025년 국제 대학생 프로그래밍 경진대회 세계 결승에서 금메달 수준의 성능을 달성했다고 발표했습니다. 해당 모델은 139개 인간 팀이 도전한 12개의 복잡한 코딩 문제 중 10개를 해결했습니다. 반면 OpenAI는 자사의 추론 모델이 같은 대회에서 12문제 모두를 해결했다고 주장하며 더욱 인상적인 성과를 내세웠습니다.


ICPC 세계 결승은 9월 4일 아제르바이잔 바쿠에서 열렸으며, 대학생 프로그래밍 경진의 정점으로, 103개국 약 3,000개 대학에서 팀들이 참가합니다. 참가자들은 알고리즘 문제를 해결하기 위해 단 5시간이라는 긴박한 제한 시간 내에 완벽한 해답만이 점수를 받을 수 있는 혹독한 도전을 경험합니다.


AI 시스템이 인간 챔피언을 능가하다


구글 딥마인드의 발표에 따르면 Gemini 2.5 Deep Think는 단 45분 만에 8개의 문제를 해결했으며, 추가로 3시간 내에 2개의 문제를 완료했습니다. 시스템은 10개의 정답을 내는 데 총 677분의 시간을 기록했으며, 이는 인간 참가자 중 전체 2위에 해당하는 기록이었습니다.


특히 주목할 만한 점은 Gemini가 모든 인간 팀을 좌절시킨 복잡한 최적화 문제인 C번 문제를 성공적으로 해결했다는 것입니다. 이 문제는 서로 연결된 파이프와 저수지를 통한 액체 분배와 관련된 어려운 과제였습니다. AI는 각 저수지에 우선순위 값을 할당하고, 동적 프로그래밍 알고리즘을 활용하여 최적의 분배 구성을 찾아냈습니다.


이에 대해 OpenAI는 GPT-5 및 실험적 추론 모델을 포함한 범용 추론 모델 앙상블이 모든 12개 문제를 해결하여 완벽한 점수를 얻었다고 주장했습니다. 회사에 따르면, GPT-5가 11개의 문제를 정확히 해결했고, 실험적 모델이 가장 어려웠던 마지막 문제를 9번의 제출 시도 끝에 완수했다고 밝혔습니다.


AI 거대 기업들 간의 경쟁이 심화된다


경쟁적인 발표들은 인공지능 개발 분야에서 기술 대기업 간의 치열한 경쟁을 부각시킵니다. 두 회사 모두 자사 모델이 대회의 특정 훈련이 아닌 범용적인 추론을 사용했다고 강조했으며, 이는 이전의 전문화된 방식에서의 변화를 의미합니다.


이 성과들은 수학 경시 대회에서의 이전 성공을 바탕으로 이루어졌습니다. 오픈AI와 구글 딥마인드는 각각 2025년 7월 국제 수학 올림피아드(IMO)에서 금메달급 성과를 거두었으며, 각각 6문제 중 5문제를 해결했습니다.


ICPC 글로벌 사무국장인 Dr. Bill Poucher는 AI의 참여를 “차세대에 필요한 AI 도구와 학문적 기준을 정립하는 중요한 순간”이라고 평가했습니다. 구글은 이러한 돌파구가 프로그래밍을 넘어 반도체 공학, 신약 개발, 과학 연구 등 다양한 분야에 긍정적인 영향을 미칠 수 있다고 제시합니다.


2025년 ICPC의 인간 우승팀은 상트페테르부르크 국립대학 팀이었으며, 11문제를 해결해 세계 챔피언에 올랐습니다. 총 139개의 인간 팀 중 단 네 팀만이 금메달을 따냈습니다.

댓글 0
전체 1,257 / 289 페이지
- 최근 월 약 28만 원(200달러) 구독료로 800만 원 상당의 토큰을 사용하는 '추론 고래'(Inference whales) 개발자들이 다수 등장.- 일부 헤비유저 때문에 앤트로픽, 바이브 코딩 등 AI 스타트업의 수익성 악화 논란.- 대표적으로 한 사용자는 한 달간 51억 토큰(806만 원치 API 비용)에 달하는 클로드 코드 사용. 상위 169명은 한 달간 2777억 토큰 소비.- 서비스 업체들은 남용 방지 위해 무제한 요금제에 주간 사용량 제한 등 도입, 별도 초과 요금 부과 시작(8/28부터).- 비용 하락에도 최고 모델 수요는 여전히 높으며, AI 활용 워크플로우 확대에 따라 실제 토큰 사용량은 증가.- 전문가들은 "AI 추론 비용 감소가 현실적으로 어렵고, 무제한 요금제는 지속 불가능"이라는 의견 제시
1995 조회
0 추천
2025.08.20 등록
이 사업은 공무원이 보안 걱정 없이 다양한 생성형 AI 서비스를 활용하도록 관련 플랫폼과 거대언어모델(LLM), 컴퓨팅 자원(GPU 등) 등을 제공하는 게 목적이다. 행안부는 오는 11월 일부 서비스를 시범 제공할 계획이다. 삼성SDS 컨소시엄에 포함된 AI 플랫폼 2종(삼성SDS 패브릭스, 네이버 하이퍼스튜디오)과 LLM 모델 6개를 선정해 우선 서비스한다. 공무원은 이들 가운데 원하는 플랫폼과 LLM을 활용, AI를 업무에 적용해볼 수 있다.-> 우리가 아는 흔한 LLM모델을 쓸 수 있다는 말인가?
2005 조회
0 추천
2025.08.20 등록
오픈AI는 2025년 8월 17일부터 챗GPT의 응답 톤을 보다 따뜻하고 친근하게 조정하는 업데이트를 적용했습니다. 이로 인해 대화가 더 자연스럽고 사용자 친화적으로 느껴집니다. 기존에는 정보 위주의 다소 딱딱한 응답이 주를 이뤘다면, 이제는 감정 표현이 더 풍부해졌습니다. 예를 들어, 이전에는 "오늘 서울 날씨는 맑음, 기온 25도입니다"라는 응답이었다면, 이제는 "서울 오늘 날씨가 정말 좋아요! 맑고 기온 25도라 나들이 가기 딱 좋겠네요!"처럼 보다 생동감 있는 답변을 제공합니다. 사용자 피드백에 따르면 대화의 자연스러움이 약 20% 향상되었습니다.PS. 그래서 그런지 자꾸 반말을 하네요...
1879 조회
0 추천
2025.08.20 등록
구글 딥마인드가 초경량 AI 모델 '젬마 3 270'(2억 7천만 매개변수)을 오픈소스로 공개했습니다. 이 모델은 휴대폰, 노트북, 웨어러블 기기 등 저전력 장치에서도 고효율로 작동하도록 설계되었습니다. 특히, 개발자 커뮤니티를 지원하기 위해 무료로 제공되는 '제미나이 CLI 깃허브 액션'과 함께, AI 코딩 협업 도구로 주목받고 있습니다. 이는 소규모 개발자나 스타트업이 AI를 쉽게 활용할 수 있게 돕는 흥미로운 움직임입니다.젬마는 간단히 사용할 수 있습니다. 사용방법은 아래와 같습니다.- 구글 딥마인드의 깃허브 저장소 또는 Hugging Face 모델 허브에서 젬마 3 270을 다운로드합니다.- Python 환경에서 pip install gemma 명령어로 설치합니다.- gemma run --model gemma-3-270m 명령어를 실행하여 모델을 사용할 수 있습니다.
2034 조회
0 추천
2025.08.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입