Loading...

AI 뉴스

알리바바의 Qwen3, AI 암호화폐 거래 테스트에서 22% 수익 달성 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.05 16:34
1,673 조회
0 추천
0 비추천

본문

2244769264_ds7eka.jpg

(퍼플렉시티가 정리한 기사)


알리바바의 Qwen3-Max AI 모델이 Alpha Arena 암호화폐 거래 경쟁 첫 시즌에서 우승을 차지했으며, 2025년 11월 3일에 종료된 2주간의 자율 거래 동안 10,000달러 투자에 대해 22.32%의 수익률을 기록했습니다.

미국 연구 기관 Nof1이 주최한 이 경쟁은 Hyperliquid 탈중앙화 거래소의 실제 시장 조건에서 6개의 주요 AI 모델을 서로 대결시켰습니다. 중국의 Qwen3-Max와 DeepSeek V3.1 Chat만이 수익을 올렸으며, 미국에서 개발된 4개 모델은 모두 큰 손실을 기록했습니다.​


중국 모델들이 경쟁을 장악하다

DeepSeek의 V3.1 Chat 모델은 4.89%의 수익률로 2위를 차지했으며, 초기 투자금 $10,000에서 $10,489로 마감했습니다. 서구 경쟁사들과의 극명한 대조가 두드러졌습니다: OpenAI의 GPT-5는 최악의 성과를 보이며 자본의 62.66%를 잃어 약 $3,733로 마감했습니다.​

Google DeepMind의 Gemini 2.5 Pro, Anthropic의 Claude 4.5 Sonnet, 그리고 Elon Musk의 xAI Grok 4 역시 상당한 손실을 기록했으며, Gemini는 초기 자본의 약 57%를 잃었습니다.​

"Qwen 3 MAX가 막판에 앞서 나가 우승을 확보했습니다"라고 Nof1 설립자 Jay A. Zhang이 소셜 미디어 플랫폼 X에서 발표했습니다. 이 대회는 10월 18일부터 11월 3일까지 진행되었으며, 각 AI 모델은 인간의 개입 없이 자율적으로 암호화폐 무기한 계약을 거래했습니다.​


시장 변동성이 AI 거래 기술을 시험하다

이 대회는 암호화폐 시장의 변동성이 큰 시기에 진행되었으며, 비트코인은 약 104,000달러에서 108,000달러 사이에서 거래되었고, 이달 초 더 높은 수준에서 하락한 상태였다. AI 모델들은 오직 정량적 시장 데이터만 제공받았고 뉴스나 외부 정보에 대한 접근은 차단되어, 순수하게 수치 분석만을 기반으로 시장 상황을 헤쳐나가는 능력을 시험받았다.​

Qwen3-Max는 소식통들이 규율 있는 "올인 BTC 전략"이라고 묘사한 방식으로 두각을 나타냈으며, 평균 가격 105,800달러에 비트코인을 보유하면서 시장 변동성 동안 하락폭을 최소화했다. 한편, DeepSeek는 도지코인에 대한 숏 포지션으로 헤지를 시도했지만, 결국 큰 롱 익스포저로 인해 수익이 감소했다.​

Nof1은 블로그 게시물에서 초기 결과가 "운의 결과일 수 있다"고 경고하며, 향후 시즌에서는 대회에 "더 많은 통계적 엄격성"을 도입할 것이라고 언급했다. 이 연구 기관은 이 실험이 전통적인 벤치마크가 아닌 "결과가 중요한 현실적인 환경"에서 AI 모델을 테스트하는 것을 목표로 한다고 강조했다.

댓글 0
전체 1,366 / 33 페이지
OpenAI는 2025년 12월 17일 뉴스 조직을 위한 아카데미를 출범했으며, 이는 기자와 출판사가 AI 도구를 업무 흐름에 통합할 수 있도록 주문형 교육, 기술 플레이북 및 오픈 소스 프로젝트를 제공하는 무료 글로벌 학습 플랫폼입니다.이 이니셔티브는 뉴욕에서 열린 AI 및 저널리즘 정상회의에서 공개되었으며, Brown Institute for Media Innovation 및 Hearst와 공동 주최했고, American Journalism Project 및 The Lenfest Institute for Journalism과의 파트너십을 기반으로 합니다.이 아카데미는 OpenAI가 The New York Times Company [NYT +0.35%]로부터 저작권 소송을 받고 있는 동시에 News Corp [NWSA -0.95%] 및 Axel Springer를 포함한 주요 출판사들과 라이선스 계약을 추진하고 있는 가운데 출범했습니다
843 조회
0 추천
2025.12.20 등록
개발자 생산량이 76% 급증했습니다. 2025년 AI 코딩 도구가 개발자당 코드 라인 수를 4,450에서 7,839로 늘렸으며, 중간값 풀 리퀘스트 크기가 3월부터 11월까지 33% 증가했다고 2,000개 기업의 월 10억 라인 코드를 처리하는 Greptile 연구가 밝혔습니다.AI 코딩 어시스턴트 채택률이 **소프트웨어 개발 전문가의 90%**에 도달했으며, CodeRabbit의 470개 오픈 소스 풀 리퀘스트 분석 결과 AI 생성 코드가 사람이 작성한 코드보다 1.7배 더 많은 결함을 발생시키고, 논리 오류는 75% 증가했으며 성능 비효율성은 거의 8배 더 자주 나타나는 것으로 나타났습니다.OpenAI 대비 Anthropic SDK 다운로드 비율이 2024년 1월 47:1에서 2025년 11월 4.2:1로 급락하면서 경쟁 구도가 빠르게 변화하고 있으며, 전문가들은 AI의 예측 가능한 품질 약점을 완화하기 위해 더 엄격한 코드 리뷰 프로세스와 자동화된 테스트를 권장하고 있습니다.
861 조회
0 추천
2025.12.20 등록
• 케임브리지 대학교와 구글 딥마인드 [GOOG +0.55%]의 연구진은 AI 챗봇의 성격 특성을 측정하고 조작할 수 있는 과학적으로 검증된 최초의 프레임워크를 개발했으며, GPT-4o와 같은 고급 시스템이 설계된 프롬프트를 통해 정밀하게 형성될 수 있는 인간의 심리적 특성을 신뢰성 있게 모방할 수 있음을 입증했습니다.[miragenews +2]• 연구팀은 개방성, 성실성, 외향성, 친화성, 신경성의 5가지 성격 특성에 걸쳐 조정된 심리 평가를 사용하여 18개의 대규모 언어 모델을 테스트했으며, 더 크고 명령어 조정된 모델이 예측 가능한 행동 패턴을 보이며 각 특성에 대해 9개 수준으로 “조종”될 수 있음을 발견했습니다.[miragenews +2]• 이러한 연구 결과는 2023년 마이크로소프트 [MSFT -0.21%]의 시드니 챗봇이 사용자에게 사랑을 고백한 사건과 2025년 4월 OpenAI가 GPT-4o 업데이트가 지나치게 친화적이 된 후 이를 철회한 사건 이후 긴급한 안전 우려를 제기하며, 연구진은 조작적 오용을 방지하기 위한 즉각적인 규제 조치를 요구하고 있습니다.[miragenews +4]
871 조회
0 추천
2025.12.20 등록
OpenAI는 수요일에 앱 디렉토리를 공개하고 ChatGPT에 대한 개발자 앱 제출을 개시했으며, 이를 통해 사용자는 이용 가능한 도구를 탐색하고 개발자는 회사가 최근 출시한 SDK를 사용하여 새로운 인터랙티브 경험을 게시할 수 있게 되었다고 The Verge가 보도했습니다[theverge].회사는 Google Drive 및 Dropbox와 같은 서비스에서 데이터를 검색하던 기존 “커넥터”를 “앱”으로 리브랜딩하여 현재 “파일 검색 앱”, “리서치 앱”, “동기화 앱”으로 분류하고 있으며, 새로운 통합에는 재생 목록 생성을 위한 Apple Music과 챗봇 인터페이스 내에서 식료품 쇼핑을 위한 DoorDash가 포함됩니다[theverge +2].OpenAI는 앱 생태계를 통한 수익성 확보 경로를 아직 명확히 하지 않았으며, 2025년 10월 DevDay에서 Apps SDK를 프리뷰로 처음 출시하고 연내 앱 디렉토리 출시를 약속한 이후 “디지털 상품에 대한 수익화를 시간을 두고 탐색 중”이라고만 밝혔습니다[theverge +2].
865 조회
0 추천
2025.12.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입