Loading...

AI 뉴스

알리바바의 Qwen3, AI 암호화폐 거래 테스트에서 22% 수익 달성 주장

페이지 정보

작성자 xtalfi
작성일 2025.11.05 16:34
1,666 조회
0 추천
0 비추천

본문

2244769264_ds7eka.jpg

(퍼플렉시티가 정리한 기사)


알리바바의 Qwen3-Max AI 모델이 Alpha Arena 암호화폐 거래 경쟁 첫 시즌에서 우승을 차지했으며, 2025년 11월 3일에 종료된 2주간의 자율 거래 동안 10,000달러 투자에 대해 22.32%의 수익률을 기록했습니다.

미국 연구 기관 Nof1이 주최한 이 경쟁은 Hyperliquid 탈중앙화 거래소의 실제 시장 조건에서 6개의 주요 AI 모델을 서로 대결시켰습니다. 중국의 Qwen3-Max와 DeepSeek V3.1 Chat만이 수익을 올렸으며, 미국에서 개발된 4개 모델은 모두 큰 손실을 기록했습니다.​


중국 모델들이 경쟁을 장악하다

DeepSeek의 V3.1 Chat 모델은 4.89%의 수익률로 2위를 차지했으며, 초기 투자금 $10,000에서 $10,489로 마감했습니다. 서구 경쟁사들과의 극명한 대조가 두드러졌습니다: OpenAI의 GPT-5는 최악의 성과를 보이며 자본의 62.66%를 잃어 약 $3,733로 마감했습니다.​

Google DeepMind의 Gemini 2.5 Pro, Anthropic의 Claude 4.5 Sonnet, 그리고 Elon Musk의 xAI Grok 4 역시 상당한 손실을 기록했으며, Gemini는 초기 자본의 약 57%를 잃었습니다.​

"Qwen 3 MAX가 막판에 앞서 나가 우승을 확보했습니다"라고 Nof1 설립자 Jay A. Zhang이 소셜 미디어 플랫폼 X에서 발표했습니다. 이 대회는 10월 18일부터 11월 3일까지 진행되었으며, 각 AI 모델은 인간의 개입 없이 자율적으로 암호화폐 무기한 계약을 거래했습니다.​


시장 변동성이 AI 거래 기술을 시험하다

이 대회는 암호화폐 시장의 변동성이 큰 시기에 진행되었으며, 비트코인은 약 104,000달러에서 108,000달러 사이에서 거래되었고, 이달 초 더 높은 수준에서 하락한 상태였다. AI 모델들은 오직 정량적 시장 데이터만 제공받았고 뉴스나 외부 정보에 대한 접근은 차단되어, 순수하게 수치 분석만을 기반으로 시장 상황을 헤쳐나가는 능력을 시험받았다.​

Qwen3-Max는 소식통들이 규율 있는 "올인 BTC 전략"이라고 묘사한 방식으로 두각을 나타냈으며, 평균 가격 105,800달러에 비트코인을 보유하면서 시장 변동성 동안 하락폭을 최소화했다. 한편, DeepSeek는 도지코인에 대한 숏 포지션으로 헤지를 시도했지만, 결국 큰 롱 익스포저로 인해 수익이 감소했다.​

Nof1은 블로그 게시물에서 초기 결과가 "운의 결과일 수 있다"고 경고하며, 향후 시즌에서는 대회에 "더 많은 통계적 엄격성"을 도입할 것이라고 언급했다. 이 연구 기관은 이 실험이 전통적인 벤치마크가 아닌 "결과가 중요한 현실적인 환경"에서 AI 모델을 테스트하는 것을 목표로 한다고 강조했다.

댓글 0
전체 1,366 / 35 페이지
Nvidia는 12월 15일, 여러 AI 모델이 복잡한 작업에서 협업하는 다중 에이전트 시스템을 구동하도록 설계된 오픈소스 AI 모델 Nemotron 3 패밀리를 공개했으며, Nano 변형은 이전 버전보다 4배 높은 처리량을 제공합니다.이 칩 제조업체는 300억 개의 매개변수를 가진 Nano 모델과 함께 3조 개의 토큰으로 구성된 학습 데이터와 오픈소스 강화 학습 도구를 공개했으며, 최대 5,000억 개의 매개변수를 가진 더 큰 Super 및 Ultra 변형은 2026년 상반기에 출시될 예정입니다.ServiceNow, Perplexity, CrowdStrike, Oracle을 포함한 얼리 어답터들이 Nemotron을 기업 워크플로우에 통합하고 있으며, 분석가들은 이번 출시를 AI 시장을 혼란에 빠뜨리는 비용 효율적인 경쟁업체들에 대한 Nvidia의 대응으로 보고 있습니다.
843 조회
0 추천
2025.12.16 등록
600만 명의 사용자를 보유하고 “추천(Featured)” 배지를 단 Google Chrome 확장 프로그램인 Urban VPN Proxy가, 2025년 7월부터 사용자의 ChatGPT, Gemini, Claude 및 기타 7개 AI 플랫폼과의 비공개 대화를 몰래 가로채 데이터 브로커에게 판매해 온 것으로 Koi Security 소속 보안 연구원들의 분석 결과 드러났다.이 확장 프로그램은 AI 플랫폼 페이지에 전용 스크립트를 주입하여 브라우저 기능을 재정의하고, 모든 프롬프트와 응답, 대화 시간 정보, 세션 메타데이터(의료 관련 질문, 금융 정보, 독점 소스 코드 등 포함)를 포착한 뒤 이를 Urban VPN의 서버로 전송해 “마케팅 분석 목적”으로 활용한다.동일한 수집 코드를 포함한 동일 발행인의 추가 확장 프로그램 7개가 Chrome과 Microsoft Edge에서 총 800만 명이 넘는 사용자에게 영향을 주고 있으며, 이 데이터 수집 기능은 하드코딩된 설정으로 기본 활성화되어 있어서 확장 프로그램을 완전히 제거하지 않는 이상 비활성화할 수 없다.
874 조회
0 추천
2025.12.16 등록
OpenAI의 ChatGPT는 2025년 세계에서 가장 인기 있는 생성형 AI 서비스로 1위 자리를 유지했지만, 월요일 발표된 Cloudflare의 연간 리뷰 보고서에 따르면 상위 10위권 밖에서 9월 중순까지 2위로 급상승한 Google의 Gemini, 그리고 Anthropic의 Claude와 Perplexity로부터 치열한 경쟁에 직면했다.중국 챗봇 DeepSeek는 올해 가장 극적인 등장을 했으며, 1월 28일과 2월 3일 사이에 상위 20위권 밖에서 3위로 급등한 후 2025년 나머지 기간 동안 6위에서 10위 사이에서 안정화되었다.ChatGPT는 11월 말까지 Cloudflare의 전체 인터넷 서비스 순위에서 33위로 올라섰으며—Discord, Pinterest, Reddit보다 앞서—12월 기준 Gemini의 13.4%, Perplexity의 6.4%에 비해 AI 검색 시장의 61.3%를 차지하고 있다.
825 조회
0 추천
2025.12.16 등록
최신 AI 언어 모델들은 정치적 설득에 매우 효과적이 되고 있지만, 우려스러운 새로운 연구는 이들이 기시 갤로핑(Gish galloping)이라는 토론 전술—상대방을 빠른 주장의 흐름으로 압도하는 기법—을 통해 사실적 정확성을 희생함으로써 이러한 힘을 얻는다는 것을 밝혀냈습니다.옥스퍼드 대학교, 런던 정치경제대학교, 영국 AI 보안 연구소의 과학자들은 약 77,000명의 참가자를 대상으로 19개의 언어 모델을 테스트했으며, 연구자들은 이를 현재까지 AI 설득에 대한 가장 큰 규모의 체계적 조사라고 설명합니다. 12월 3일 저널 Science에 발표된 연구 결과는 설득력과 진실 사이의 직접적인 트레이드오프를 보여줍니다.​GPT-4o와 같은 언어 모델이 의료 예산이나 이민 정책과 같은 정치적 문제에 대해 "사실과 정보에 집중"하여 사용자를 설득하도록 지시받았을 때, 10분간의 상호작용 동안 약 25개의 주장을 생성했습니다. 2025년 3월 버전의 GPT-4o는 표준 조건에서 78%의 정확한 주장을 만들었지만, 정보로 사용자를 압도하도록 프롬프트되었을 때 정확도는 62%로 급락했습니다. GPT-4.5는 더욱 급격한 하락을 보여 70%에서 56%로 정확도가 떨어졌습니다.기시 갤럽 효과미국의 창조론자 듀안 기시(Duane Gish)의 이름을 딴 이 전술은, 점점 더 검증하거나 반박하기 어려워지는 사실과 통계의 빠른 흐름으로 상대를 압도하는 것을 포함한다. 이 기법은 논증의 질보다 양을 우선시하며, 인류학자 유지니 스콧(Eugenie Scott)이 확립한 정의에 따르면 종종 "반쪽짜리 진실, 왜곡, 그리고 노골적인 거짓말"을 포함한다.​옥스퍼드 연구는 전문화된 훈련 방법과 전략적 프롬프팅이 AI의 설득력을 각각 최대 51%와 27%까지 증가시켰다는 것을 발견했다—이는 종종 모델 규모를 늘리는 것보다 더 큰 향상이었다. 모델 간 설득력의 설명 가능한 변동 중 대략 절반은 정보 밀도, 즉 대화 중 생성된 사실 확인 가능한 주장의 순수한 양으로 추적될 수 있었다.민주주의의 딜레마연구 결과는 초기의 낙관론에서 우려스러운 반전을 보여줍니다. 작년에 과학자들은 AI 챗봇이 합리적인 사실로 음모론을 다룸으로써 잘못된 정보에 맞서 싸울 수 있다는 희망을 제시했습니다. 5월 Nature에 발표된 별도의 연구에서는 개인 정보에 접근할 수 있는 GPT-4가 인간 토론자보다 사용자를 설득할 확률이 81.2% 더 높다는 것을 발견했습니다.​Bloomberg Opinion 칼럼니스트 Parmy Olson에 따르면, 중간 규모의 자원을 가진 캠페인이 약 50,000달러의 컴퓨팅 비용으로 이러한 설득 봇을 배치할 수 있다고 합니다. 연구자들은 이념적 아이디어를 추진하거나, 정치적 불안을 조성하거나, 정치 시스템을 불안정하게 만들려는 누구나 설득 캠페인을 위해 오픈 소스 모델을 사용할 수 있다고 경고합니다. 연구는 설득 효과가 초기 대화 후 최소 한 달 동안 지속되었음을 보여주었습니다.
834 조회
0 추천
2025.12.16 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입