테더, 410억 토큰 규모의 AI 훈련 데이터셋 공개
페이지 정보
본문

(퍼플렉시티가 정리한 기사)
테더 Data의 AI 연구 부서 QVAC는 인공지능 학습을 위한 410억 토큰 규모의 합성 데이터셋 Genesis I과 사용자 기기에서 완전히 실행되는 로컬 AI 애플리케이션 QVAC Workbench의 출시를 발표했습니다. 금요일에 공개된 이 이니셔티브는 고품질 학습 데이터에 대한 접근을 민주화함으로써 AI 개발에서 빅테크의 지배력에 도전하는 것을 목표로 합니다.
QVAC Genesis I은 수학, 물리학, 생물학, 의학을 다루는 STEM 교육 콘텐츠를 위해 특별히 설계된 최초의 공개 합성 데이터셋입니다. 단순히 언어 패턴을 모방하도록 돕는 기존 데이터셋과 달리, 이 컬렉션은 AI 시스템이 인과 관계를 이해하고 비판적 사고에 참여하도록 가르치는 데 중점을 둡니다.
AI 지능의 분산화
"지능은 중앙화되어서는 안 된다"고 테더의 CEO 파올로 아르도이노가 말했다. "QVAC 워크벤치와 제네시스 I을 통해 우리는 무한한 지능의 문을 열고 있습니다. 이는 당신의 기기에서 로컬로 살아있고, 학습하고, 진화하는 AI입니다." 아르도이노는 이번 출시가 "플랫폼이 아닌 사람들이 지식이 어떻게 생성되고, 공유되고, 사용되는지를 통제하는 미래"를 나타낸다고 강조했다.
이 데이터셋은 교육 및 과학적 벤치마크에 대해 엄격하게 검증되었으며, 기존 공개 훈련 데이터셋이 일반적으로 부족한 주요 STEM 영역에서 추론 및 문제 해결에 있어 우수한 성능을 보여주었다. 테더 데이터는 고품질 과학 자료를 구조화된 학습 데이터로 변환하는 다단계 생성 및 검증 프로세스를 사용하여 이 데이터셋을 생성했다.
로컬 AI 컴퓨팅 플랫폼
동시에 출시된 QVAC Workbench는 Android, iOS, Windows, macOS 및 Linux 플랫폼에서 Llama, Medgemma, Qwen, SmolVLM 및 Whisper를 포함한 여러 AI 모델을 지원합니다. 이 애플리케이션은 로컬 온디바이스 처리를 통해 모든 사용자 상호작용을 완전히 비공개로 유지하며, 사용자가 추가 컴퓨팅 성능을 위해 모바일 기기를 데스크톱 워크스테이션에 연결할 수 있는 독특한 "위임 추론(Delegated Inference)" 기능을 제공합니다.
이 플랫폼은 OpenAI와 Google과 같은 기업이 통제하는 클라우드 기반 AI 서비스의 대안을 찾는 AI 애호가, 연구자 및 고급 사용자를 대상으로 합니다. 업계 분석가들은 합성 데이터가 2030년까지 AI 훈련의 주요 소스가 될 것으로 예측하고 있어, 진화하는 AI 환경에서 Tether의 진출 시기가 전략적으로 중요합니다.
Tether의 AI 인프라 확장은 디지털 화폐를 넘어선 스테이블코인 거대 기업의 광범위한 다각화 전략의 일환입니다. 회사는 2025년에 약 150억 달러의 수익을 기대하고 있다고 보고했으며, 이는 기술 투자를 위한 상당한 자원을 제공합니다. 이 AI 이니셔티브는 오픈소스 지갑 개발 키트와 다양한 탈중앙화 통신 도구를 포함한 Tether의 이전 출시 제품을 기반으로 합니다.