Loading...

AI 뉴스

구글, 선별된 사용자에게 Gemini 3.0 Pro 조용히 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.17 16:00
2,273 조회
0 추천
0 비추천

본문

Google-Gemini-Custom-Gems-696x392.jpg

(퍼플렉시티가 정리한 기사)

구글는 차세대 AI 모델인 제미니 3.0 프로를 은밀하게 출시하기 시작했으며, 일부 사용자들은 공식 발표 없이 자동 업그레이드를 받고 있습니다. 10월 14일부터 유포된 스크린샷에는 사용자들이 "이전 모델에서 3.0 프로, 우리의 가장 똑똑한 모델로 업그레이드되었습니다"라는 알림 메시지가 표시되어 있습니다.​

이러한 조용한 배포 전략은 전통적인 제품 출시와는 다른 방식으로, 구글이 더 광범위한 공개 출시 전에 실제 성능 데이터를 수집할 수 있도록 합니다. 업계 관찰자들은 유출된 내부 마케팅 일정을 근거로 빠르면 10월 22일에 공식 발표가 있을 것으로 예상하고 있습니다.

 

획기적인 인터페이스 생성 기능

 

초기 사용자들은 Gemini 3.0 Pro의 가장 놀라운 능력을 선보였습니다: 간단한 프롬프트로 기능적인 운영 체제 시뮬레이션을 생성하는 것입니다. 사용자 @chetaslua는 클릭 가능한 인터페이스, 작동하는 애플리케이션, 그리고 사실적인 애니메이션을 포함한 macOS, Windows, iOS의 작동하는 클론을 모델이 생성하는 것을 시연했습니다.​

"세상에, 여러분, 모두가 이것을 볼 수 있도록 최대한 많이 리트윗해서 주류에 알려주세요"라고 @chetaslua가 게시했으며, 그의 macOS 시뮬레이션 영상은 370만 회 이상의 조회수를 기록했습니다. 시연에서는 기능적인 Safari 브라우징, 드래그 가능한 창, 그리고 상징적인 메뉴바를 갖춘 가상 Mac이 보여졌으며—모두 단일 HTML 파일로 생성되었습니다.​

초기 테스트 보고서에 따르면, 이 모델은 로딩 애니메이션과 반응형 레이아웃을 포함하여 2,000줄 이상의 프론트엔드 코드를 출력할 수 있습니다. 다른 사용자는 Python 터미널 지원과 플레이 가능한 게임을 갖춘 Windows 웹 OS 클론을 "원샷으로" 만들었습니다.

 

경쟁사 대비 전략적 포지셔닝

 

Gemini 3.0 Pro의 출시 시기는 AI 시장에서 경쟁을 더욱 심화시키고 있으며, OpenAI의 GPT-5와 Anthropic의 Claude 4.5 Sonnet이 2025년 내내 높은 기준을 설정하고 있습니다. Google의 기업용 전략에는 최근 사용자당 월 $30의 Gemini Enterprise 출시가 포함되어 있으며, 이는 Microsoft Copilot과 OpenAI의 기업용 제품에 직접적으로 도전하고 있습니다.​

"우리는 사람들이 AI에 접근할 수 있는 방식을 민주화하고 있습니다"라고 Google Cloud CEO Thomas Kurian은 말하며, Chrome, Android 및 Workspace 제품 전반에 걸쳐 AI를 통합하려는 회사의 광범위한 전략을 강조했습니다. 회사는 상위 10개 AI 연구소 중 9개가 현재 컴퓨팅 성능을 위해 Google Cloud를 사용하고 있으며, 기존 고객 약정이 $1,060억에 달한다고 보고하고 있습니다.

 

구글, 조용히 Gemini 3.0 Pro 출시 시작

 

Google은 차세대 AI 모델인 Gemini 3.0 Pro의 은밀한 출시를 시작했으며, 일부 선정된 사용자들이 공식 발표 없이 자동 업그레이드를 받고 있습니다. 10월 14일 이후 유포된 스크린샷에는 사용자들이 "이전 모델에서 3.0 Pro, 우리의 가장 똑똑한 모델로 업그레이드되었습니다"라고 알리는 알림 메시지가 표시되어 있습니다.​

이러한 조용한 배포 전략은 전통적인 제품 출시 방식에서 벗어난 것으로, Google이 더 광범위한 대중 출시 전에 실제 성능 데이터를 수집할 수 있게 해줍니다. 업계 관찰자들은 유출된 내부 마케팅 일정을 근거로 빠르면 10월 22일에 공식 발표가 있을 것으로 예상하고 있습니다.

 

혁신적인 인터페이스 제작 역량

 

얼리 어답터들은 Gemini 3.0 Pro의 가장 놀라운 기능을 선보였습니다: 간단한 프롬프트만으로 작동하는 운영체제 시뮬레이션을 만드는 것입니다. 사용자 @chetaslua는 클릭 가능한 인터페이스, 작동하는 애플리케이션, 그리고 현실적인 애니메이션을 포함한 macOS, Windows, iOS의 작동 가능한 클론을 모델이 생성하는 것을 시연했습니다.​

"이런 세상에, 여러분, 모두가 이걸 봤으면 좋겠어요. 최대한 많이 리트윗해서 메인스트림에 올려주세요"라고 @chetaslua가 게시했으며, 그의 macOS 시뮬레이션 영상은 370만 회 이상의 조회수를 기록했습니다. 시연에서는 작동하는 Safari 브라우징, 드래그 가능한 윈도우, 그리고 상징적인 메뉴 바를 갖춘 가상 Mac이 보여졌으며—모두 단일 HTML 파일로 생성되었습니다.​

초기 테스트 보고서에 따르면, 이 모델은 로딩 애니메이션과 반응형 레이아웃을 포함하여 2,000줄 이상의 프론트엔드 코드를 출력할 수 있습니다. 다른 사용자는 Python 터미널 지원과 플레이 가능한 게임이 포함된 Windows 웹 OS 클론을 "원샷으로" 만들었습니다.

 

경쟁자 대비 전략적 포지셔닝

 

Gemini 3.0 Pro의 출시 시기는 AI 시장의 경쟁을 심화시키고 있으며, OpenAI의 GPT-5와 Anthropic의 Claude 4.5 Sonnet이 2025년 내내 높은 기준을 설정하고 있습니다. Google의 기업용 진출에는 최근 사용자당 월 30달러의 Gemini Enterprise 출시가 포함되어 있으며, 이는 Microsoft Copilot과 OpenAI의 기업용 제품에 직접적으로 도전하고 있습니다.​

Google Cloud CEO Thomas Kurian은 "우리는 사람들이 AI에 접근할 수 있는 방법을 민주화하고 있습니다"라고 말하며, Chrome, Android 및 Workspace 제품 전반에 AI를 통합하려는 회사의 광범위한 전략을 강조했습니다. 회사는 상위 10개 AI 연구소 중 9개가 현재 컴퓨팅 파워를 위해 Google Cloud를 사용하고 있으며, 기존 고객 약정이 1,060억 달러에 달한다고 보고했습니다.

댓글 0
전체 1,366 / 243 페이지
(퍼플렉시티가 정리한 기사)생성형 인공지능이 스스로 계획을 세우고 실행하는 ‘AI 에이전트’로 진화하면서 금융회사들이 데이터 연동성과 거버넌스 역량을 전면적으로 강화해야 한다는 분석이 나왔다. 삼일PwC는 21일 발간한 ‘AI가 바꾸는 금융 프론트라인, AI 에이전트 금융의 미래’ 보고서에서 금융산업의 구조적 변화가 불가피하다고 전망했다.A2A 경제와 금융사 역할 대전환보고서는 AI 에이전트의 진화가 ‘A2A(Agent-to-Agent) 경제’라는 새로운 질서를 가져올 것이라고 제시했다. A2A 경제는 인간의 개입 없이 AI 에이전트들이 서로 협력하고 거래하며 의사결정과 실행을 자율적으로 수행하는 구조를 의미한다.이러한 변화로 고객 접점의 주도권이 금융사에서 AI 에이전트로 이동하고, 금융사는 데이터와 상품을 제공하는 인프라 역할로 무게 중심이 옮겨갈 것으로 전망된다. 예를 들어 고객이 AI 에이전트에게 금융상품 추천을 요청하면 API(애플리케이션 프로그래밍 인터페이스)를 통해 각 금융사의 상품 정보를 호출해 비교·분석한 후 후보군을 제시하는 방식이 확산될 것이라고 분석했다.데이터 거버넌스가 핵심 경쟁력보고서는 AI 에이전트 시대에 데이터 거버넌스의 중요성이 더욱 커질 것으로 전망했다고 밝혔다. 금융사가 데이터와 상품을 제공하는 핵심 인프라 역할을 하게 되면서, 데이터와 리스크를 아우르는 통합 관리 체계 구축이 핵심 경쟁력으로 자리 잡을 것이라고 강조했다.특히 금융사가 서비스를 기능 단위로 세분화해 API 기반으로 제공하는 체계를 갖추지 못한다면 AI 에이전트의 상품 선택 과정에서 경쟁력을 잃을 수 있다고 경고했다. 또한 단순·반복 직무의 AI 대체가 가속화되는 반면, AI 산출 결과를 비판적으로 해석하고 윤리적·전략적 결정을 내릴 수 있는 인력의 중요성이 부각될 것으로 내다봤다.규제 패러다임도 변화AI 에이전트가 금융 거래의 핵심 채널로 자리잡게 될 경우 규제 방식도 사후 점검에서 AI 행위의 실시간 추적으로 변화할 것으로 예측했다. 금융사의 규제 준수 역시 기존 업권·기관 중심에서 AI의 판단과 행위 자체를 관리·검증하는 방향으로 전환될 것이라고 전망했다.김경구 삼일PwC 금융산업 리더는 “AI 에이전트의 부상은 단순한 기술 변화가 아니라 금융산업의 구조 전반을 재정의하는 흐름”이라며 “A2A 경제 전환기에 대응하지 못한다면 금융의 주도권은 AI 에이전트와 이를 통제하는 새로운 주체에게 넘어갈 수 있다”고 경고했다.
2476 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)중국 AI 기업 DeepSeek은 월요일에 DeepSeek-OCR을 공개했습니다. 이는 97%의 정확도를 유지하면서 최대 20배의 텍스트 압축을 달성하는 오픈소스 멀티모달 AI 모델로, AI 시스템의 문서 처리 효율성에 있어 중요한 돌파구를 마련했습니다.시각적 텍스트 압축의 획기적 발전30억 파라미터 비전-언어 모델은 텍스트를 압축을 위한 이미지로 취급하는 혁신적인 접근 방식을 활용하여, AI 시스템이 컴퓨팅 비용의 비례적 증가 없이 방대한 문서를 처리할 수 있도록 합니다. DeepSeek의 기술 논문에 따르면, 이 모델은 원본 정보의 97%를 유지하면서 텍스트를 최대 10배까지 압축할 수 있으며, 20배 압축 비율에서도 유용한 성능을 발휘합니다.“DeepSeek-OCR을 통해 우리는 비전-텍스트 압축이 다양한 과거 컨텍스트 단계에서 7배에서 20배에 이르는 상당한 토큰 감소를 달성할 수 있음을 입증했으며, 이는 LLM의 긴 컨텍스트 문제를 해결하기 위한 유망한 방향을 제시합니다”라고 항저우에 본사를 둔 이 회사는 밝혔습니다.이 시스템은 단일 Nvidia A100 GPU에서 매일 200,000페이지 이상을 처리하며, 각각 8개의 A100을 장착한 20대의 서버를 사용하여 하루 3,300만 페이지에 달하는 처리량을 달성합니다. 이러한 처리 능력은 유사한 작업에 일반적으로 수천 개의 토큰을 필요로 하는 기존 OCR 방법을 훨씬 능가합니다.기술 아키텍처 및 성능DeepSeek-OCR은 두 가지 핵심 구성 요소로 이루어져 있습니다: 이미지 처리를 위한 DeepEncoder와 디코더로서의 DeepSeek3B-MoE-A570M입니다. 인코더는 Meta의 8천만 매개변수 SAM(Segment Anything Model)과 OpenAI의 3억 매개변수 CLIP을 결합하며, 1,024픽셀 이미지를 4,096개 토큰에서 단 256개 토큰으로 줄이는 16배 압축기를 활용합니다.OmniDocBench 벤치마크 테스트에서 DeepSeek-OCR은 256개가 아닌 단 100개의 비전 토큰만 사용하여 GOT-OCR 2.0을 능가했으며, 페이지당 6,000개 이상의 토큰 대신 800개 미만의 토큰으로 MinerU 2.0을 초과했습니다. 이 모델은 약 100개 언어를 지원하며, 64개 토큰이 필요한 간단한 프레젠테이션부터 “건담 모드”에서 최대 800개 토큰이 필요한 복잡한 신문까지 다양한 문서 유형을 처리할 수 있습니다.DeepSeek은 합성 다이어그램, 화학식, 기하학적 도형을 포함하여 약 100개 언어에 걸친 3천만 개의 PDF 페이지를 사용하여 시스템을 훈련했습니다. 이 모델은 현재 MIT 라이선스 하에 Hugging Face와 GitHub에서 이용 가능하며, OpenAI와 Google 의 모델에 대한 비용 효율적인 대안으로 업계를 혁신해 온 DeepSeek의 오픈소스 AI 개발에 대한 약속을 이어가고 있습니다.
2429 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)6개의 주요 인공지능 모델이 전례 없는 실제 암호화폐 거래 실험에서 경쟁하고 있으며, DeepSeek Chat V3.1이 단 이틀간의 거래 만에 초기 1만 달러를 1만 3,739달러로 전환하며 현재 선두를 달리고 있습니다.AI 연구소 Nof1이 주최하고 "Alpha Arena"라고 명명된 이 대회는 10월 18일에 시작되었으며, 실시간 금융 시장에서 AI 거래 능력을 테스트하는 최초의 대규모 공개 실험을 나타냅니다. GPT-5, Claude Sonnet 4.5, Grok 4, Gemini 2.5 Pro, DeepSeek V3.1, Qwen3 Max를 포함한 각 모델은 동일한 1만 달러의 초기 자본과 균일한 거래 프롬프트를 받아 Hyperliquid 탈중앙화 거래소에서 경쟁합니다.DeepSeek, 공격적인 롱 전략으로 지배하다DeepSeek이 37.4%의 수익률로 확실한 선두주자로 부상했으며, Elon Musk의 Grok 4가 $13,342로 근소한 차이로 뒤를 이었고, Anthropic의 Claude Sonnet 4.5가 $12,383를 기록했습니다. 중국에서 개발된 이 모델은 비트코인, 이더리움, 솔라나에 대한 레버리지 롱 포지션을 통해 주로 수익을 달성했으며, 일부 포지션은 최대 15배의 레버리지를 사용했습니다.​DeepSeek의 성공은 부분적으로 중국의 퀀트 트레이딩 회사인 High-Flyer Capital Management의 지원에서 비롯되며, 이는 전문화된 금융 전문지식이 학습 데이터에 영향을 미쳤을 수 있음을 시사합니다. 이 모델의 가장 큰 수익 거래는 15배 레버리지 이더리움 포지션으로 $889의 수익을 창출했습니다.​한편, OpenAI의 GPT-5와 Google의 Gemini 2.5 Pro는 상당한 어려움을 겪고 있으며, 두 모델 모두 계좌가 $7,500 아래로 떨어져 25%를 초과하는 손실을 나타냈습니다. Gemini는 특히 변동성이 컸으며, 단 3건의 거래만 완료한 Claude와 같은 보수적인 모델들에 비해 44건의 거래를 실행했습니다.업계 리더들, 공유 AI 전략의 효과성에 의문 제기이 실험은 바이낸스 공동 창립자 창펑 자오(CZ)의 관심을 끌었으며, 그는 공유된 AI 거래 전략의 지속 가능성에 대해 의문을 제기했습니다. "거래 전략은 다른 사람들보다 우수한 고유한 전략을 가지고 있고, 다른 누구도 그것을 가지고 있지 않을 때 가장 잘 작동한다고 생각했습니다. 그렇지 않으면 다른 사람들과 동시에 사고파는 것일 뿐입니다"라고 자오는 X에 게시했습니다.​자오는 동일한 AI 모델의 광범위한 채택이 가격을 어느 방향으로든 움직이는 "집합적 구매력"을 통해 시장 왜곡을 만들어 전략의 효과성을 잠재적으로 약화시킬 수 있다고 제안했습니다. 이러한 우려에도 불구하고, 그는 이 실험이 AI 거래에 대한 더 많은 연구를 장려하고 더 높은 거래량을 촉진할 것이라고 예측했습니다.​경쟁은 2025년 11월 3일까지 진행되며, 투명성을 위해 모든 거래와 모델 의사결정 과정이 공개적으로 표시됩니다. 이 실험은 AI가 금융 시장을 어떻게 재편할 수 있는지 이해하기 위한 중요한 단계를 나타내며, 초기 결과는 전문화된 훈련 데이터와 공격적인 위험 감수가 변동성이 큰 암호화폐 시장에서 경쟁 우위를 제공할 수 있음을 시사합니다.
2144 조회
0 추천
2025.10.21 등록
(퍼플렉시티가 정리한 기사)OpenAI는 월요일, 무단으로 제작된 유명인 딥페이크에 대한 광범위한 비판에 따라 Sora 2 비디오 애플리케이션의 보호 조치를 강화할 것이라고 발표했으며, 사용자들이 동의 없이 유명인의 모습을 담은 비디오를 제작한 이후 배우 브라이언 크랜스턴, SAG-AFTRA, 그리고 주요 에이전시들과 합의에 도달했습니다.이 인공지능 회사는 크랜스턴, 미국 배우 조합-미국 텔레비전 및 라디오 예술가 연맹, 유나이티드 탤런트 에이전시, 크리에이티브 아티스트 에이전시, 그리고 탤런트 에이전트 협회와 공동 성명을 발표하며, 공연자들의 목소리와 초상을 보호하기 위한 "생산적인 협력"을 확인했습니다. 이 해결책은 9월 30일 Sora 2가 출시되고 불과 3주 만에 나온 것으로, 당시 이 앱은 Apple App Store에서 가장 많이 다운로드된 앱 중 하나가 되었습니다.브라이언 크랜스턴이 업계 반응을 주도하다"브레이킹 배드"에서의 역할로 가장 잘 알려진 크랜스턴은 앱의 초기 초대 전용 출시 기간 동안 자신의 허락 없이 Sora 2 동영상에서 자신의 음성과 초상이 복제된 것을 발견한 후 SAG-AFTRA에 알렸다. "저는 저 자신뿐만 아니라 이런 식으로 작품과 정체성이 오용될 수 있는 모든 출연자들을 위해 깊이 우려했습니다"라고 크랜스턴은 월요일 성명에서 말했다.​OpenAI는 "의도하지 않은 생성"이라고 부른 것에 대해 유감을 표명했으며, 개인이 동의하지 않을 때 음성 및 초상 복제에 대한 보호 장치를 강화하겠다고 약속했다. 회사는 누군가의 음성이나 초상을 사용하기 전에 명시적 동의를 요구하는 옵트인 정책을 유지하고 있지만, 크랜스턴의 사례에서는 시행이 명백히 실패했다.마틴 루터 킹 주니어 동영상 차단됨지난주, OpenAI는 마틴 루터 킹 주니어의 유산 관리 기관이 민권 운동 지도자에 대한 "무례한 묘사"에 대해 항의한 후 그의 비디오 생성을 중단해야 했습니다. 사용자들은 킹을 인종차별적인 시나리오에 등장시키는 AI 비디오를 만들었으며, 여기에는 그가 "나에게는 꿈이 있습니다" 연설 중 모욕적인 소리를 내거나 저속한 행동을 하는 장면을 묘사한 클립이 포함되어 있었습니다.​"일부 사용자들이 킹 박사의 이미지를 무례하게 묘사한 콘텐츠를 생성했습니다"라고 OpenAI와 킹 유산 관리 기관은 목요일 공동 성명에서 밝혔습니다. 킹 박사의 딸인 버니스 킹은 사람들에게 아버지의 AI 생성 비디오를 보내는 것을 중단해 달라고 공개적으로 요청했으며, 이는 고(故) 코미디언 로빈 윌리엄스의 딸인 젤다 윌리엄스의 유사한 호소와 맥락을 같이 합니다.연방 법안에 대한 업계 전반의 지지월요일 합의에 참여한 모든 당사자들은 공연자들을 무단 디지털 복제로부터 보호하기 위해 고안된 연방 입법안인 NO FAKES Act에 대한 지지를 표명했습니다. "OpenAI는 공연자들의 음성과 초상이 도용되지 않도록 보호하는 데 깊이 전념하고 있습니다"라고 CEO 샘 알트먼이 성명에서 밝혔습니다.​SAG-AFTRA 회장 숀 애스틴은 이번 해결을 칭찬하면서도 "브라이언 크랜스턴은 복제 기술에 의해 음성과 초상이 대규모로 도용될 위험에 처한 수많은 공연자들 중 한 명입니다"라고 경고했습니다. 노조는 AI 기술이 발전함에 따라 옵트인 프로토콜이 "사업을 하는 유일한 방법"이라고 강조했습니다.​이번 논란은 지적 재산권을 둘러싼 AI 기업들과 할리우드 간의 광범위한 긴장을 부각시키며, CAA와 UTA 모두 이전에 OpenAI가 플랫폼에서 저작권이 있는 자료를 허용한 것에 대해 비판한 바 있습니다. OpenAI는 처음에 저작권 보유자들이 자신의 자산이 사용되지 않도록 옵트아웃하도록 요구했지만, 이후 명시적인 옵트인 동의를 요구하는 방향으로 전환했습니다.
2116 조회
0 추천
2025.10.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입