Loading...

AI 뉴스

구글, 사람처럼 웹사이트를 탐색하는 AI 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.09 00:41
2,848 조회
1 댓글
0 추천
0 비추천

본문

ba72d763b983c6ff70bba9e70989829bFWq1.jpeg

(퍼플렉시티가 정리한 기사)

Google의는 Gemini 2.5 Computer Use 모델을 출시했습니다. 이 모델은 웹사이트를 탐색하고 인간 사용자처럼 디지털 인터페이스와 상호작용할 수 있는 정교한 AI 시스템입니다. 2025년 10월 7일에 출시된 이 전문화된 모델은 AI 자동화 분야에서 중요한 진전을 이루었으며, 빠르게 발전하는 브라우저 에이전트 시장에서 경쟁사들과의 경쟁을 촉진하고 있습니다.

Computer Use 모델은 시각적 이해와 추론 역량을 활용하여 AI 에이전트가 버튼 클릭, 텍스트 입력, 페이지 스크롤, 양식 작성 등 복잡한 웹 작업을 수행할 수 있습니다. 기존의 구조화된 API에 의존하는 전통적인 자동화와 달리, 이 시스템은 그래픽 사용자 인터페이스(GUI)에서 작동하기 때문에 레이아웃이 바뀌는 동적 웹사이트 및 애플리케이션도 처리할 수 있습니다.

 

구글의 인공지능 에이전트 경쟁에 대한 전략적 대응

 

구글의 이번 발표 시점은 오픈AI의 ChatGPT 에이전트 개발과 Anthropic이 지난해 선보인 컴퓨터 사용 기능 이후에 이뤄진 것으로, 이들 흐름을 기반으로 한다. 경쟁사들은 전체 데스크톱 제어 기능을 제공하는 반면, 구글의 모델은 브라우저 기반 상호작용에 초점을 두고 있으며, 웹 탐색, 텍스트 입력, 드래그 앤 드롭 기능을 포함해 총 13가지의 개별 작업을 지원한다.

구글의 접근 방식은 여러 웹 및 모바일 벤치마크에서 선도적인 대안들을 능가하는 우수한 성능과 낮은 지연 시간을 보여준다. Online-Mind2Web 벤치마크에서 Gemini 2.5 Computer Use는 76.7%의 정확도를 기록해 Claude Sonnet(61.9%)와 OpenAI(44.3%)를 앞섰다. 또한, WebVoyager 테스트에서도 79.9%의 성능을 보여 경쟁사들의 69.5% 및 61.0% 대비 뛰어난 결과를 나타냈다.

이 모델은 Project Mariner와 검색 내 AI 모드 등 구글의 기존 제품에 이미 적용되고 있다. 내부 테스트 결과 역시 유망하며, 구글 결제팀은 본 모델이 과거 해결까지 수일이 걸렸던 실패 테스트 케이스 중 60% 이상을 해결했다고 보고했다.

 

시장 영향 및 개발자 접근

 

Google AI Studio와 Vertex AI를 통해 제공되는 Computer Use 모델은 Gemini 2.5 Pro와 유사한 토큰 기반 요금제를 따르며, 20만 토큰 미만의 프롬프트에 대해 입력 토큰 100만 개당 $1.25의 비용이 부과됩니다. 표준 Gemini 모델의 무료 요금제와 달리, Computer Use는 처음부터 유료 이용이 필요합니다.

이 출시는 2023년 37억 달러 규모였고 2025년에는 73억 8천만 달러에 이를 것으로 예상되는 AI 에이전트 시장에서 경쟁을 더욱 치열하게 만듭니다. Google은 검색, Android, YouTube, Workspace 등 전방위적 생태계 통합을 통해 순수 AI 제공업체 대비 전략적 이점을 확보하고 있으며, 2025년 상반기에만 Google Workspace에서 23억 건 이상의 문서 상호작용이 이루어졌습니다.

Google은 액션별 안전성 검토와 개발자 제어 등 다중 보호막을 도입해 무단 행위를 방지하는 등 안전을 최우선으로 하고 있습니다. 이 모델은 구매와 같은 민감한 행동에 대해 사용자 확인을 요구하며, 보안 침해 방지를 위한 보호 조치도 포함하고 있습니다.

댓글 1

xtalfi님의 댓글

작성자 xtalfi
작성일 2025.10.10 17:06
매크로 티케팅을 인공지능이 대체하게 돠었다는 뜻.? ㅎ 그나저나RPA 업계 근황이 궁금하네요
전체 1,366 / 282 페이지
(퍼플렉시티가 정리한 기사)억만장자 마크 큐반은 테슬라(Tesla, Inc.) CEO 일론 머스크의 인간형 로봇에 대한 대담한 비전에 공개적으로 도전하면서, 로봇 혁명에서는 인간과 유사한 외형보다 기능 중심의 설계가 우위를 점할 것이라고 주장했습니다.이번 주 Prof G Markets 팟캐스트에서 큐반은 머스크의 지성을 칭찬하면서도, 인간형 로봇이 4~5년 내에 전 세계 GDP에 상당한 영향을 미칠 것이라는 그의 예측에는 동의하지 않았습니다. 큐반은 머스크가 비디오 기반 AI 기술에서 우위를 갖고 있다는 점을 인정하며, “로봇공학 분야에서 그들은 비디오를 포착해야 합니다. 바로 그 부분에서 일론이 똑똑하고 앞서 있습니다”라고 밝혔습니다.로봇 설계에서 기능이 형태보다 우선이다하지만 큐번은 테슬라의 옵티머스와 같은 휴머노이드 기계보다 작업 중심의 로봇에 미래가 있다고 믿는다. 큐번은 머스크의 C-3PO와 같은 비전에 대해 “그게 미래라고 생각하지 않는다”고 말했다. 대신 그는 특정 목적을 위해 설계된 로봇을 상상하며, “거미처럼 생길 수도 있고 어떤 모습이든 나올 수 있다”고 덧붙였다.큐번은 “어떤 양말이 한 쌍인지 알고, 얼마나 오랫동안 세탁해야 하는지, 침대 밑에 먼지가 있는지도 확인하는” 자율적인 가정용 로봇을 묘사했다. 인간 같은 외형보다 실질적인 기능성에 중점을 둔 큐번의 견해는 휴머노이드 로봇이 스마트폰만큼 보편화되고 현재 글로벌 경제 규모의 “10배로 경제를 성장시킬 수 있다”고 예측하는 머스크의 전망과 크게 대조된다.실제 세계의 AI 적용 사례큐반의 회의론은 부분적으로 그가 AI 기반 자동화와 직접적으로 겪은 경험에서 비롯된다. 그의 회사인 코스트 플러스 드럭스는 로봇과 AI를 활용하여 댈러스에서 의약품을 인도나 중국보다 효율적으로 제조하고 있다. “많은 사람이 필요하지 않습니다,“라고 큐반은 언급하며, 이 시설이 “몇 시간 만에 한 약에서 다음 약으로 바꿀 수 있다”고 덧붙였다.이런 실용적인 접근은 AI가 중소기업에 가장 큰 영향을 미칠 것이고, 전례 없는 효율성 향상과 젊은 학습자들을 위한 교육 기회를 제공할 것이라는 큐반의 보다 넓은 신념을 반영한다.로봇 디자인에 대한 철학적 차이에도 불구하고, 두 억만장자는 AI의 변혁적 잠재력에 동의한다. 머스크가 최근 테슬라의 미래 가치 중 80%가 옵티머스 로봇에서 나올 것이라고 주장한 반면, 큐반은 인간형 외형보다는 실용성을 우선시하는 검증된 활용 사례에 집중하며 새로운 로봇 경제에서 실질적인 성과에 주목하고 있다.
2937 조회
0 추천
2025.10.05 등록
(퍼플렉시티가 정리한 기사)오픈AI는 금요일에 Sora AI 비디오 앱의 논란이 된 저작권 정책을 철회하고, 권리 보유자들이 자신들의 캐릭터가 어떻게 사용되는지에 대해 더 많은 권한을 가지도록 하는 새로운 제어 기능을 발표했으며, 이러한 사용을 허락한 이들과 수익을 공유하겠다고 약속했다.이 조치는 소셜 비디오 앱이 출시된 후, 할리우드로부터 “옵트아웃(opt-out)” 방식에 대한 광범위한 비판이 제기된 지 불과 며칠 만에 이뤄진 것이다. 기존에는 스튜디오와 저작권 소유자가 AI 생성 영상에서 자신의 콘텐츠 제거를 직접 요청해야 했다.“우리는 권리 보유자들에게 캐릭터 생성에 대해 더 세밀한 통제권을 제공할 것입니다,“라고 오픈AI CEO 샘 알트먼은 금요일 블로그 게시글에서 밝혔다. “우리는 매우 빠르게 배우고 있으며, 이 새로운 형태의 ‘상호작용형 팬 픽션’에 대해 흥분하는 많은 권리 보유자들로부터 피드백을 받고 있습니다. 이 참여가 그들에게 상당한 가치를 제공할 수 있다고 생각하지만, 자신들의 캐릭터가 어떻게 사용되는지(사용되지 않는 것도 포함) 제어할 수 있기를 원합니다.”할리우드의 반발이번 개정은 이번 주 소라(Sora) 출시 이후 엔터테인먼트 기업들의 강력한 반발에 따른 것이다. 소식통에 따르면 디즈니(월트 디즈니 컴퍼니)는 이미 해당 앱에 자사의 콘텐츠가 등장하지 않도록 거부했다. 소속사 WME는 에이전트들에게 보낸 메모에서 클라이언트의 작품을 보호할 의사를 밝히며, “아티스트와 크리에이티브들이 자신들의 지적 재산권뿐 아니라 이름, 이미지, 초상권을 침해할 수 있는 AI 모델을 마주할 때 진정한 보호 장치가 절실히 필요하다”고 밝혔다.사용자들은 즉시 ‘사우스파크’, ‘릭 앤 모티’, 닌텐도의 마리오와 피카츄 등 저작권이 있는 캐릭터가 등장하는 AI 생성 영상을 플랫폼에 대거 업로드했다. 사용자가 오디오와 대사가 동기화된 10초 분량의 영상을 생성할 수 있는 이 앱은 출시 며칠 만에 iOS 앱스토어 1위에 올랐다.수익 분배 모델OpenAI는 또한 사용자가 캐릭터를 생성하도록 허용한 저작권 보유자들과 수익을 공유하는 시스템을 도입할 계획도 발표했다. “사람들이 예상보다 훨씬 더 많은 콘텐츠를 생성하고 있으며, 매우 적은 관객을 위해 생성되는 영상도 많다”고 알트만은 설명했다. “우리는 자신의 캐릭터가 사용자에 의해 생성되기를 원하는 저작권자들과 이 수익의 일부를 공유하려고 합니다.”회사는 이러한 수익 공유 프레임워크가 “시행착오가 필요할 것”임을 인정했지만, 우선 Sora 내에서 다양한 방식을 테스트하며 곧 도입을 시작할 것이고, 효과적인 모델이 확립되면 이를 자사의 전 제품군에 일관되게 적용하겠다고 밝혔다.이러한 변화는 Microsoft 이 지원하는 OpenAI가 AI 생성 콘텐츠와 지적 재산권에 대한 감시가 커지는 가운데 이를 헤쳐나가며 큰 변화를 시도하고 있음을 보여준다. 회사는 저자들과 The New York Times와 같은 주요 출판사들의 소송을 포함해 여러 저작권 소송에 직면해 있다.
2847 조회
1 추천
2025.10.04 등록
(퍼플렉시티가 정리한 기사)벤처 캐피털리스트들이 2025년에 인공지능 스타트업에 사상 최대인 1,927억 달러를 투자하며 벤처 캐피털 역사상 가장 집중된 투자 열기를 불러일으켰고, 전체 VC 자금의 절반 이상이 한 산업에 몰린 첫 해로 기록되었습니다.이러한 급증은 벤처 캐피털 시장에 전례 없는 변화를 의미하며, 3분기까지 AI가 전 세계 VC 자금의 53.2%를 차지하는 결과를 낳았습니다. 미국에서는 그 지배력이 더욱 두드러져, AI 스타트업이 국내 벤처 투자금 2,502억 달러 중 62.7%를 끌어모았습니다.시장 분열은 승자와 패자를 만든다AI 투자 열풍은 PitchBook의 리서치 디렉터인 카일 샌포드(Kyle Sanford)가 "양분화된(bifurcated)" 시장이라고 표현한 현상을 만들어냈다. 이 시장에서는 회사들이 뚜렷이 구분된 범주로 나뉜다. 샌포드는 "우리가 어디를 보든, 시장은 양분화되어 있습니다. AI에 속해 있거나 아니면 그렇지 않거나, 대기업에 속해 있거나 아니면 그렇지 않거나입니다"라고 말했다.이러한 양극화로 인해 대부분의 자본이 이미 확립된 AI 거대 기업에 집중되고 있다. Anthropic은 9월에 대규모 시리즈 F 투자 라운드에서 130억 달러를 유치하며 기업 가치를 3배로 늘려 1,830억 달러에 달하게 만들었다. 한편 일론 머스크의 xAI는 2,000억 달러 가치로 100억 달러를 추가로 모금 중인 것으로 전해진다. 이처럼 초대형 투자 라운드가 투자 시장을 장악하고 있으며, AI 기업들이 전체 벤처 캐피탈 거래의 약 30%를 차지하고 있지만, 투자된 금액 면에서는 그 비중이 더욱 크다.한편, AI 분야 외의 스타트업들은 자본 유치에 전례 없는 어려움에 직면하고 있다. 2025년에는 전 세계적으로 벤처 투자를 받는 기업 수가 수년 내 최저치에 이를 것으로 예상된다. 2022년에는 4,400개 이상의 펀드가 4,120억 달러를 모았으나, 2025년에는 단 823개의 벤처 펀드가 800억 달러만을 모금할 전망이다.시장 집중의 경고 신호투자의 극단적인 집중은 지속 가능성과 시장 건전성에 대한 우려를 불러일으키고 있습니다. 세계 최대 투자자들 중 일부는 초기 단계 AI 기업의 가치 평가가 점점 “거품”처럼 보이기 시작했다고 경고하고 있으며, 관찰자들은 잠재적인 “과대광고 버블”이 나중에 문제를 일으킬 수 있다고 주의하고 있습니다.이러한 자금 유입으로 인해 AI 스타트업들의 총 사후 투자 평가액이 2조 3,000억 달러에 달하게 되었으며, 이는 2024년의 1조 6,900억 달러에서 증가한 수치입니다. 이와 같은 집중 현상은 일부 AI 기업만이 막대한 투자를 유치하는 반면, 다른 스타트업들의 전반적 전망은 여전히 어려운 상황임을 의미합니다. 특히 IPO(기업공개)와 인수합병이 여전히 제한적으로 이루어지고 있기 때문입니다.
2877 조회
0 추천
2025.10.04 등록
(퍼플렉시티가 정리한 기사)오픈AI는 2025년 10월 3일, AI 기반 개인 금융 앱인 로이(Roi)를 인수했다고 발표했습니다. 이는 오픈AI가 맞춤형 소비자 AI 애플리케이션에 더욱 집중하면서 최근 일련의 '애퀴하이어(acqui-hire)' 중 가장 최근 사례입니다. 로이 4인 팀 중 CEO이자 공동 창업자인 수지트 비쉬와짓(Sujith Vishwajith)만이 오픈AI에 합류하며, 로이는 10월 15일에 운영을 중단할 예정입니다.2022년에 설립된 뉴욕 기반 스타트업 로이는, 발라지 스리니바산(Balaji Srinivasan), 스파크 캐피탈, 그라디언트 벤처스(Gradient Ventures), 스페이스카뎃 벤처스(Spacecadet Ventures) 등 투자자들로부터 360만 달러를 투자받았습니다. 로이는 사용자의 전체 금융 내역—주식, 암호화폐, 디파이(DeFi), 부동산, NFT 등—을 통합해 한 앱에서 관리할 수 있도록 하고, 개인 맞춤형 AI 기반 인사이트와 거래 지원을 제공하는 데 특화되어 있었습니다.소비자 개인화로의 전략적 전환이번 인수는 OpenAI가 API 서비스에서 벗어나 전 인스타카트 CEO 피지 시모(Fidji Simo)가 2025년 5월 Applications 부문 CEO로 합류한 이후 직접적인 소비자 애플리케이션으로 진출하려는 더 넓은 전략과 맞물립니다. 이러한 소비자 중심의 움직임에는 개인화된 뉴스 리포트를 제공하는 Pulse의 최근 출시, TikTok 경쟁 앱인 Sora 앱, 그리고 ChatGPT 내에서 직접 구매를 할 수 있는 Instant Checkout 기능 등이 포함되어 있습니다."우리는 개인화가 금융의 미래일 뿐만 아니라 소프트웨어의 미래라는 것을 깨달았습니다."라고 비슈와짓(Vishwajith)이 X에 거래를 발표하며 썼습니다. Roi의 철학은 개별 소통 방식과 선호도를 학습하는 적응형 AI 동반자에 초점을 맞추고 있었으며, 이는 OpenAI의 기존 소비자 제품을 한 층 더 강화할 수 있는 역량입니다.더 폭넓은 인수 채용 전략의 일부이는 Context.ai, Crossing Minds, 그리고 Alex를 포함한 2025년 일련의 인재 영입 중 OpenAI의 최신 사례입니다. 이 회사는 또한 9월에 Statsig를 11억 달러에 인수 완료하며 CEO Vijaye Raji를 응용 프로그램 CTO로 합류시켰습니다. 이러한 움직임은 회사들이 전통적인 합병에 수반되는 오랜 규제 심사를 피하면서 우수 인재를 확보하기 위해 수십억 달러를 지불하는, 더 넓은 AI 업계의 트렌드를 반영합니다.OpenAI가 인프라와 데이터 센터에 수십억 달러를 지속적으로 소진하면서, 의미 있는 소비자 매출 창출이 점점 더 중요해지고 있습니다. Vishwajith가 Airbnb에서 사용자 행동을 최적화해 수백만 달러의 추가 매출을 이끌었던 경험은, OpenAI가 구독 모델을 넘어 소비자 애플리케이션을 수익화하는 데 있어 매우 유용하게 작용할 수 있습니다.
2871 조회
0 추천
2025.10.04 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입