Loading...

AI 뉴스

OpenAI, AI 에이전트 개발 지원하는 AgentKit 공개

페이지 정보

작성자 xtalfi
작성일 10.07 04:44
49 조회
0 추천
0 비추천

본문

2a84d5bfa04be232984778dd6a5fddef3iaF.png

(퍼플렉시티가 정리한 기사)

OpenAI CEO 샘 알트먼은 샌프란시스코에서 열린 회사의 DevDay 2025 컨퍼런스에서 AI 에이전트를 구축하기 위한 종합 툴킷인 AgentKit을 공개하며, 빠르게 확장되는 자율 에이전트 시장에 본격적으로 진출할 것을 알렸다.

 

혁신적인 AgentKit 툴킷, 개발자 생태계 겨냥


AgentKit은 ChatGPT 이후 OpenAI가 선보인 가장 야심찬 개발자 대상 제품 출시에 해당하며, Altman이 “프로토타입에서 실제 제품까지 에이전트를 개발할 수 있도록 설계된 OpenAI 플랫폼의 완성된 빌딩 블록 세트”라고 설명한 바 있습니다. 이 툴킷은 단순한 프롬프트 응답을 넘어서 복잡한 작업을 수행할 수 있는 자율 AI 시스템에 대한 수요 증가에 대응하기 위해 개발되었습니다.


플랫폼은 네 가지 핵심 구성요소를 포함합니다: Agent Builder는 Altman이 “에이전트 제작을 위한 Canva”라고 비유한 시각적 드래그 앤 드롭 인터페이스이며, ChatKit은 맞춤형 애플리케이션에 삽입할 수 있는 채팅 인터페이스, Evals for Agents는 성능 측정 툴을 제공하며, OpenAI의 커넥터 레지스트리에 대한 접근을 통해 안전하게 서드파티 통합이 가능합니다.


툴킷의 접근성을 시연하기 위해, OpenAI 엔지니어 Christina Huang은 8분 이내에 무대에서 전체 AI 워크플로우와 두 명의 에이전트를 직접 구축해 보여주었습니다. Altman은 “우리가 처음 에이전트를 만들려고 했을 때 바랐던 모든 것들이 이 안에 있습니다”라고 설명하며, 에이전트 개발을 간소화하는 것에 대한 회사의 의지를 강조했습니다.

 

ChatGPT, 플랫폼 확장 속 주간 사용자 8억 명 돌파


앨트먼은 또한 ChatGPT의 주간 활성 이용자 수가 8억 명에 도달했으며, 이는 불과 두 달 전 7억 명에서 증가한 수치라고 발표했다. 이 이정표는 OpenAI가 동시에 Apps SDK를 출시해 개발자들이 ChatGPT 대화 내에서 직접 상호작용하는 애플리케이션을 만들 수 있도록 하면서 플랫폼의 폭발적인 성장을 강조한다.


새로운 앱 기능으로 사용자는 채팅 인터페이스를 벗어나지 않고도 Spotify , Figma, Coursera , Zillow , Canva 등의 서비스를 원활하게 이용할 수 있게 되었다. “우리는 ChatGPT가 사람들이 발전하고 더 생산적이고 창의적으로 될 수 있도록 돕는 훌륭한 방법이 되기를 바랍니다.”라고 앨트먼은 설명했다.

 

ChatGPT, 플랫폼 확장 속 주간 사용자 8억 명 돌파


앨트먼은 또한 ChatGPT의 주간 활성 이용자 수가 8억 명에 도달했으며, 이는 불과 두 달 전 7억 명에서 증가한 수치라고 발표했다. 이 이정표는 OpenAI가 동시에 Apps SDK를 출시해 개발자들이 ChatGPT 대화 내에서 직접 상호작용하는 애플리케이션을 만들 수 있도록 하면서 플랫폼의 폭발적인 성장을 강조한다.


새로운 앱 기능으로 사용자는 채팅 인터페이스를 벗어나지 않고도 Spotify , Figma, Coursera , Zillow , Canva 등의 서비스를 원활하게 이용할 수 있게 되었다. “우리는 ChatGPT가 사람들이 발전하고 더 생산적이고 창의적으로 될 수 있도록 돕는 훌륭한 방법이 되기를 바랍니다.”라고 앨트먼은 설명했다.

댓글 0
전체 373 / 7 페이지
(퍼플렉시티가 정리한 기사)옥스퍼드 대학교와 구글 클라우드의 천문학자들이 과학자들이 우주 현상을 탐지하는 방식을 혁신할 수 있는 돌파구를 마련했습니다. 이들은 인공지능이 초신성이나 소행성 이동과 같은 천문 현상을 최소한의 훈련 데이터만으로도 놀라울 만큼 정확하게 식별할 수 있음을 증명했습니다.오늘자 Nature Astronomy에 게재된 연구에 따르면, 구글의 Gemini AI는 단 15장의 예시 이미지만을 사용해 실제 우주 현상과 오신호를 약 93%의 정확도로 구별할 수 있었습니다. 이는 고급 천문학 도구를 광범위한 기계 학습 전문 지식 없이도 연구자들이 이용할 수 있게 하는 데 있어 중요한 진전을 의미합니다.천문학적 데이터 폭증에 대응하기현대의 망원경은 밤마다 하늘에서 일어날 수 있는 잠재적 변화에 대해 수백만 건의 경고를 생성하지만, 대다수는 위성 흔적, 우주선 충돌 또는 기기 이상에 의해 발생한 "가짜" 신호입니다. 차세대 기구가 도입되면 이 문제는 더욱 심각해집니다. 다가오는 베라 C. 루빈 천문대는 매 24시간마다 약 20테라바이트의 데이터를 생성하고, 밤마다 최대 1,000만 건의 경고를 보내게 됩니다."몇 개의 예시와 명확한 텍스트 지침만으로도 이러한 정확도가 나온다는 것은 놀라운 일입니다,"라고 옥스퍼드 대학교 물리학과의 공동 책임 저자인 피오렌조 스토파 박사는 말했습니다. "이는 다양한 분야의 과학자들이 신경망 훈련에 대한 깊은 전문지식 없이도 분류기를 자신만의 방식으로 개발할 수 있게 해줍니다. 필요한 것은 오직 하나를 만들고자 하는 의지뿐입니다."연구팀은 Gemini를 ATLAS, MeerLICHT, Pan-STARRS라는 세 가지 주요 천문학 조사에 걸쳐 테스트했습니다. 전통적인 '블랙 박스' 머신러닝 시스템이 단순히 '실제' 혹은 '가짜' 분류만을 제공하는 것과 달리, Gemini는 모든 결정에 대해 일반 영어로 설명을 생성하여 인공지능의 추론 과정을 투명하고 신뢰성 있게 만들었습니다.단순 분류를 넘어서이 접근 방식을 돋보이게 하는 점은 AI가 스스로 신뢰 수준을 평가할 수 있다는 것입니다. 팀이 젬니(Gemini)에게 자신의 분류를 검토하도록 했을 때, 모델의 신뢰도가 정확성의 강력한 지표라는 사실을 발견했습니다. 즉, 일관성이 낮은 결과는 훨씬 더 오류가 있을 가능성이 높았습니다. 이러한 자기 평가 기능은 신뢰할 수 있는 '인간-중재' 워크플로우를 구현하여, 확신이 없는 사례를 인간 검토를 위해 자동으로 표시할 수 있습니다.이 피드백 메커니즘을 사용해, 팀은 한 데이터셋에서 모델의 성능을 약 93.4%에서 96.7%로 향상시켰습니다. AI의 설명을 검토한 12명의 천문학자 패널은 이 설명들이 매우 일관성 있고 유용하다고 평가했습니다."천문학에 대한 공식적인 교육은 없지만 이 연구는 매우 흥미롭습니다."라고 Google Cloud의 공동 저자 투란 불무스는 말했습니다. "이것은 범용 LLM이 과학적 발견을 민주화할 수 있음을 보여줍니다. 호기심이 있다면 누구나 전통적인 배경이 없는 분야에도 의미 있는 기여를 할 수 있게 해줍니다."옥스포드 대학 물리학과의 스티븐 스마트 교수는 실질적인 영향에 대해 강조했습니다. "저는 10년 넘게 하늘 조사에서 생성되는 데이터를 신속하게 처리하는 문제에 관여해 왔는데, 실제 사건과 잘못된 신호를 구분하는 일이 항상 어려웠습니다. LLM이 최소한의 안내로 소스를 인식하는 정확도는 과제-특화된 훈련 없이도 놀라웠어요. 만약 우리가 이 기술을 대규모로 적용할 수 있다면, 분야에 엄청난 변화를 가져올 수 있을 것입니다".팀은 이 기술이 과학 분야에서 자율적인 '에이전틱 어시스턴트'의 기반이 될 것으로 보고 있습니다. 이러한 에이전트는 여러 가지 데이터 소스를 통합하고, 자신의 신뢰 수준을 점검하며, 로봇 망원경에 후속 관측을 자동으로 요청하고, 가장 유망한 발견만 인간 과학자에게 보고할 수 있습니다.
22 조회
0 추천
10.09 등록
(퍼플렉시티가 정리한 기사)구글 딥마인드(DeepMind)가 소프트웨어 취약점을 자동으로 감지하고 수정하는 인공지능 에이전트인 코드멘더(CodeMender)를 공개했습니다. 이는 기업들이 확대되는 공격 표면에 대응해야 하는 가운데, AI 기반 사이버보안 분야에서 중요한 진전을 의미합니다.10월 6일 발표된 코드멘더는 구글의 첨단 제미니 딥싱크(Gemini Deep Think) 모델을 활용하여 보안 결함을 자율적으로 식별하고, 근본 원인을 분석하며, 인간의 개입 없이 수정 방안을 생성합니다. 이 시스템은 이미 실제로도 성과를 보였으며, 내부 테스트 6개월 만에 450만 줄 이상의 코드를 포함하는 오픈소스 프로젝트에 72건의 보안 패치를 제출했습니다.대규모 자동화된 보안CodeMender는 반응적으로도, 그리고 선제적으로도 작동하여 새롭게 발견된 취약점을 즉시 패치하고, 기존 코드를 재작성하여 전체적인 보안 위험군을 제거합니다. 이 AI 에이전트는 정적 및 동적 분석, 퍼징, 차분 테스트, 심볼릭 리즈닝 등 포괄적인 분석 도구 세트를 활용하여 취약점의 근본 원인을 파악합니다.“고품질의 보안 패치를 자동으로 생성·적용함으로써, CodeMender의 AI 기반 에이전트는 개발자와 유지보수 담당자가 본연의 역할인 훌륭한 소프트웨어 구축에 집중할 수 있도록 돕습니다,”라고 Google DeepMind 연구원 Raluca Ada Popa와 Four Flynn은 말했습니다.이 시스템은 제안된 수정 사항이 회귀 문제나 기존 기능 손상을 유발하지 않도록, 사람의 리뷰 전 자동 검증 메커니즘이 내장되어 있습니다. 한 시연에서는, CodeMender가 2023년 제로 클릭 iOS 공격에 악용된 것과 동일한 libwebp 이미지 압축 라이브러리에 보안 어노테이션을 적용하여, 유사한 버퍼 오버플로 취약점을 영구적으로 예방할 가능성을 보였습니다.산업 환경 및 광범위한 이니셔티브이번 출시는 사이버 보안 전문가들이 AI가 생성한 코드가 사람이 작성한 코드보다 보안 취약성이 더 많다는 경고와 맞물려 이뤄졌습니다. 초기 연구에 따르면 AI 코딩 보조 도구를 사용하는 개발자는 80%의 경우 덜 안전한 코드를 작성하며, 본인의 코드가 안전하다고 믿을 가능성도 3.5배 더 높다고 합니다.구글은 동시에 AI 관련 보안 결함을 신고할 경우 최대 3만 달러의 보상을 제공하는 AI 취약점 보상 프로그램을 확대해 발표했으며, 자율 AI 에이전트 보안에 중점을 둔 Secure AI Framework 2.0 버전도 출시했습니다. 구글은 이전 AI 관련 취약점 보상 프로그램을 통해 43만 달러 이상을 지급한 바 있습니다.이 이니셔티브는 인공지능을 악의적으로 활용한 정교한 공격이 증가함에 따라, 구글이 AI를 방어적으로 활용하겠다는 더 넓은 전략을 반영합니다. 구글은 “AI를 활용해 보안과 안전을 강화하고, 이 기술이 방어자들에게 우위를 제공할 수 있도록 하겠다”고 밝혔습니다.
24 조회
0 추천
10.09 등록
(퍼플렉시티가 정리한 기사)Google의는 Gemini 2.5 Computer Use 모델을 출시했습니다. 이 모델은 웹사이트를 탐색하고 인간 사용자처럼 디지털 인터페이스와 상호작용할 수 있는 정교한 AI 시스템입니다. 2025년 10월 7일에 출시된 이 전문화된 모델은 AI 자동화 분야에서 중요한 진전을 이루었으며, 빠르게 발전하는 브라우저 에이전트 시장에서 경쟁사들과의 경쟁을 촉진하고 있습니다.Computer Use 모델은 시각적 이해와 추론 역량을 활용하여 AI 에이전트가 버튼 클릭, 텍스트 입력, 페이지 스크롤, 양식 작성 등 복잡한 웹 작업을 수행할 수 있습니다. 기존의 구조화된 API에 의존하는 전통적인 자동화와 달리, 이 시스템은 그래픽 사용자 인터페이스(GUI)에서 작동하기 때문에 레이아웃이 바뀌는 동적 웹사이트 및 애플리케이션도 처리할 수 있습니다.구글의 인공지능 에이전트 경쟁에 대한 전략적 대응구글의 이번 발표 시점은 오픈AI의 ChatGPT 에이전트 개발과 Anthropic이 지난해 선보인 컴퓨터 사용 기능 이후에 이뤄진 것으로, 이들 흐름을 기반으로 한다. 경쟁사들은 전체 데스크톱 제어 기능을 제공하는 반면, 구글의 모델은 브라우저 기반 상호작용에 초점을 두고 있으며, 웹 탐색, 텍스트 입력, 드래그 앤 드롭 기능을 포함해 총 13가지의 개별 작업을 지원한다.구글의 접근 방식은 여러 웹 및 모바일 벤치마크에서 선도적인 대안들을 능가하는 우수한 성능과 낮은 지연 시간을 보여준다. Online-Mind2Web 벤치마크에서 Gemini 2.5 Computer Use는 76.7%의 정확도를 기록해 Claude Sonnet(61.9%)와 OpenAI(44.3%)를 앞섰다. 또한, WebVoyager 테스트에서도 79.9%의 성능을 보여 경쟁사들의 69.5% 및 61.0% 대비 뛰어난 결과를 나타냈다.이 모델은 Project Mariner와 검색 내 AI 모드 등 구글의 기존 제품에 이미 적용되고 있다. 내부 테스트 결과 역시 유망하며, 구글 결제팀은 본 모델이 과거 해결까지 수일이 걸렸던 실패 테스트 케이스 중 60% 이상을 해결했다고 보고했다.시장 영향 및 개발자 접근Google AI Studio와 Vertex AI를 통해 제공되는 Computer Use 모델은 Gemini 2.5 Pro와 유사한 토큰 기반 요금제를 따르며, 20만 토큰 미만의 프롬프트에 대해 입력 토큰 100만 개당 $1.25의 비용이 부과됩니다. 표준 Gemini 모델의 무료 요금제와 달리, Computer Use는 처음부터 유료 이용이 필요합니다.이 출시는 2023년 37억 달러 규모였고 2025년에는 73억 8천만 달러에 이를 것으로 예상되는 AI 에이전트 시장에서 경쟁을 더욱 치열하게 만듭니다. Google은 검색, Android, YouTube, Workspace 등 전방위적 생태계 통합을 통해 순수 AI 제공업체 대비 전략적 이점을 확보하고 있으며, 2025년 상반기에만 Google Workspace에서 23억 건 이상의 문서 상호작용이 이루어졌습니다.Google은 액션별 안전성 검토와 개발자 제어 등 다중 보호막을 도입해 무단 행위를 방지하는 등 안전을 최우선으로 하고 있습니다. 이 모델은 구매와 같은 민감한 행동에 대해 사용자 확인을 요구하며, 보안 침해 방지를 위한 보호 조치도 포함하고 있습니다.
28 조회
0 추천
10.09 등록
(퍼플렉시티가 정리한 기사)구글는 월요일에 노코드 AI 미니앱 빌더 오팔(Opal)을 15개의 추가 국가로 확대하며, 사용자가 정교한 애플리케이션으로 회사의 기대를 뛰어넘은 미국에서의 성공적인 채택 이후 중요한 글로벌 롤아웃을 진행했습니다.이번 확장으로 오팔은 캐나다, 인도, 일본, 대한민국, 베트남, 인도네시아, 브라질, 싱가포르, 콜롬비아, 엘살바도르, 코스타리카, 파나마, 온두라스, 아르헨티나, 파키스탄에 제공됩니다. 7월에 구글 랩스의 일환으로 미국에서 출시된 이 도구는 코딩 전문 지식 없이 자연어 프롬프트만으로 기능성 웹 애플리케이션을 만들 수 있게 해줍니다.예상치 못한 사용자 숙련도가 확장을 이끈다"우리가 미국의 사용자들에게 Opal을 공개했을 때, 그들이 간단하고 재미있는 도구를 만들 것으로 예상했습니다."라고 Google Labs의 수석 제품 관리자 메간 리가 블로그 게시물에서 말했습니다. "하지만 대신에 우리가 받은 것은 정교하고 실용적이며 매우 창의적인 Opal 앱들의 급증이었습니다. 초기 사용자들의 창의성은 한 가지를 분명히 했습니다: 우리는 Opal을 전 세계 더 많은 창작자들의 손에 전달할 필요가 있습니다."이 플랫폼은 사용자 설명을 AI 모델, 프롬프트, 도구들을 연결하는 시각적 워크플로우로 변환하여 작동합니다. 사용자는 시각적 편집기를 통해 워크플로우를 맞춤화할 수 있으며, 개별 단계들을 클릭하여 프롬프트를 수정하거나 새로운 기능을 추가할 수 있습니다. 완성된 애플리케이션은 웹에 게시할 수 있고 링크를 통해 다른 사람들이 자신의 Google 계정으로 테스트하도록 공유할 수 있습니다.성능 향상 및 고급 디버깅지리적 확장과 함께, Google은 사용자 피드백을 반영한 중요한 기술적 개선사항을 도입했습니다. 회사는 코드 작성이 필요 없는 방식을 유지하면서도 고급 디버깅 기능을 구현하여, 사용자가 시각적 편집기에서 워크플로우를 단계별로 실행하거나 콘솔 패널에서 특정 단계를 반복적으로 수정할 수 있도록 했습니다. 오류는 이제 실패 지점에서 실시간으로 표시되어 즉각적인 맥락을 제공하고 추측을 없앴습니다.Google은 또한 Opal의 핵심 성능을 크게 향상시켜 앱 생성 시간을 5초 이상에서 훨씬 빠른 시작 시간으로 단축시켰습니다. 이 플랫폼은 이제 워크플로우 단계의 병렬 실행을 지원하여 복잡한 다단계 애플리케이션을 동시에 실행할 수 있게 하며 전체 대기 시간을 줄였습니다.이번 확장은 Google이 Canva, Figma, Replit과 같은 다른 노코드 플랫폼과 경쟁할 수 있게 하며, 비기술 사용자도 앱 프로토타입을 제작할 수 있도록 하는 도구 시장의 성장에 대응합니다. 이 출시와 함께 AI 산업 전반에서는 더 접근하기 쉬운 개발 도구가 계속 개발되고 있으며, Opal은 자연어 인터페이스를 활용해 소프트웨어를 생성하는 ‘바이브 코딩(vibe-coding)’ 트렌드에 Google이 진입했음을 나타냅니다.
27 조회
0 추천
10.09 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입