OpenAI, ChatGPT Agent 발표
페이지 정보
작성자
aIer
작성일
07.18 13:01
본문
OpenAI가 ChatGPT Agent를 발표했습니다.
기존 Deep Research와 Operator를 통합한 에이전트입니다.
알아서 모두 다 해줍니다. 예시인데 놀랍습니다.
"식당을 찾고 예약하는 작업을 시키면, 텍스트 브라우저로 후보를 찾은 다음, 비주얼 브라우저로 사진을 보고, 예약 가능 여부를 확인하고, 마지막으로 예약을 완료하는 식으로 진행할 수 있어요 [2]. 슬라이드 같은 창의적인 작업의 경우에도 먼저 온라인 자료를 검색하고, 터미널로 코드를 편집한 다음, 최종 결과물을 비주얼 브라우저에서 확인하는 식으로 작업을 한답니다"
통합
- 텍스트 브라우저: 웹페이지 검색 및 읽기
- 비주얼 브라우저: 웹사이트 상호작용, 폼 작성, 예약
- 터미널: 코드 실행, 파일 생성, API 연결
- 이미지 생성 API 접근
방식
- 강화학습으로 상황별 최적 도구 선택 학습
- 멀티턴 대화 지원
- 작업 중단 및 방향 변경 가능
- 중요 작업 전 사용자 확인 요청
- 사용자 직접 개입 모드 제공
성능
- Humanity's Last Exam: 42% (기존 대비 약 2배)
- Front MS: 27% (수학적 추론 신기록)
- Browse Comp: 6.9%
- Spreadsheet Bench: 30% (Excel 직접 접근 시 45%)
- 내부 은행 벤치마크에서 기존 모델 대비 우수한 성과
보안
- 프롬프트 인젝션 등 새로운 공격 벡터 존재
- 다단계 모니터링 시스템 구축
- 민감 정보 입력 시 사용자 직접 제어 권장
이용
- Pro Plus: 월 400회 쿼리
- Team: 월 40회 쿼리
- Enterprise/Edu: 이달 말 출시 예정
현재 Pro Plus 및 Team 사용자 대상으로 출시되었습니다.
댓글 0